最新日韩国产亚洲欧美中国v,亚洲自慰白浆一区二区三区,欧美性爱性爱视频

人妖在线一区,国产日韩欧美一区二区综合在线,国产啪精品视频网站免费,欧美内射深插日本少妇

公司動(dòng)態(tài)

產(chǎn)品資訊

行業(yè)資訊

輕云服務(wù)器升級(jí)CN2線路有什么優(yōu)點(diǎn)

簡(jiǎn)介

快樂(lè)在滿足中求，煩惱多從欲中來(lái)

記錄程序的點(diǎn)點(diǎn)滴滴。
輸入一個(gè)網(wǎng)址從這個(gè)網(wǎng)址中解析出圖片，并將它保存在本地

流程圖

程序分析

解析主網(wǎng)址

def get_urls():
 url = 'http://www.nipic.com/show/35350678.html' # 主網(wǎng)址
 pattern = "(http.*?jpg)"
 header = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36'
 }
 r = requests.get(url,headers=header)
 r.encoding = r.apparent_encoding
 html = r.text
 urls = re.findall(pattern,html)
 return urls

url 為需要爬的主網(wǎng)址
pattern 為正則匹配
header 設(shè)置請(qǐng)求頭
r = requests.get(url,headers=header) 發(fā)送請(qǐng)求
r.encoding = r.apparent_encoding 設(shè)置編碼格式，防止出現(xiàn)亂碼

屬性	說(shuō)明
r.encoding	從http header中提取響應(yīng)內(nèi)容編碼
r.apparent_encoding	從內(nèi)容中分析出的響應(yīng)內(nèi)容編碼

urls = re.findall(pattern,html) 進(jìn)行正則匹配
re.findall(pattern, string, flags=0)
正則 re.findall 的簡(jiǎn)單用法（返回string中所有與pattern相匹配的全部字串，返回形式為數(shù)組）

下載圖片并存儲(chǔ)

def download(url_queue: queue.Queue()):
 while True:
  url = url_queue.get()
  root_path = 'F:\\1\\' # 圖片存放的文件夾位置
  file_path = root_path + url.split('/')[-1] #圖片存放的具體位置
  try:
if not os.path.exists(root_path): # 判斷文件夾是是否存在，不存在則創(chuàng)建一個(gè)
 os.makedirs(root_path)
if not os.path.exists(file_path): # 判斷文件是否已存在
 r = requests.get(url)
 with open(file_path,'wb') as f:
  f.write(r.content)
  f.close()
  print('圖片保存成功')
else:
 print('圖片已經(jīng)存在')
  except Exception as e:
print(e)
  print('線程名: ', threading.current_thread().name,"url_queue.size=", url_queue.qsize())

此函數(shù)需要傳一個(gè)參數(shù)為隊(duì)列
queue模塊中提供了同步的、線程安全的隊(duì)列類,queue.Queue()為一種先入先出的數(shù)據(jù)類型，隊(duì)列實(shí)現(xiàn)了鎖原語(yǔ)，能夠在多線程中直接使用?？梢允褂藐?duì)列來(lái)實(shí)現(xiàn)線程間的同步。
url_queue: queue.Queue() 這是一個(gè)隊(duì)列類型的數(shù)據(jù),是用來(lái)存儲(chǔ)圖片URL
url = url_queue.get() 從隊(duì)列中取出一個(gè)url
url_queue.qsize() 返回隊(duì)形內(nèi)元素個(gè)數(shù)

全部代碼

import requests
import re
import os
import threading
import queue
def get_urls():
 url = 'http://www.nipic.com/show/35350678.html' # 主網(wǎng)址
 pattern = "(http.*?jpg)"
 header = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.182 Safari/537.36'
 }
 r = requests.get(url,headers=header)
 r.encoding = r.apparent_encoding
 html = r.text
 urls = re.findall(pattern,html)
 return urls
def download(url_queue: queue.Queue()):
 while True:
  url = url_queue.get()
  root_path = 'F:\\1\\' # 圖片存放的文件夾位置
  file_path = root_path + url.split('/')[-1] #圖片存放的具體位置
  try:
if not os.path.exists(root_path):
 os.makedirs(root_path)
if not os.path.exists(file_path):
 r = requests.get(url)
 with open(file_path,'wb') as f:
  f.write(r.content)
  f.close()
  print('圖片保存成功')
else:
 print('圖片已經(jīng)存在')
  except Exception as e:
print(e)
  print('線程名:', threading.current_thread().name,"圖片剩余：", url_queue.qsize())
if __name__ == "__main__":
	url_queue = queue.Queue()
	urls = tuple(get_urls())
	for i in urls:
	 url_queue.put(i)
	t1 = threading.Thread(target=download,args=(url_queue,),name="craw{}".format('1'))
	t2 = threading.Thread(target=download,args=(url_queue,),name="craw{}".format('2'))
	
	t1.start()
	t2.start()

到此這篇關(guān)于Python 爬取網(wǎng)頁(yè)圖片詳解流程的文章就介紹到這了,更多相關(guān)Python 爬取網(wǎng)頁(yè)圖片內(nèi)容請(qǐng)搜索本站以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持本站！

版權(quán)聲明：本站文章來(lái)源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有，歡迎引用、轉(zhuǎn)載，請(qǐng)保持原文完整并注明來(lái)源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站，禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像，否則將依法追究法律責(zé)任。本站部分內(nèi)容來(lái)源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來(lái)，僅供學(xué)習(xí)參考，不代表本站立場(chǎng)，如有內(nèi)容涉嫌侵權(quán)，請(qǐng)聯(lián)系alex-e#qq.com處理。

排名優(yōu)化：網(wǎng)站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內(nèi)容優(yōu)化：關(guān)鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網(wǎng)站轉(zhuǎn)化率究竟是什么，有什么提升的技巧

一下吧：外貿(mào)站優(yōu)化有哪些基本的做法和注意事項(xiàng)

概要：競(jìng)價(jià)推廣費(fèi)用大概要多少呢，競(jìng)價(jià)推廣好不好

一下吧：SEO中site是什么意思，作用和應(yīng)用是怎樣的

郵箱：付費(fèi)郵箱有哪些優(yōu)勢(shì)，付費(fèi)郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢(shì)呢