在线视频区中文字幕,欧美成人一区二区

人妖在线一区,国产日韩欧美一区二区综合在线,国产啪精品视频网站免费,欧美内射深插日本少妇

公司動(dòng)態(tài)

產(chǎn)品資訊

行業(yè)資訊

browsercookie 知識(shí)鋪墊

第一個(gè)要了解的知識(shí)點(diǎn)是使用 browsercookie 獲取瀏覽器 cookie ，該庫(kù)使用命令 pip install browsercookie 安裝即可。

接下來(lái)獲取 firefox 瀏覽器的 cookie，不使用 chrome 谷歌瀏覽器的原因是在 80 版本之后，其 cookie 的加密方式進(jìn)行了修改，所以使用 browsercookie 模塊會(huì)出現(xiàn)如下錯(cuò)誤

win32crypt must be available to decrypt Chrome cookie on Windows

獲取 cookie 的代碼如下所示：

import browsercookie
firefox_cookiejar = browsercookie.firefox()
for c in firefox_cookiejar:
 print(c)

運(yùn)行代碼，輸出如下格式內(nèi)容。

獲取了 cookies 之后，就可以訪問(wèn)之后登錄后才能訪問(wèn)的頁(yè)面了（前提是在火狐瀏覽器登錄過(guò)一次）。

下面拿某管理中心舉例，在火狐瀏覽器登錄過(guò)之后，使用 browsercookie 獲取 cookie 之后，就可以直接訪問(wèn)后臺(tái)接口。

import browsercookie
import requests
firefox_cookiejar = browsercookie.firefox()
# for c in firefox_cookiejar:
#  print(c)
res = requests.get("https://img-home.csdnimg.cn/data_json/jsconfig/menu_path.json", cookies=firefox_cookiejar)
print(res.text)

可以直接獲取到后臺(tái)菜單。

使用 browsercookie 實(shí)現(xiàn) 自動(dòng)化點(diǎn)贊

在 scrapy 框架中，已經(jīng)內(nèi)置了一個(gè) CookiesMiddleware 用于處理 cookies，我們這次通過(guò)繼承 CookiesMiddleware ，然后使用 browsercookie 庫(kù)完成點(diǎn)贊器的研發(fā)（僅做了一個(gè)測(cè)試案例，沒有使用并發(fā)哦）

打開 middlewares.py 文件，編寫自定義的類：

from scrapy.downloadermiddlewares.cookies import CookiesMiddleware
import browsercookie
class BrowserCookiesDownloaderMiddleware(CookiesMiddleware):
 def __init__(self, debug=False):
  super().__init__(debug)
  self.load_browser_cookies()
 def load_browser_cookies(self):
  # 注意這個(gè)地方的名字叫做 firefox
  jar = self.jars['firefox']
  firefox_cookiejar = browsercookie.firefox()
  for cookie in firefox_cookiejar:
jar.set_cookie(cookie)

上述類的核心內(nèi)容是使用 browsercookie 對(duì)瀏覽器的 cookie 進(jìn)行提取，存儲(chǔ)到 CookieJar 類型的字典 jars 中，后續(xù)請(qǐng)求的時(shí)候，在進(jìn)行調(diào)用。

同步在 settings.py 文件中禁用默認(rèn)的 CookiesMiddleware，啟用咱們自定義的新類。

DOWNLOADER_MIDDLEWARES = {
 'scrapy.downloadermiddlewares.cookies.CookiesMiddleware': None,
 'csdn.middlewares.BrowserCookiesDownloaderMiddleware': 543,
}

在編寫爬蟲核心函數(shù)，重點(diǎn)修改 Request 請(qǐng)求為 POST 請(qǐng)求，并且攜帶相關(guān)參數(shù)，meta={'cookiejar':COOKIEJAR}。
代碼如下所示：

import scrapy
class ClikeSpider(scrapy.Spider):
 name = 'clike'
 allowed_domains = ['csdn.net']
 like_url = 'https://blog.csdn.net/phoenix/web/v1/article/like'
 def start_requests(self):
  data = {
"articleId": "120845464",
  }
  yield scrapy.FormRequest(url=self.like_url, formdata=data, meta={'cookiejar': 'firefox'})
 def parse(self, response):
  print(response.json())

運(yùn)行爬蟲之后，在日志中可以發(fā)現(xiàn)成功的點(diǎn)贊了。

以上就是python實(shí)戰(zhàn)scrapy操作cookie爬取博客涉及browsercookie的詳細(xì)內(nèi)容，更多關(guān)于scrapy操作cookie爬取博客的資料請(qǐng)關(guān)注本站其它相關(guān)文章！

版權(quán)聲明：本站文章來(lái)源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有，歡迎引用、轉(zhuǎn)載，請(qǐng)保持原文完整并注明來(lái)源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站，禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像，否則將依法追究法律責(zé)任。本站部分內(nèi)容來(lái)源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來(lái)，僅供學(xué)習(xí)參考，不代表本站立場(chǎng)，如有內(nèi)容涉嫌侵權(quán)，請(qǐng)聯(lián)系alex-e#qq.com處理。

排名優(yōu)化：網(wǎng)站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內(nèi)容優(yōu)化：關(guān)鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網(wǎng)站轉(zhuǎn)化率究竟是什么，有什么提升的技巧

一下吧：外貿(mào)站優(yōu)化有哪些基本的做法和注意事項(xiàng)

概要：競(jìng)價(jià)推廣費(fèi)用大概要多少呢，競(jìng)價(jià)推廣好不好

一下吧：SEO中site是什么意思，作用和應(yīng)用是怎樣的

郵箱：付費(fèi)郵箱有哪些優(yōu)勢(shì)，付費(fèi)郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢(shì)呢