Python爬取微信讀書實(shí)現(xiàn)讀書免費(fèi)自由
大家好,我是小五
前情提要
不知道用微信讀書的朋友多不多,這里順便安利一下哈。
我目前看電子書的話基本都是在用微信讀書,畢竟白嫖的無限卡真香。
在微信讀書上,不僅很多正版的Python書籍電子書可以直接看,還可以在閱讀的同時(shí)看別人寫的標(biāo)注。
但是無限卡對于小說不太友好,只能閱讀開頭的章節(jié),后面的章節(jié)就需要變相付費(fèi)了。
雖然知道番茄小說,七貓小說這種都能免費(fèi)看,但是實(shí)在不愿意為了一部小說再多下一個(gè)軟件。
幸虧微信讀書出了一個(gè)功能——可以自己上傳書籍,支持支持txt、pdf、epub格式。
這就給了我一個(gè)想法,只需要將小說下載到本地,再導(dǎo)入到微信讀書不就成了。
下載小說方法賊簡單,用Python也行,搜搜專門打包好的下載器也成。不過我記得兩年前剛學(xué)Python時(shí)自己練習(xí)寫過筆趣閣的爬蟲,這就翻出來用用。
爬取小說
原來代碼是找到了,但是很尷尬,我爬取的那個(gè)網(wǎng)站404了。
不過目前筆趣閣遍地都是,也分不清到底誰是“正版”的?
還有個(gè)比較好的消息,很多家連網(wǎng)頁模板都是一模一樣,你的爬蟲改改地址就能接著用了,這是妙啊。
于是乎,我又隨便找了一家“筆趣閣”。
今天我們就以我吃西紅柿近期完結(jié)的滄元圖
為例,可以看到在這個(gè)筆趣閣網(wǎng)站里,小說滄元圖的網(wǎng)址url是
https://*********/html/2292/
同時(shí),《滄元圖》所有的章節(jié)也都羅列在本頁面。
我覺得先爬取所有的章節(jié)名和對應(yīng)的url網(wǎng)址,分別保存到列表中。然后再使用requests爬取,并依次寫入txt文檔中。
網(wǎng)頁結(jié)構(gòu)并不復(fù)雜,也沒有反爬措施。大概20行代碼即可下載
for i, j in zip(urls, names): res_text = requests.get(url, headers=header).text zj_html = etree.HTML(res_text) texts = zj_html.xpath('//*[@id="content"]/text()') texts2 = zj_html.xpath('//*[@id="content"]/*/text()') text = '\n'.join(texts).strip()+'\n'.join(texts2).strip() with open('novels_n.txt', 'a', encoding='utf8') as f: f.write(f'{j} \n {text} \n') print(f'{novels_n}/{j},正在下載...')
這樣我們就爬取了小說《滄元圖》,并將它保存成txt文檔。
通過\n
使得章節(jié)名都與正文分割開。
白嫖小說
下面的步驟就更簡單了,只需要在微信讀書的網(wǎng)頁版中,點(diǎn)擊【傳書到手機(jī)】,上傳剛剛爬取生成的《滄元圖》。
導(dǎo)入成功。
單擊【立即閱讀】,享受一下勞動(dòng)成果。
整體段落和文字都沒什么問題。
再看一下章節(jié)目錄,也是按照正常的目錄進(jìn)行排版的。
非常完美!
小結(jié)
以上,就是我使用Python爬取小說,再導(dǎo)入微信讀書,成功白嫖小說閱讀的全部步驟了。
這個(gè)方法已經(jīng)用了幾個(gè)月,白嫖了好幾本小說。
趕緊把小技巧分享給大家,快上車吧!
老鐵們,如果想看更多Python改變生活的真實(shí)問題案例,來給本文右下角點(diǎn)個(gè)贊吧
如果你也有一直想去解決的重復(fù)性問題,歡迎在評論區(qū)告訴我,大家一起探討一下。
以上就是Python爬取微信讀書實(shí)現(xiàn)讀書免費(fèi)自由的詳細(xì)內(nèi)容,更多關(guān)于Python爬取微信讀書的資料請關(guān)注本站其它相關(guān)文章!
版權(quán)聲明:本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。