日韩电影国产在线资源,精品无线一线二线三线

人妖在线一区,国产日韩欧美一区二区综合在线,国产啪精品视频网站免费,欧美内射深插日本少妇

公司動(dòng)態(tài)

產(chǎn)品資訊

行業(yè)資訊

輕云服務(wù)器升級(jí)CN2線路有什么優(yōu)點(diǎn)

一、pyquery的介紹

使用pyquery需要在Web和了解jQuery的基礎(chǔ)上，使用該CSS選擇器。

二、pyquery的使用

1、初始化工作

使用pyquery初始化的方式有很多，傳入的參數(shù)可以是字符串，也可以是URL和文件名，下面將一一介紹初始化方法。

字符串

html = '''
<html>
<head>
  <meta charset="utf-8">
  <title>test02.html</title>
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
</head>
<body>
  <div id="container">
 <iframe id="iframe" sandbox="allow-scripts" src="/files/%E7%88%AC%E8%99%AB%E5%86%99%E4%BD%9C%E4%BB%A3%E7%A0%81%E6%B5%8B%E8%AF%95/test02.html"></iframe>
  </div>
</body>
</html>
'''
from pyquery import PyQuery as pq
doc = pq(html)
print(doc('title'))

【運(yùn)行結(jié)果】

<title>test02.html</title>

URL

URL以CSDN首頁地址為例：

from pyquery import PyQuery as pq
doc = pq(url = 'https://www.csdn.net/')
print(doc('title'))

【運(yùn)行結(jié)果】

<title>CSDN - 專業(yè)開發(fā)者社區(qū)</title>

文件初始化

我們將以下字符串保存為一個(gè)HTML文件，通過文件的形式進(jìn)行初始化。

【test02.html】

<bookstore>
  <book>
 <title lang="eng">Harry Potter</title>
 <price>29.99</price>
  </book>
  <book>
 <title lang="eng">Learning XML</title>
 <price>39.95</price>
  </book>
</bookstore>

from pyquery import PyQuery as pq
doc = pq(filename = 'test02.html')
print(doc('title'))

【運(yùn)行結(jié)果】

<title lang="eng">Harry Potter</title>
<title lang="eng">Learning XML</title>

2、查找節(jié)點(diǎn)

（1）查找子節(jié)點(diǎn)

查找子節(jié)點(diǎn)時(shí)需要用到find（）方法，此時(shí)傳入的參數(shù)是CSS選擇器。

from pyquery import PyQuery as pq
doc = pq(filename = 'test02.html')
item = doc('book')
print(item)
lis1 = item.find('title')
lis2 = item.find('price')
print(lis1)
print(lis2)

【運(yùn)行結(jié)果】

<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book>

<book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>

<title lang="eng">Harry Potter</title>
<title lang="eng">Learning XML</title>

<price>29.99</price>
<price>39.95</price>
可以看到，我們首先匹配的是book節(jié)點(diǎn)，然后匹配book節(jié)點(diǎn)下的子節(jié)點(diǎn)title和price。

其實(shí)使用find方法匹配的是所有的子孫節(jié)點(diǎn)，如果只是單純匹配子節(jié)點(diǎn)可以使用children方法。

（2）匹配父節(jié)點(diǎn)

使用parent（）方法，如果是要匹配祖先節(jié)點(diǎn)，則需要使用parents（）方法。

（3）匹配兄弟節(jié)點(diǎn)

可以使用siblings（）方法。

3、遍歷

對(duì)于獲取到的內(nèi)容如果是單個(gè)節(jié)點(diǎn)，則可以直接轉(zhuǎn)換為字符串類型，而對(duì)于獲取到多個(gè)節(jié)點(diǎn)，因其類型為PyQuery類型，需要對(duì)獲取到的數(shù)據(jù)進(jìn)行遍歷，這是需要調(diào)用items（）方法。

from pyquery import PyQuery as pq
doc = pq(filename = 'test02.html')
items = doc('title').items()
print(items)
print(type(items))
for i in items:
 print(type(i))
 print(i)

【運(yùn)行結(jié)果】

<generator object PyQuery.items at 0x000002B79E13EF48>
<class 'generator'>
<class 'pyquery.pyquery.PyQuery'>
<title lang="eng">Harry Potter</title>

<class 'pyquery.pyquery.PyQuery'>
<title lang="eng">Learning XML</title>

4、獲取信息

（1）獲取屬性

使用attr()方法

from pyquery import PyQuery as pq
doc = pq(filename = 'test02.html')
items = doc('title')
for i in items.items():
 print(i.attr('lang'))

【運(yùn)行結(jié)果】

eng
eng

遍歷獲取到的數(shù)據(jù)，就能獲得所有title節(jié)點(diǎn)的land屬性值。

（2）獲取文本

使用text()方法

from pyquery import PyQuery as pq
doc = pq(filename = 'test02.html')
items = doc('title')
for i in items.items():
 print(i.text())

【運(yùn)行結(jié)果】

Harry Potter
Learning XML

同樣是遍歷，獲取到每一個(gè)title節(jié)點(diǎn)的文本值。

5、節(jié)點(diǎn)操作

（1）為某個(gè)節(jié)點(diǎn)添加或刪除一個(gè)class

調(diào)用的方法為addClass和removeClass

from pyquery import PyQuery as pq
doc = pq(filename = 'test02.html')
items = doc('title')
for i in items.items():
 print(i)
 i.addClass('book01')
 print(i)
 i.removeClass('book01')
 print(i)

【運(yùn)行結(jié)果】

<title lang="eng">Harry Potter</title>

<title lang="eng" class="book01">Harry Potter</title>

<title lang="eng" class="">Harry Potter</title>

<title lang="eng">Learning XML</title>

<title lang="eng" class="book01">Learning XML</title>

<title lang="eng" class="">Learning XML</title>

可以看到，首先是打印最初始的title節(jié)點(diǎn)，加上class屬性后再次打印，去掉class屬性后再次打印。

（2）attr、text、html

attr：用來改變屬性值；

text：用來改變文本值；

html：用來改變節(jié)點(diǎn)值；

（3）remove

移除不需要的節(jié)點(diǎn)值，將整個(gè)節(jié)點(diǎn)移除。

6、偽類選擇器

支持多種偽類選擇器，例如選擇第一個(gè)節(jié)點(diǎn)、最后一個(gè)節(jié)點(diǎn)、奇數(shù)節(jié)點(diǎn)、偶數(shù)節(jié)點(diǎn)、以及包含指定文本的節(jié)點(diǎn)等。

到此這篇關(guān)于python網(wǎng)絡(luò)爬蟲精解之pyquery的使用說明的文章就介紹到這了,更多相關(guān)python pyquery 內(nèi)容請(qǐng)搜索本站以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持本站！

版權(quán)聲明：本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有，歡迎引用、轉(zhuǎn)載，請(qǐng)保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站，禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像，否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來，僅供學(xué)習(xí)參考，不代表本站立場(chǎng)，如有內(nèi)容涉嫌侵權(quán)，請(qǐng)聯(lián)系alex-e#qq.com處理。

排名優(yōu)化：網(wǎng)站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內(nèi)容優(yōu)化：關(guān)鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網(wǎng)站轉(zhuǎn)化率究竟是什么，有什么提升的技巧

一下吧：外貿(mào)站優(yōu)化有哪些基本的做法和注意事項(xiàng)

概要：競(jìng)價(jià)推廣費(fèi)用大概要多少呢，競(jìng)價(jià)推廣好不好

一下吧：SEO中site是什么意思，作用和應(yīng)用是怎樣的

郵箱：付費(fèi)郵箱有哪些優(yōu)勢(shì)，付費(fèi)郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢(shì)呢

服務(wù)器配置數(shù)據(jù)庫配置服務(wù)器運(yùn)維服務(wù)器安全
互聯(lián)網(wǎng)資訊服務(wù)器公司 IDC數(shù)據(jù)中心
免費(fèi)服務(wù)器香港服務(wù)器租用美國(guó)服務(wù)器租用

python進(jìn)階從青銅到王者一定會(huì)用上的Python技巧

實(shí)時(shí)開通

自選配置、實(shí)時(shí)開通

免備案

全球線路精選！

全天候客戶服務(wù)

7x24全年不間斷在線

專屬顧問服務(wù)

1對(duì)1客戶咨詢顧問

人妖在线一区,国产日韩欧美一区二区综合在线,国产啪精品视频网站免费,欧美内射深插日本少妇

公司動(dòng)態(tài)

產(chǎn)品資訊

行業(yè)資訊

python網(wǎng)絡(luò)爬蟲精解之pyquery的使用說明

目錄

一、pyquery的介紹

二、pyquery的使用

1、初始化工作

字符串

URL

文件初始化

2、查找節(jié)點(diǎn)

（1）查找子節(jié)點(diǎn)

（2）匹配父節(jié)點(diǎn)

（3）匹配兄弟節(jié)點(diǎn)

3、遍歷

4、獲取信息

（1）獲取屬性

（2）獲取文本

5、節(jié)點(diǎn)操作

（1）為某個(gè)節(jié)點(diǎn)添加或刪除一個(gè)class

（2）attr、text、html

（3）remove

6、偽類選擇器

python進(jìn)階從青銅到王者一定會(huì)用上的Python技巧

Python編程利用Numpy和PIL庫將圖片轉(zhuǎn)化為手繪

實(shí)時(shí)開通

免備案

全天候客戶服務(wù)

專屬顧問服務(wù)

人妖在线一区,国产日韩欧美一区二区综合在线,国产啪精品视频网站免费,欧美内射深插日本少妇

公司動(dòng)態(tài)

產(chǎn)品資訊

行業(yè)資訊

python網(wǎng)絡(luò)爬蟲精解之pyquery的使用說明

目錄

一、pyquery的介紹

二、pyquery的使用

1、初始化工作

字符串

URL

文件初始化

2、查找節(jié)點(diǎn)

（1）查找子節(jié)點(diǎn)

（2）匹配父節(jié)點(diǎn)

（3）匹配兄弟節(jié)點(diǎn)

3、遍歷

4、獲取信息

（1）獲取屬性

（2）獲取文本

5、節(jié)點(diǎn)操作

（1）為某個(gè)節(jié)點(diǎn)添加或刪除一個(gè)class

（2）attr、text、html

（3）remove

6、偽類選擇器

python進(jìn)階從青銅到王者一定會(huì)用上的Python技巧

Python編程利用Numpy和PIL庫將圖片轉(zhuǎn)化為手繪

實(shí)時(shí)開通

免備案

全天候客戶服務(wù)

專屬顧問服務(wù)

一、pyquery的介紹

二、pyquery的使用

1、初始化工作

2、查找節(jié)點(diǎn)

3、遍歷

5、節(jié)點(diǎn)操作

（2）attr、text、html

6、偽類選擇器