97视频在线观看视频,9999精品视频,色婷亚洲五月HD免费在线观

人妖在线一区,国产日韩欧美一区二区综合在线,国产啪精品视频网站免费,欧美内射深插日本少妇

公司動態(tài)

產(chǎn)品資訊

行業(yè)資訊

輕云服務器升級CN2線路有什么優(yōu)點

一、常見的匹配規(guī)則

二、常見的匹配方法

1、match（）

match（）方法從字符串的起始位置開始匹配，該方法有兩個參數(shù)，第一個是正則表達式，第二個是需要匹配的字符串；

re.match(正則表達式，字符串)

如果該方法匹配成功，返回的是SRE_Match對象，如果未匹配到，則返回None。

返回成功后有兩個方法，group（）方法用來查看匹配到的字符串，span（）方法用來輸出匹配的范圍。

import re
content = 'Hello_World,123 456'
result = re.match('^Hello\w{6}\W\d\d\d\s\d{3}',content)
print(result)
print(result.group())
print(result.span())

【運行結果】

<re.Match object; span=(0, 19), match='Hello_World,123 456'>
Hello_World,123 456
(0, 19)

子字符串匹配

在上述我們匹配到了完整的字符串，但是實際需求中可能只需要其中的一部分，這時我們僅需要在要獲取的子字符串匹配時加上括號即可。

import re
content = 'Hello_World,123 456'
result = re.match('^Hello\w{6}\W(\d+)\s(\d{3})',content)
print(result)
print(result.group())
print(result.span())
print(result.group(1))
print(result.group(2))

【運行結果】

<re.Match object; span=(0, 19), match='Hello_World,123 456'>
Hello_World,123 456
(0, 19)
123
456

這樣通過加括號的形式，將字符串中的數(shù)字匹配出來。

通用匹配符

.* 其中.用來匹配任意字符（除換行符），*代表前面出現(xiàn)的字符無限次。因此之前的匹配形式可以寫為：

import re
content = 'Hello_World,123 456'
result = re.match('^Hello\.*456$',content)
print(result.group())

【運行結果】

Hello_World,123 456

貪婪匹配和非貪婪匹配

.*匹配是貪婪匹配

.*?是非貪婪匹配

二者的主要區(qū)別是，貪婪匹配盡可能多的去匹配字符，而非貪婪匹配是盡可能少的匹配字符。下列代碼能夠更直觀的了解二者之間的區(qū)別

import re
content = 'number 12345678 test'
result_1 = re.match('^number.*(\d+).*test$',content)
print('貪婪匹配得到的數(shù)字：' + result_1.group(1))
result_2 = re.match('^number.*?(\d+).*test$',content)
print('非貪婪匹配得到的數(shù)字：' + result_2.group(1))

【運行結果】

貪婪匹配得到的數(shù)字：8
非貪婪匹配得到的數(shù)字：12345678

大家會有這樣一個疑問為什么貪婪匹配得到的數(shù)字少，而非貪婪匹配得到的多，這與前面講的不太符合啊。

注意，在匹配的時候，貪婪匹配是盡可能多的去匹配字符，因此.*就匹配的是' 1234567‘，只留下8給\d+匹配，非貪婪匹配是盡可能少的匹配字符，故.*?匹配的是' '，留下12345678給\d+匹配，就會得到上述結果。

修飾符

修飾符	作用
re.I	忽略大小寫進行匹配
re.L	做本地化識別匹配
re.M	多行匹配，影響^和$
re.S	使.匹配包含換行符在內(nèi)的所有字符
re.U	根據(jù)Unicode字符集解析字符
re.X	更加靈活的編寫正則表達式

轉(zhuǎn)義匹配

匹配特殊字符時，在其前面加反斜線（\）完成轉(zhuǎn)義匹配。

2、search（）

在匹配時會掃描整個字符串，然后返回第一個成功匹配的結果。如果將整個字符串搜索完了之后還是沒有匹配到，則返回None。

3、findall（）

與search（）不同的是，findall（）方法是將返回所有符合正則表達式匹配的內(nèi)容。返回結果是一個列表，列表中的每個元素都是元組類型。

4、sub（）

修改文本內(nèi)容，原理是對要修改的內(nèi)容進行替換。

import re
temp = "abcdef123ghi456"
temp = re.sub("\d+","",temp)
print(temp)

【運行結果】

abcdefghi

sub（）中的參數(shù)分析，第一個參數(shù)是正則表達式匹配要更改的內(nèi)容，第二個參數(shù)是使用該參數(shù)內(nèi)容進行替換，第三個參數(shù)是要更改的字符串。

5、compile（）

將正則字符串編譯成正則表達式對象，以便在后面的匹配中進行復用。

到此這篇關于python網(wǎng)絡爬蟲精解之正則表達式的使用說明的文章就介紹到這了,更多相關python 正則表達式內(nèi)容請搜索本站以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持本站！

版權聲明：本站文章來源標注為YINGSOO的內(nèi)容版權均為本站所有，歡迎引用、轉(zhuǎn)載，請保持原文完整并注明來源及原文鏈接。禁止復制或仿造本網(wǎng)站，禁止在非www.sddonglingsh.com所屬的服務器上建立鏡像，否則將依法追究法律責任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來，僅供學習參考，不代表本站立場，如有內(nèi)容涉嫌侵權，請聯(lián)系alex-e#qq.com處理。

動態(tài)撥號：關鍵詞排名下降是啥緣故，快速提高排名怎樣做

排名優(yōu)化：網(wǎng)站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內(nèi)容優(yōu)化：關鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網(wǎng)站轉(zhuǎn)化率究竟是什么，有什么提升的技巧

一下吧：外貿(mào)站優(yōu)化有哪些基本的做法和注意事項

概要：競價推廣費用大概要多少呢，競價推廣好不好

一下吧：SEO中site是什么意思，作用和應用是怎樣的

郵箱：付費郵箱有哪些優(yōu)勢，付費郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢呢