女人一级毛片免费看,国产欧美日韩在线人成aaaa,内射白浆一区二区在线观看

有時(shí)候字符串匹配解決不了問題，這個(gè)時(shí)候就需要正則表達(dá)式來處理。因?yàn)槊恳淮纹ヅ洌ū热缯乙允裁撮_頭的，以什么結(jié)尾的字符串要寫好多個(gè)函數(shù)）都要單獨(dú)完成，我們可以給它制定一個(gè)規(guī)則。

主要應(yīng)用：爬蟲的時(shí)候需要爬取各種信息，使用正則表達(dá)式可以很方便的處理需要的數(shù)據(jù)。

1. 正則表達(dá)式的基本概念

使用單個(gè)字符串來描述匹配一系列符合某個(gè)語(yǔ)法規(guī)則的字符串。
是對(duì)字符串操作的一種邏輯公式。
應(yīng)用場(chǎng)景：處理文本和數(shù)據(jù)。
正則表達(dá)式過程：依次拿出表達(dá)式和文本中的字符比較，如果每一個(gè)字符都能匹配，則匹配成功，否則失敗。

2. python的正則表達(dá)式re模塊

import re

匹配過程：r'imooc'是原字符串，先生成Pattern對(duì)象，從頭開始找，得到一個(gè)Match（或Search等）實(shí)例，最后有一個(gè)匹配結(jié)果。

# 用find和startswith找字符串
str1 = 'imooc python'
print(str1.find('11'))
-1
print(str1.find('imooc'))
0
print(str1.startswith('imooc'))
True

使用正則表達(dá)式：

import re
pa = re.compile(r'imooc')#  compile生成一個(gè)pattern對(duì)象，r'imooc'讀原字符串，否則需要轉(zhuǎn)義
ma = pa.match(str1)  # 匹配不到返回為None，返回一個(gè)對(duì)象
print(ma)
<re.Match object; span=(0, 5), match='imooc'>
print(ma.group())  # 返回一個(gè)字符串或字符串組成的元組ma.groups()
imooc
print(ma.span())  # 返回所在字符串的位置
print(ma.string)  # 返回原字符串
print(ma.re)  # 返回實(shí)例
(0, 5)
imooc python
re.compile('imooc')

# 匹配大小寫，后面加上大寫
pa = re.compile(r'imooc', re.I)
print(pa)
re.compile('imooc', re.IGNORECASE)
ma = pa.match('imooc python')
print(ma.group())
imooc
ma = pa.match('Imooc python')
print(ma.group())
Imooc

# 如果只有一個(gè)，可以直接生成一個(gè)match對(duì)象，也可以達(dá)到同樣的效果
ma = re.match(r'imooc', str1)
print(ma)
print(ma.group())
<re.Match object; span=(0, 5), match='imooc'>
imooc

3. 正則表達(dá)式語(yǔ)法

基本語(yǔ)法：適用于多種語(yǔ)言。

（1）匹配單個(gè)字符

1）'.' 的匹配，可以匹配除了\n外所有字符

ma = re.match(r'a', 'a')
print(ma.group())
ma = re.match(r'a', 'b')
print(type(ma))  # 再調(diào)ma.group()則報(bào)錯(cuò)
a
<class 'NoneType'>
# 用.匹配字符
ma = re.match(r'.', 'b')
print(ma.group())
ma = re.match(r'.', '0')
print(ma.group())
b
0
# 匹配{}中的字符
ma = re.match(r'{.}', '{0}')
print(ma.group())
ma = re.match(r'{..}', '{01}')
print(ma.group())
{0}
{01}

2）[…]匹配字符集

# []匹配字符集
ma = re.match(r'{[abc]}', '{a}')
print(ma.group())
ma = re.match(r'{[abc]]}', 'd5lp7f5')  # 匹配不到，則報(bào)錯(cuò)
print(ma.group())
ma = re.match(r'{[a-z]]}', '1dhlj77')
print(ma.group()) # 匹配a-z中任意一個(gè)字符
{a}
pntxvt7
ma = re.match(r'{[a-zA-Z]}', '{A}')
print(ma.group())
{A}
ma = re.match(r'{[a-zA-Z0-9]}', '{0}')
print(ma.group())
{0}

3） \w 匹配a-zA-Z0-9， \W匹配非單詞字符

ma = re.match(r'{[\w]}', '{A}')
print(ma.group())
ma = re.match(r'{[\w]}', '{ }')
print(ma.group())  # 匹配不到
ma = re.match(r'{[\W]}', '{ }')
print(ma.group())
{A}
{ }

4）字符集[]匹配

ma = re.match(r'[[\w]]', '[a]')
print(ma.group())  # 匹配不到
# 匹配[]需要加轉(zhuǎn)義\
ma = re.match(r'\[[\w]\]', '[a]')
print(ma.group())
[a]

（2）匹配多個(gè)字符

1） *匹配

ma = re.match(r'[A-Z][a-z]', 'Aa')
print(ma.group())
ma = re.match(r'[A-Z][a-z]', 'A')
print(ma.group()) # 匹配不到
ma = re.match(r'[A-Z][a-z]*', 'Aa')
print(ma.group())
ma = re.match(r'[A-Z][a-z]*', 'Aagfagsagaha')
print(ma.group())
ma = re.match(r'[A-Z][a-z]*', 'Aa123')
print(ma.group())
Aa
A
Aagfagsagaha
Aa

2）+匹配

# 匹配下劃線或字符開頭的無限次
ma = re.match(r'[_a-zA-Z]+[_\w]*', '10')
print(ma.group())# 匹配不到
ma = re.match(r'[_a-zA-Z]+[_\w]*', '_hte10')
print(ma.group())
_hte10

3）？匹配

# 匹配0-99，01則不對(duì)
 ma = re.match(r'[1-9]?[0-9]', '90')
print(ma.group())
ma = re.match(r'[1-9]?[0-9]', '9')
print(ma.group())
ma = re.match(r'[1-9]?[0-9]', '09')
print(ma.group())  # 只匹配到0
90
9
0

4）{m} / {mn}匹配

# 匹配郵箱，匹配6次
ma = re.match(r'[a-zA-Z0-9]{6}', 'abc123')
print(ma.group())
abc123
ma = re.match(r'[a-zA-Z0-9]{6}', 'abc12')
print(ma.group()) # 少一個(gè)則匹配不到
ma = re.match(r'[a-zA-Z0-9]{6}', 'abc1234')
print(ma.group()) # 多則匹配前6個(gè)
abc123
ma = re.match(r'[a-zA-Z0-9]{6}@163.com', 'abc123@163.com')
print(ma.group())
abc123@163.com
# 匹配6-10位的郵箱
ma = re.match(r'[a-zA-Z0-9]{6, 10}@163.com', 'abc123@163.com')
print(ma.group())

4）*？ /+？ /??匹配 (盡可能少匹配)

ma = re.match(r'[0-9][a-z]*', '1abc')
print(ma.group())
ma = re.match(r'[0-9][a-z]*?', '1abc')
print(ma.group())  # 只匹配1
1abc
1
ma = re.match(r'[0-9][a-z]+?', '1abc')
print(ma.group()) # 只匹配一次
1a

（3）邊界匹配

ma = re.match(r'[\w]{4,10}@163.com', 'imooc@163.com')
print(ma.group())
imooc@163.com
ma = re.match(r'[\w]{4,10}@163.com', 'imooc@163.comabc')  # 后面加上abc,match從頭開始匹配，則可以找到
print(ma.group())
imooc@163.com
ma = re.match(r'[\w]{4,10}@163.com&', 'imooc@163.comabc')
print(ma.group())  # 匹配不到
ma = re.match(r'^[\w]{4,10}@163.com&', 'imooc@163.comabc')
print(ma.group())  # 匹配不到
ma = re.match(r'^[\w]{4,10}@163.com&', 'imooc@163.com')
print(ma.group())  # 加上^和$,限制開頭結(jié)尾
imooc@163.com

# 指定開頭結(jié)尾
ma = re.match(r'\Aimooc[\w]*', 'imoocpython')
print(ma.group())
ma = re.match(r'\Aimooc[\w]*', 'iimoocpython')
print(ma.group())  # 匹配不到
imoocpython

（4）分組匹配

這里不再舉例。

4. re模塊相關(guān)方法使用

以上舉例都是match，從頭到尾匹配，查找子串就不合適了

# 在一個(gè)字符串中查找匹配
1:search(pattern, string, flags=0)
# 找到匹配，返回所有匹配部分的列表
2:findall(pattern, string, flags=0)
# 將字符串中匹配正則表達(dá)式得部分替換為其它,repl可以替換函數(shù)
3:sub(pattern, repl, string, count=0, flags=0)
# 根據(jù)匹配分割字符串，返回分割字符串組成的列表
4:split(pattern, string, maxsplit=0, flags=0)

# search
import re
str1 = 'imooc videonum = 1000'
print(str1.find('1000'))  # 數(shù)字改變則失效
17
info = re.search(r'\d+', str1)
print(info.group())
1000
str1 = 'imooc videonum = 10000'
info = re.search(r'\d+', str1)
print(info.group())
10000

# findall
# 當(dāng)有多個(gè)數(shù)字時(shí)
str2 = 'a=100, b=200, c=300'
info = re.search(r'\d+', str2)
print(info.group())
100
info = re.findall(r'\d+', str2)
print(info.group())
[100, 200, 300]

# sub 替換
str3 = 'imooc videonum = 1000'
info = re.sub(r'\d+', '1001', str3)
print(info)
imooc videonum = 1001

# split
# 分割
str3 = 'imooc：C C++ Java'
print(re.split(r':| ', str4))
[imooc, C, C, Java]

以上即為python中的正則表達(dá)式的一些知識(shí)總結(jié)。

總結(jié)

到此這篇關(guān)于python正則表達(dá)式的文章就介紹到這了,更多相關(guān)python正則表達(dá)式內(nèi)容請(qǐng)搜索本站以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持本站！

香港服務(wù)器租用

版權(quán)聲明：本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有，歡迎引用、轉(zhuǎn)載，請(qǐng)保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站，禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像，否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來，僅供學(xué)習(xí)參考，不代表本站立場(chǎng)，如有內(nèi)容涉嫌侵權(quán)，請(qǐng)聯(lián)系alex-e#qq.com處理。

排名優(yōu)化：網(wǎng)站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內(nèi)容優(yōu)化：關(guān)鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網(wǎng)站轉(zhuǎn)化率究竟是什么，有什么提升的技巧

一下吧：外貿(mào)站優(yōu)化有哪些基本的做法和注意事項(xiàng)

概要：競(jìng)價(jià)推廣費(fèi)用大概要多少呢，競(jìng)價(jià)推廣好不好

一下吧：SEO中site是什么意思，作用和應(yīng)用是怎樣的

郵箱：付費(fèi)郵箱有哪些優(yōu)勢(shì)，付費(fèi)郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢(shì)呢