国产精品国产三级在线专区,国产剧情普通话对白av

pandas作者Wes McKinney 在【PYTHON FOR DATA ANALYSIS】中對pandas的方方面面都有了一個權(quán)威簡明的入門級的介紹，但在實(shí)際使用過程中，我發(fā)現(xiàn)書中的內(nèi)容還只是冰山一角。談到pandas數(shù)據(jù)的行更新、表合并等操作，一般用到的方法有concat、join、merge。但這三種方法對于很多新手來說，都不太好分清使用的場合與用途。今天就pandas官網(wǎng)中關(guān)于數(shù)據(jù)合并和重述的章節(jié)做個使用方法的總結(jié)。

文中代碼塊主要有pandas官網(wǎng)教程提供。

1 concat

concat函數(shù)是在pandas底下的方法，可以將數(shù)據(jù)根據(jù)不同的軸作簡單的融合

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
 keys=None, levels=None, names=None, verify_integrity=False)

參數(shù)說明

objs: series，dataframe或者是panel構(gòu)成的序列l(wèi)sit

axis：需要合并鏈接的軸，0是行，1是列

join：連接的方式 inner，或者outer

其他一些參數(shù)不常用，用的時候再補(bǔ)上說明。

1.1 相同字段的表首尾相接

# 現(xiàn)將表構(gòu)成list，然后在作為concat的輸入
In [4]: frames = [df1, df2, df3]
 
In [5]: result = pd.concat(frames)

要在相接的時候在加上一個層次的key來識別數(shù)據(jù)源自于哪張表，可以增加key參數(shù)

In [6]: result = pd.concat(frames, keys=['x', 'y', 'z'])

效果如下

1.2 橫向表拼接（行對齊）

1.2.1 axis

當(dāng)axis = 1的時候，concat就是行對齊，然后將不同列名稱的兩張表合并

In [9]: result = pd.concat([df1, df4], axis=1)

1.2.2 join

加上join參數(shù)的屬性，如果為'inner'得到的是兩表的交集，如果是outer，得到的是兩表的并集。

In [10]: result = pd.concat([df1, df4], axis=1, join='inner')

1.2.3 join_axes

如果有join_axes的參數(shù)傳入，可以指定根據(jù)那個軸來對齊數(shù)據(jù)

例如根據(jù)df1表對齊數(shù)據(jù)，就會保留指定的df1表的軸，然后將df4的表與之拼接

In [11]: result = pd.concat([df1, df4], axis=1, join_axes=[df1.index])

1.3

1.3 append

append是series和dataframe的方法，使用它就是默認(rèn)沿著列進(jìn)行憑借（axis = 0，列對齊）

In [12]: result = df1.append(df2)

1.4 無視index的concat

如果兩個表的index都沒有實(shí)際含義，使用ignore_index參數(shù)，置true，合并的兩個表就睡根據(jù)列字段對齊，然后合并。最后再重新整理一個新的index。

1.5 合并的同時增加區(qū)分?jǐn)?shù)據(jù)組的鍵

前面提到的keys參數(shù)可以用來給合并后的表增加key來區(qū)分不同的表數(shù)據(jù)來源

1.5.1 可以直接用key參數(shù)實(shí)現(xiàn)

In [27]: result = pd.concat(frames, keys=['x', 'y', 'z'])

1.5.2 傳入字典來增加分組鍵

In [28]: pieces = {'x': df1, 'y': df2, 'z': df3}
 
In [29]: result = pd.concat(pieces)

1.6 在dataframe中加入新的行

append方法可以將 series 和字典就夠的數(shù)據(jù)作為dataframe的新一行插入。

In [34]: s2 = pd.Series(['X0', 'X1', 'X2', 'X3'], index=['A', 'B', 'C', 'D'])
 
In [35]: result = df1.append(s2, ignore_index=True)

表格列字段不同的表合并

如果遇到兩張表的列字段本來就不一樣，但又想將兩個表合并，其中無效的值用nan來表示。那么可以使用ignore_index來實(shí)現(xiàn)。

In [36]: dicts = [{'A': 1, 'B': 2, 'C': 3, 'X': 4},
....: {'A': 5, 'B': 6, 'C': 7, 'Y': 8}]
....: 
 
In [37]: result = df1.append(dicts, ignore_index=True)

在這里，將接著介紹pandas中也常常用到的join 和merge方法

merge

pandas的merge方法提供了一種類似于SQL的內(nèi)存鏈接操作，官網(wǎng)文檔提到它的性能會比其他開源語言的數(shù)據(jù)操作（例如R）要高效。

和SQL語句的對比可以看這里

merge的參數(shù)

on：列名，join用來對齊的那一列的名字，用到這個參數(shù)的時候一定要保證左表和右表用來對齊的那一列都有相同的列名。

left_on：左表對齊的列，可以是列名，也可以是和dataframe同樣長度的arrays。

right_on：右表對齊的列，可以是列名，也可以是和dataframe同樣長度的arrays。

left_index/ right_index: 如果是True的haunted以index作為對齊的key

how：數(shù)據(jù)融合的方法。

sort：根據(jù)dataframe合并的keys按字典順序排序，默認(rèn)是，如果置false可以提高表現(xiàn)。

merge的默認(rèn)合并方法：

merge用于表內(nèi)部基于 index-on-index 和 index-on-column(s) 的合并，但默認(rèn)是基于index來合并。

1.1 復(fù)合key的合并方法

使用merge的時候可以選擇多個key作為復(fù)合可以來對齊合并。

1.1.1 通過on指定數(shù)據(jù)合并對齊的列

In [41]: left = pd.DataFrame({'key1': ['K0', 'K0', 'K1', 'K2'],
....: 'key2': ['K0', 'K1', 'K0', 'K1'],
....: 'A': ['A0', 'A1', 'A2', 'A3'],
....: 'B': ['B0', 'B1', 'B2', 'B3']})
....: 
 
In [42]: right = pd.DataFrame({'key1': ['K0', 'K1', 'K1', 'K2'],
....:  'key2': ['K0', 'K0', 'K0', 'K0'],
....:  'C': ['C0', 'C1', 'C2', 'C3'],
....:  'D': ['D0', 'D1', 'D2', 'D3']})
....: 
 
In [43]: result = pd.merge(left, right, on=['key1', 'key2'])

沒有指定how的話默認(rèn)使用inner方法。

how的方法有：

left

只保留左表的所有數(shù)據(jù)

In [44]: result = pd.merge(left, right, how='left', on=['key1', 'key2'])

right

只保留右表的所有數(shù)據(jù)

In [45]: result = pd.merge(left, right, how='right', on=['key1', 'key2'])

outer

保留兩個表的所有信息

In [46]: result = pd.merge(left, right, how='outer', on=['key1', 'key2'])

inner

只保留兩個表中公共部分的信息

In [47]: result = pd.merge(left, right, how='inner', on=['key1', 'key2'])

1.2 indicator

v0.17.0 版本的pandas開始還支持一個indicator的參數(shù)，如果置True的時候，輸出結(jié)果會增加一列 ' _merge'。_merge列可以取三個值

left_only 只在左表中
right_only 只在右表中
both 兩個表中都有

1.3 join方法

dataframe內(nèi)置的join方法是一種快速合并的方法。它默認(rèn)以index作為對齊的列。

1.3.1 how 參數(shù)

join中的how參數(shù)和merge中的how參數(shù)一樣，用來指定表合并保留數(shù)據(jù)的規(guī)則。

具體可見前面的 how 說明。

1.3.2 on 參數(shù)

在實(shí)際應(yīng)用中如果右表的索引值正是左表的某一列的值，這時可以通過將右表的索引和左表的列對齊合并這樣靈活的方式進(jìn)行合并。

ex 1

In [59]: left = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
....: 'B': ['B0', 'B1', 'B2', 'B3'],
....: 'key': ['K0', 'K1', 'K0', 'K1']})
....: 
 
In [60]: right = pd.DataFrame({'C': ['C0', 'C1'],
....:  'D': ['D0', 'D1']},
....:  index=['K0', 'K1'])
....: 
 
In [61]: result = left.join(right, on='key')

1.3.3 suffix后綴參數(shù)

如果和表合并的過程中遇到有一列兩個表都同名，但是值不同，合并的時候又都想保留下來，就可以用suffixes給每個表的重復(fù)列名增加后綴。

In [79]: result = pd.merge(left, right, on='k', suffixes=['_l', '_r'])

*　另外還有l(wèi)suffix 和 rsuffix分別指定左表的后綴和右表的后綴。

1.4 組合多個dataframe

一次組合多個dataframe的時候可以傳入元素為dataframe的列表或者tuple。一次join多個，一次解決多次煩惱~

In [83]: right2 = pd.DataFrame({'v': [7, 8, 9]}, index=['K1', 'K1', 'K2'])
 
In [84]: result = left.join([right, right2])

1.5 更新表的nan值

1.5.1 combine_first

如果一個表的nan值，在另一個表相同位置（相同索引和相同列）可以找到，則可以通過combine_first來更新數(shù)據(jù)

1.5.2 update

如果要用一張表中的數(shù)據(jù)來更新另一張表的數(shù)據(jù)則可以用update來實(shí)現(xiàn)

1.5.3 combine_first 和 update 的區(qū)別

使用combine_first會只更新左表的nan值。而update則會更新左表的所有能在右表中找到的值（兩表位置相對應(yīng)）。

總結(jié)

到此這篇關(guān)于pandas中DataFrame 數(shù)據(jù)合并連接（merge、join、concat)的文章就介紹到這了,更多相關(guān)pandas中DataFrame 數(shù)據(jù)合并內(nèi)容請搜索本站以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持本站！

海外服務(wù)器租用

版權(quán)聲明：本站文章來源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有，歡迎引用、轉(zhuǎn)載，請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站，禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像，否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來，僅供學(xué)習(xí)參考，不代表本站立場，如有內(nèi)容涉嫌侵權(quán)，請聯(lián)系alex-e#qq.com處理。

相關(guān)文章

動態(tài)撥號：關(guān)鍵詞排名下降是啥緣故，快速提高排名怎樣做

排名優(yōu)化：網(wǎng)站排名優(yōu)化方法有什么，如何做有效果

老域名：怎樣才算老域名，老域名建站有什么影響

內(nèi)容優(yōu)化：關(guān)鍵字排名要做哪些方面的優(yōu)化，怎樣做

技巧：網(wǎng)站轉(zhuǎn)化率究竟是什么，有什么提升的技巧

一下吧：外貿(mào)站優(yōu)化有哪些基本的做法和注意事項(xiàng)

概要：競價推廣費(fèi)用大概要多少呢，競價推廣好不好

一下吧：SEO中site是什么意思，作用和應(yīng)用是怎樣的

郵箱：付費(fèi)郵箱有哪些優(yōu)勢，付費(fèi)郵箱挑選要考慮什么

集群是什么意思：集群是什么意思，都有哪些優(yōu)勢呢

服務(wù)器配置數(shù)據(jù)庫配置服務(wù)器運(yùn)維服務(wù)器安全
互聯(lián)網(wǎng)資訊服務(wù)器公司 IDC數(shù)據(jù)中心
免費(fèi)服務(wù)器香港服務(wù)器租用美國服務(wù)器租用

人妖在线一区,国产日韩欧美一区二区综合在线,国产啪精品视频网站免费,欧美内射深插日本少妇

公司動態(tài)

產(chǎn)品資訊

行業(yè)資訊

pandas中DataFrame數(shù)據(jù)合并連接（merge、join、concat)

目錄

1 concat

1.1 相同字段的表首尾相接

1.2 橫向表拼接（行對齊）

1.2.1 axis

1.2.2 join

1.2.3 join_axes

1.3 append

1.4 無視index的concat

1.5 合并的同時增加區(qū)分?jǐn)?shù)據(jù)組的鍵

1.5.1 可以直接用key參數(shù)實(shí)現(xiàn)

1.5.2 傳入字典來增加分組鍵

1.6 在dataframe中加入新的行

表格列字段不同的表合并

merge

1.1 復(fù)合key的合并方法

1.1.1 通過on指定數(shù)據(jù)合并對齊的列

1.2 indicator

1.3 join方法

1.3.1 how 參數(shù)

1.3.2 on 參數(shù)

1.3.3 suffix后綴參數(shù)

1.4 組合多個dataframe

1.5 更新表的nan值

1.5.1 combine_first

1.5.2 update

1.5.3 combine_first 和 update 的區(qū)別

總結(jié)

Pandas加速代碼之避免使用for循環(huán)

新增sftp服務(wù)器及用戶

實(shí)時開通

免備案

全天候客戶服務(wù)

專屬顧問服務(wù)

人妖在线一区,国产日韩欧美一区二区综合在线,国产啪精品视频网站免费,欧美内射深插日本少妇

公司動態(tài)

產(chǎn)品資訊

行業(yè)資訊

pandas中DataFrame數(shù)據(jù)合并連接（merge、join、concat)

目錄

1 concat

1.1 相同字段的表首尾相接

1.2 橫向表拼接（行對齊）

1.2.1 axis

1.2.2 join

1.2.3 join_axes

1.3 append

1.4 無視index的concat

1.5 合并的同時增加區(qū)分?jǐn)?shù)據(jù)組的鍵

1.5.1 可以直接用key參數(shù)實(shí)現(xiàn)

1.5.2 傳入字典來增加分組鍵

1.6 在dataframe中加入新的行

表格列字段不同的表合并

merge

1.1 復(fù)合key的合并方法

1.1.1 通過on指定數(shù)據(jù)合并對齊的列

1.2 indicator

1.3 join方法

1.3.1 how 參數(shù)

1.3.2 on 參數(shù)

1.3.3 suffix后綴參數(shù)

1.4 組合多個dataframe

1.5 更新表的nan值

1.5.1 combine_first

1.5.2 update

1.5.3 combine_first 和 update 的區(qū)別

總結(jié)

Pandas加速代碼之避免使用for循環(huán)

新增sftp服務(wù)器及用戶

實(shí)時開通

免備案

全天候客戶服務(wù)

專屬顧問服務(wù)

pandas中DataFrame數(shù)據(jù)合并連接（merge、join、concat)