Python從csv文件中讀取數(shù)據(jù)及提取數(shù)據(jù)的方法
數(shù)據(jù)保存在csv文件中
1.從csv文件中讀取數(shù)據(jù)
參數(shù)header=None的有無(wú)
(1)沒(méi)有header=None——直接將csv表中的第一行當(dāng)作表頭
# 讀取數(shù)據(jù) import pandas as pd data = pd.read_csv("data1.csv") print(data)
打印結(jié)果為:
(2)有header=None——自動(dòng)添加第一行當(dāng)作表頭
# 讀取數(shù)據(jù) import pandas as pd data = pd.read_csv("data1.csv",header=None) print(data)
打印結(jié)果為:
2.數(shù)據(jù)切割
(這里根據(jù)csv表的格式,將header=None不寫)
(1)獲取所有列,并存入一個(gè)數(shù)組中
# 讀取數(shù)據(jù) import pandas as pd data = pd.read_csv("data1.csv") # print(data) # ①獲取所有列,并存入一個(gè)數(shù)組中 import numpy as np data = np.array(data) print(data) # 用戶編號(hào) 性別 年齡(歲) 年收入(元) 是否購(gòu)買 # [[15624510 1 19 19000 0] # [15810944 1 35 20000 0] # [15668575 2 26 43000 0] # [15603246 2 27 57000 0] # [ ... ...... ... ...]]
(2)獲取指定列的數(shù)據(jù),并存入一個(gè)數(shù)組中
方法一:從csv文件獲取data,data[ ] ——需要考慮數(shù)據(jù)的維度問(wèn)題
# 讀取數(shù)據(jù) import pandas as pd data = pd.read_csv("data1.csv") print(data) # 用戶編號(hào) 性別 年齡(歲) 年收入(元) 是否購(gòu)買 # (1)獲取第1列,并存入一個(gè)數(shù)組中 import numpy as np col_1 = data["用戶編號(hào)"] #獲取一列,用一維數(shù)據(jù) data_1 = np.array(col_1) print(data_1) # [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829 # 15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686 # 15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081 # 15705113 15631159 15792818 15633531 15744529] # (2)獲取第1,2列 col_12 = data[["用戶編號(hào)","性別"]] #獲取兩列,要用二維數(shù)據(jù) data_12 = np.array(col_12) print(data_12) # [[15624510 1] # [15810944 1] # [15668575 2] # [15603246 2] # [ ... ..]]
方法二:usecols=[ ] —— 直接寫入獲取的列數(shù)
import pandas as pd import numpy as np data_1 = pd.read_csv("data1.csv",usecols=["用戶編號(hào)"]) data_1 = np.array(data_1) print(data_1) # [[15624510] # [15810944] # [15668575] # [15603246] # [ ...]] # (2)如獲取第1,2列 data_12 = pd.read_csv("data1.csv",usecols=["用戶編號(hào)","性別"]) data_12 = np.array(data_12) print(data_12) # [[15624510 1] # [15810944 1] # [15668575 2] # [15603246 2] # [ ... ..]]
方法三:iloc[ ] ——實(shí)質(zhì)就是切片操作
import pandas as pd import numpy as np data = pd.read_csv("data1.csv") # (1)獲取第1列 data_1 = data.iloc[:,0] data_1 =np.array(data_1) print(data_1) # [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829 # 15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686 # 15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081 # 15705113 15631159 15792818 15633531 15744529] # (2)獲取第1,2列 data_12 = data.iloc[:,0:2] data_12 = np.array(data_12) print(data_12) # [[15624510 1] # [15810944 1] # [15668575 2] # [15603246 2] # [ ... ..]] # 獲取最后兩列 data_last = data.iloc[:,-2:] data_last = np.array(data_last) print(data_last) # [[ 19000 0] # [ 20000 0] # [ 26 43000 0] # [ 27 57000 0] # [ ... ... ...]]
到此這篇關(guān)于Python從csv文件中讀取數(shù)據(jù)并提取數(shù)據(jù)的方法的文章就介紹到這了,更多相關(guān)Python csv文件中讀取數(shù)據(jù)內(nèi)容請(qǐng)搜索本站以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持本站!
版權(quán)聲明:本站文章來(lái)源標(biāo)注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請(qǐng)保持原文完整并注明來(lái)源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來(lái)源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來(lái),僅供學(xué)習(xí)參考,不代表本站立場(chǎng),如有內(nèi)容涉嫌侵權(quán),請(qǐng)聯(lián)系alex-e#qq.com處理。