零基礎(chǔ)也能看懂的python內(nèi)置csv模塊教程
csv(Comma-Separated Values)文件是什么?
它是一種文件格式,一般也被叫做逗號分隔值文件,可以使用 Excel 軟件或者文本文檔打開 。
其中數(shù)據(jù)字段用半角逗號間隔(也可以使用其它字符),使用 Excel 打開時,逗號會被轉(zhuǎn)換為分隔符。
csv 文件是以純文本形式存儲了表格數(shù)據(jù),并且在兼容各個操作系統(tǒng)。
例如下面的文本,在 excel 中就以表格的形式存在。
sid,name,age
10010,橡皮擦,18
10086,發(fā)量迷人的喬喻,19
10000,各位博主,20
下面就對 python 內(nèi)置模塊 csv 的用法進行簡單的說明。
python 中的 csv 文件清晰解法
讀取文件
使用 csv.reader()
讀取 csv 文件內(nèi)容。
import csv # 模塊導(dǎo)入 with open('aa.csv', 'r', newline='', encoding='utf-8') as f: # <_csv.reader object at 0x00000000020918D0> reader = csv.reader(f) for r in reader: print(r)
其中 csv.reader()
方法的原型如下所示:
csv.reader(csvfile, dialect='excel', **fmtparams)
其中的參數(shù) csvfile
可以是任何對象,但要求該對象是一個迭代器,所以文件對象和列表對象都可以傳入,如果是文件對象,還要求打開它時攜帶參數(shù) newline=''
。后面的參數(shù)保持默認即可。
第二種方式是使用 DictReader
類,該類實現(xiàn)的效果與 reader()
方法一致,也是接收可迭代對象,返回生成器,差異是將返回的結(jié)果放到了一個字典的值內(nèi),字典的鍵就是單元格的標題。并且這樣輸出的函數(shù)是,不需要單獨處理 csv 的列頭行了。
import csv # 模塊導(dǎo)入 with open('aa.csv', 'r', newline='', encoding='utf-8') as f: reader = csv.DictReader(f) for r in reader: print(r)
輸出內(nèi)容:
OrderedDict([('sid', '10010'), ('name', '橡皮擦'), ('age', '18')]) OrderedDict([('sid', '10086'), ('name', '發(fā)量迷人的喬喻'), ('age', '19')]) OrderedDict([('sid', '10000'), ('name', '各位博主'), ('age', '20')])
寫入文件
csv 文件寫入用到的模塊方法是 csv.writer()
,該方法的原型如下:
csv.writer(csvfile, dialect='excel', **fmtparams)
最基本的寫入:
import csv with open('abc.csv', 'w', newline='') as csvfile: w = csv.writer(csvfile) # 寫入列頭 w.writerow(["sid", "name", "age"]) w.writerow(["10010", "橡皮擦", "18"]) w.writerow(["10086", "發(fā)量迷人的喬喻", "18"])
這時如果你在打開文件時,缺少了 newline=''
,那寫入 csv 文件內(nèi)容之后,會出現(xiàn)多余的換行。
除此之外,我們寫入 csv 文件的時候,可以啟用 dialect
(方言)參數(shù)。例如使用 |
作為列的分隔符。
此時的文件寫入代碼寫成下述內(nèi)容:
class my_dialect(csv.Dialect): lineterminator = '\r\n' delimiter = ';' quotechar = '"' quoting = csv.QUOTE_MINIMAL with open('abc.csv', 'w', newline='') as csvfile: w = csv.writer(csvfile, dialect=my_dialect) # 寫入列頭 w.writerow(["sid", "name", "age"]) w.writerow(["10010", "橡皮擦", "18"]) w.writerow(["10086", "發(fā)量迷人的喬喻", "18"])
上述代碼定義了一個新的類 my_dialect
,并使其繼承 csv.Dialect
類,重寫了其中的部分字段。
delimiter
:分隔字符,默認為 ,
;
lineterminator
:writer 方法寫入數(shù)據(jù)時,每行的結(jié)尾字符,默認為 \r\n
;
quotechar
:單字符,用于包裹具有特殊字符的字段,例如 定界符,引號字符,換行符,默認是 "
;
quoting
:控制 writer 何時生成引號,以及 reader 何時識別引號,默認是 QUOTE_MINIMAL
,其余幾個值分別是
QUOTE_ALL(全部加引號),
QUOTE_MINIMAL(特定情況加),
QUOTE_NONNUMERIC(所有非數(shù)字加),
QUOTE_NONE(都不加);
Writer
對象的方法說明:
csvwriter.writerow(row)
:寫入單行;
csvwriter.writerows(rows)
:寫入多行
import csv # 模塊導(dǎo)入 csv_headers = ['name', 'age'] rows = [('橡皮擦', 18), ('發(fā)量迷人的喬喻', 19), ('各位博主', 20)] with open('./aa.csv', 'w', encoding='utf-8',newline='') as f: csv_file = csv.writer(f) csv_file.writerow(csv_headers) # 寫入頭 csv_file.writerows(rows)
與 DictReader
類使用方法差不多,還存在一個 DictWriter
類,該類將以字段格式寫入 csv
文件字段。
import csv with open('abc.csv', 'w', newline='') as csvfile: w = csv.DictWriter(csvfile, fieldnames=['sid', 'name', 'age']) w.writeheader() # 寫入列頭 w.writerow({'sid': '10010', 'name': '橡皮擦', 'age': 18}) w.writerow({'sid': '10010', 'name': '橡皮擦', 'age': 18}) w.writerow({'sid': '10010', 'name': '橡皮擦', 'age': 18})
上述代碼尤其注意 fieldnames
參數(shù)是必填參數(shù),表示的是列頭,并且在寫入正式數(shù)據(jù)前,需使用 w.writeheader()
寫入列頭。
csv 文件其它說明
關(guān)于 csv 方言,可以使用 csv.register_dialect
方法將 name
與 dialect
關(guān)聯(lián)起來,核心含義相當(dāng)于給 dialect
起了一個別名。刪除也比較簡單,使用 csv.unregister_dialect(name)
即可。csv.list_dialects()
返回已經(jīng)注冊的方言名稱,你可以在電腦上做一下測試,查看 Python 環(huán)境中提供的幾種方言。
import csv csv.register_dialect('ca', delimiter='|', quoting=csv.QUOTE_MINIMAL) with open('abc.csv', 'w', newline='') as csvfile: w = csv.DictWriter(csvfile, fieldnames=['sid', 'name', 'age'], dialect='ca') w.writeheader() # 寫入列頭 w.writerow({'sid': '10010', 'name': '橡皮擦', 'age': 18}) w.writerow({'sid': '10010', 'name': '橡皮擦', 'age': 18}) w.writerow({'sid': '10010', 'name': '橡皮擦', 'age': 18})
csv 模塊還提供了 csv.Sniffer
類,用于推斷 csv 文件的格式,其存在兩個方法:
sniff(sample, delimiters=None):分析并返回一個 dialect 子類,可以分析出格式參數(shù);
has_header(sample):分析 csv 文件是否存在標題。
以上就是零基礎(chǔ)也能看懂的python內(nèi)置csv模塊詳解的詳細內(nèi)容,更多關(guān)于的python內(nèi)置模塊csv的資料請關(guān)注本站其它相關(guān)文章!
版權(quán)聲明:本站文章來源標注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復(fù)制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務(wù)器上建立鏡像,否則將依法追究法律責(zé)任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學(xué)習(xí)參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。