解決linux下zip文件解壓亂碼問題
原因
由于zip格式并沒有指定編碼格式,Windows下生成的zip文件中的編碼是GBK/GB2312等,因此,導致這些zip文件在Linux下解壓時出現(xiàn)亂碼問題,因為Linux下的默認編碼是UTF8。
解決方案一
使用7z解壓。
安裝p7zip和convmv
# fedora $ su -c 'yum install p7zip convmv' # ubuntu $ sudo apt-get install p7zip convmv
執(zhí)行一下命令解壓縮
# 使用7z解壓縮 $ LANG=C 7za x your-zip-file.zip # 遞歸轉(zhuǎn)碼 $ convmv -f GBK -t utf8 --notest -r .
解決方案二
在windows上壓縮的文件,是以系統(tǒng)默認編碼中文來壓縮文件。由于zip文件中沒有聲明其編碼,所以linux上的unzip一般以默認編碼解壓,中文文件名會出現(xiàn)亂碼。
雖然2005年就有人把這報告為bug, 但是info-zip的官方網(wǎng)站沒有把自動識別編碼列入計劃,可能他們不認為這是個問題。Sun對java中存在N年的zip編碼問題,采用了同樣的處理方式。
有2種方式解決問題:
1. 通過unzip行命令解壓,指定字符集
unzip -O CP936 xxx.zip (用GBK, GB18030也可以)
有趣的是unzip的manual中并無這個選項的說明, unzip --help對這個參數(shù)有一行簡單的說明。
2. 在環(huán)境變量中,指定unzip參數(shù),總是以指定的字符集顯示和解壓文件
/etc/environment中加入2行
UNZIP="-O CP936" ZIPINFO="-O CP936"
這樣Gnome桌面的歸檔文件管理器(file-roller)可以正常使用unzip解壓中文,但是file-roller本身并不能設置編碼傳遞給unzip。
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持本站。
版權(quán)聲明:本站文章來源標注為YINGSOO的內(nèi)容版權(quán)均為本站所有,歡迎引用、轉(zhuǎn)載,請保持原文完整并注明來源及原文鏈接。禁止復制或仿造本網(wǎng)站,禁止在非www.sddonglingsh.com所屬的服務器上建立鏡像,否則將依法追究法律責任。本站部分內(nèi)容來源于網(wǎng)友推薦、互聯(lián)網(wǎng)收集整理而來,僅供學習參考,不代表本站立場,如有內(nèi)容涉嫌侵權(quán),請聯(lián)系alex-e#qq.com處理。