新聞中心
python查看字符集的方法:可以利用第三方庫chardet來進(jìn)行判斷。通過在命令行下執(zhí)行【pip install chatdet】命令來安裝chardet。使用方法如:【chardet.detect(b'Hello, world!')】。

創(chuàng)新互聯(lián)于2013年開始,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項目成都網(wǎng)站設(shè)計、做網(wǎng)站網(wǎng)站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元儋州做網(wǎng)站,已為上家服務(wù),為儋州各地企業(yè)和個人服務(wù),聯(lián)系電話:13518219792
Python利用第三方庫chardet判斷字符集。
(推薦教程:Python入門教程)
如果安裝了Anaconda,chardet就已經(jīng)可用了。否則,需要在命令行下通過pip安裝:
$ pip install chardet
當(dāng)我們拿到一個bytes時,就可以對其檢測編碼。用chardet檢測編碼,只需要一行代碼:
>>> chardet.detect(b'Hello, world!')
{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}檢測出的編碼是ascii,注意到還有個confidence字段,表示檢測的概率是1.0(即100%)。
對UTF-8編碼進(jìn)行檢測:
>>> data = '離離原上草,一歲一枯榮'.encode('utf-8')
>>> chardet.detect(data)
{'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}用chardet檢測編碼,使用簡單。獲取到編碼后,再轉(zhuǎn)換為str,就可以方便后續(xù)處理。
分享名稱:創(chuàng)新互聯(lián)Python教程:python如何查看字符集
當(dāng)前網(wǎng)址:http://fisionsoft.com.cn/article/dpicood.html


咨詢
建站咨詢
