当前位置:编程学习 > 网站相关 >>

python下的编码检测——chardet

 
 
    chardet 是python的第三方库,chardet是一个非常优秀的编码识别模块。但是一直没有python3的版本,
由于自己需要用到,因此试着修改到python3下能够运行。
 
一、本软件基于chardet-2.1.1,安装python 3的新特性和语法进行修改后修改版,修改时参照了此篇文章:
http://woodpecker.org.cn/diveintopython3/case-study-porting-chardet-to-python-3.html#running2to3
 
二、但由于版本不同,修改之处也不尽相同,修改点也多于文章中所提之处。
本人测试环境为python3.3。
 
三、另外,由于python3对于字符串编码的调整,因此对于str类型侦测编码就变得没有意义了,因此,修改过后的版本
是用来检测bytes类型的编码的。
 
四、测试程序test.py是根据该文章中的编码的来,原软件包中并无此文件。
 
五、安装时仍用原有安装方式:python setup.py install
 
六、其他事项参加chartdet的文档或网上文章。
 
 
补充:Web开发 , Python ,
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,