Chardet查看字符串编码

2014-05-01 15:43
Python chardet 编码
摘要:写了个小脚本用 chardet 判断文件编码,整理一下安装和 detect 函数的基本用法。

用chardet库判断字符串的编码 有时候我们需要判断字符串或某个文件内容的编码,我们可以通过chardet的detect方法来实现。 首先需要下载安装chardet库,可能有的同学会出现安装出错的情况,没关系。解压文件后,会看到一个同名的chardet文件夹,打开会看到里面都是py文件。copy此文件夹及其文件到你计算机Python安装目录里的Lib/site-packages文件夹里,这一样不用安装就可以直接import了。 检测字符串编码的用法:

>>> import chardet
>>> chardet.detect('Hello world')
{'confidence': 1.0, 'encoding': 'ascii'}

如果是文件的话,打开后读取一行再进行检测就OK了。