现在的位置: 首页 > 综合 > 正文

windows下python3安装chardet插件

2018年05月05日 ⁄ 综合 ⁄ 共 872字 ⁄ 字号 评论关闭

安装chardet插件过程很痛苦,历经了不少周折,最后也是莫名其妙的在联网的状态(确切的说是翻墙联网)下安装成功了,对其原理任然不甚了解。

安装过程如下:

1,下载chardet插件如下图,

2,下载后解压,放在Python\Lib\site-packages下,如我的是"D:\Python33\Lib\site-packages\chardet2-2.0.3"

然后打开命令行,输入"python D:\Python33\Lib\site-packages\chardet2-2.0.3\setup.py
install
"若果不成功,查看第三步

3,安装setuptools,下载地址,此版本为3.4.1,若需要其他版本,可直接在google中搜索“名字+版本号”,然后点击快照即可下载,下载完成后,安装完毕,再来重新安装chardet

测试代码:

import urllib.request
import sys
reload(sys)
import chardet

req = urllib.request.urlopen(r"http://www.baidu.com")##这里可以换成http://www.baidu.com,http://www.sohu.com
content = req.read()
typeEncode = sys.getfilesystemencoding()##系统默认编码
infoencode = chardet.detect(content).get('encoding','utf-8')##通过第3方模块来自动提取网页的编码
html = content.decode(infoencode,'ignore').encode(typeEncode)##先转换成unicode编码,然后转换系统编码输出
print (html)

p.s:但有个mbs的问题任然没有解决,继续改进。。。(报错:UnicodeEncodeError: 'mbcs' codec can't encode characters in position 0--1: invalid character)


抱歉!评论已关闭.