现在的位置: 首页 > 综合 > 正文

Python中的编码

2013年02月18日 ⁄ 综合 ⁄ 共 415字 ⁄ 字号 评论关闭

1) Python 3会假定我们的源码 — 即.py文件 — 使用的是UTF-8编码方式。Python 2里,.py文件默认的编码方式为ASCII。可以使用# -*- coding: windows-1252
-*-方式
来改变文件的编码。如果py文件中包含中文的字符串,则需要制定为# -*- coding: gbk -*-,貌似默认的utf8不够哦。

2) python3中默认的str为unicode的,可以使用str.encode来转为bytes类型。

3) python3的print函数只支持unicode的str,貌似没有对bytes的解码功能,所以对对不能解码的bytes不能正确输出。 

4) str和bytes不能连接和比较。 

5) codecs任然可以用来str和bytes间的转化。 

6) 定义非ascii码的bytes时,必须使用如 bytes('中国','gbk') 来转码。

 

7)貌似必须在中文系统或者系统安装中文的语言包后gbk解码才能正常工作。

抱歉!评论已关闭.