现在的位置: 首页 > 综合 > 正文

Python里的string 和 unicode (三)

2013年08月18日 ⁄ 综合 ⁄ 共 315字 ⁄ 字号 评论关闭

最后说说关于codecs。所谓的codec就是编码器和解码器(encoder and decoder)的集合。除了各种字符串编码的codec,还有各种文件格式的codec,比如压缩、解压缩的,图像的,音频的,等等。我们这里说的当然是跟字符串编码相关的了。

看看代码
>>> import codecs
>>> gbk=codecs.lookup('gbk')
>>> gbk
<codecs.CodecInfo object for encoding gbk at 0xad3ea0>
>>> gbk.decode("你好")
(u'/u4f60/u597d', 4)
>>> gbk.encode(u'/u4f60/u597d')
('/xc4/xe3/xba/xc3', 2)

抱歉!评论已关闭.