现在的位置: 首页 > 综合 > 正文

尝试处理中文

2012年04月20日 ⁄ 综合 ⁄ 共 392字 ⁄ 字号 评论关闭
貌似python在处理中文时,一直以来都是个紧皱眉头的情况,我今天正好要用到中文,所以尝试一下(也受《可爱的python》熏陶)。

需求:获得一个目录下的所有文件名称(中文)。
没错,就这么个简单的需求,折腾我半天。。。

import os
code 
= unicode('D:\\学习\\TCPIP详解卷1协议','utf8')
for root,dirs,files in os.walk(code):
    
for name in files:
        
print name.encode('gb2312')

上面几行代码并不重要,重要的是通过这次尝试,我明白个理论,也终于理解了一个图:
大致的意思我是这么理解的,先把本地的编码转为内存可识别的unicode(解码),这可以是utf-8或utf-16等;然后把转换后的unicode进行编码,比如这个例子,我就转成简体中文gb2312

【上篇】
【下篇】

抱歉!评论已关闭.