现在的位置: 首页 > 综合 > 正文

C++中关于文字编码的问题

2012年11月18日 ⁄ 综合 ⁄ 共 1033字 ⁄ 字号 评论关闭

百度“知道”中有人问以下代码有什么问题:

TCHAR tmpText[50];
sprintf(tmpText,"%d,%d", a, b);
TextOut(hDC, x, y, tmpText,lstrlen(tmpText));

代码存在几个与文字编码有关的问题。提问者这样写,说明他对++中文字编码相关的知识还是不太了解。由于字符编码牵涉的问题比较多,我就决定写一篇文章来说明一下。

char与wchar_t

char中存放的是多字节型的字符,wchar_t中存放的是双字节型的字符,TCHAR在定义了_UNICODE时等同于wchar_t,在未定义_UNICODE时等同于char。

sprintf、wsprintf、_stprintf

sprintf是c++运行时库中的一个函数。c++ 运行时库处理字符串的函数通常都有2个版本,一个处理多字节型的字符,一个处理双字节型的字符。对于sprintf来说,它本身用于处理单字节字符,其双字节字符版本名为wprintf。
为了使用方便,c++运行时库还为每个处理字符串的库函数定义了一个宏,sprintf对应的宏的名字为_stprintf,这个宏在定义了_UNICODE时等同于wsprintf,在未定义_UNICODE时等同于sprintf。

问题本身

sprintf处理单字节字符,它就只能接收char类型的字符串。所以,如果当前定义了_UNICODE宏,那么tmpText中的字符的类型就是wchar_t. 它就不能传给sprintf.

要使第二行代码没有问题,要么把tchar换成char,要么把sprintf换成tsprintf。由于TextOut接收tchar类型的字符串,所以不能将tchar换成char,那只能把sprintf换成tsprintf。 sprintf换成tsprintf后,其第二个参数也需要加上_T()宏,以便将其转换为tchar类型。修改结果如下:

TCHAR tmpText[50];
_stprintf(tmpText,_T("%d,%d"), a, b);
TextOut(hDC, x, y, tmpText,lstrlen(tmpText));

如果项目中没有定义_UNICODE宏,那么整段代码就可以通过编译。但是这样的写法是有问题的,应该将代码改为:

char tmpText[50];
sprintf(tmpText,"%d,%d", a, b);
TextOut(hDC, x, y, tmpText,lstrlen(tmpText));

抱歉!评论已关闭.