现在的位置: 首页 > 综合 > 正文

UTF8与GBK字符编码之间的相互转换

2019年05月30日 ⁄ 综合 ⁄ 共 1258字 ⁄ 字号 评论关闭

1、将UTF8转换成GBK

void UTF8ToGBK( char *&szOut )
{
 unsigned short *wszGBK;
 char *szGBK;
 //长度
 int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, NULL, 0);
 wszGBK = new unsigned short[len+1];
 memset(wszGBK, 0, len * 2 + 2);
 MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len);

 //长度
 len = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
 szGBK = new char[len+1];
 memset(szGBK, 0, len + 1);
 WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL);

 //szOut = szGBK; //这样得到的szOut不正确,因为此句意义是将szGBK的首地址赋给szOut,当delete []szGBK执行后szGBK的内

                             //存空间将被释放,此时将得不到szOut的内容

 memset(szOut,'/0',strlen(szGBK)+1); //改将szGBK的内容赋给szOut ,这样即使szGBK被释放也能得到正确的值
 memcpy(szOut,szGBK,strlen(szGBK));


 delete []szGBK;
 delete []wszGBK;
}

2、将GBK转换成UTF8

void GBKToUTF8(char* &szOut)
{
 char* strGBK = szOut;

 int len=MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, NULL,0);
 unsigned short * wszUtf8 = new unsigned short[len+1];
 memset(wszUtf8, 0, len * 2 + 2);
 MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, (LPWSTR)wszUtf8, len);

 len = WideCharToMultiByte(CP_UTF8, 0, (LPWSTR)wszUtf8, -1, NULL, 0, NULL, NULL);
 char *szUtf8=new char[len + 1];
 memset(szUtf8, 0, len + 1);
 WideCharToMultiByte (CP_UTF8, 0, (LPWSTR)wszUtf8, -1, szUtf8, len, NULL,NULL);

 //szOut = szUtf8;
 memset(szOut,'/0',strlen(szUtf8)+1);
 memcpy(szOut,szUtf8,strlen(szUtf8));

 delete[] szUtf8;
 delete[] wszUtf8;
}


抱歉!评论已关闭.