GD输出汉字的函数对比有什么变化

现在的位置: 首页 > 编程语言 > 正文

GD输出汉字的函数对比有什么变化

2020年05月28日 ⁄ 编程语言 ⁄ 共 2271字 ⁄ 字号小中大 ⁄ 评论关闭

　　很早以前找到一个把GB码转化为UTF-8的函数，配合一个GB到UNICODE的对照表(gb2312.txt)，用于在GD中输出汉字。后来发现在欲输出的内容中含有西文字符时，会出现混乱。后来找到了修改后的代码，解决了问题。下面学步园小编来讲解下GD输出汉字的函数对比有什么变化?

　　GD输出汉字的函数对比有什么变化

　　首先，这是一个UNICODE到UTF-8编码转换的函数，这一部分修改前后没有变化：

　　functionu2utf8($c)

　　{

　　for($i=0;$i

　　$str="";

　　if($c<0x80){ 　　$str.=$c; 　　} 　　elseif($c<0x800){ 　　$str.=(0xC0|$c>>6);

　　$str.=(0x80|$c&0x3F);

　　}

　　elseif($c<0x10000){ 　　$str.=(0xE0|$c>>12);

　　$str.=(0x80|$c>>6&0x3F);

　　$str.=(0x80|$c&0x3F);

　　}

　　elseif($c<0x200000){ 　　$str.=(0xF0|$c>>18);

　　$str.=(0x80|$c>>12&0x3F);

　　$str.=(0x80|$c>>6&0x3F);

　　$str.=(0x80|$c&0x3F);

　　}

　　return$str;

　　}

　　这里完全是按照UTF-8编码的规则，通过判断字符属于不同的UNICODE编码段范围，进行不同的移位和位与操作，以转化为UTF-8编码。关于该规则可参考http://www.utf8.org/上的说明。

　　这是修改前的GB转化为UTF-8编码的函数，其中调用了上面的u2utf8函数。

　　GD输出汉字的函数对比有什么变化

　　functiongb2utf8($gb)/*Programwritenbysadlywww.phpx.com*/

　　{

　　if(!trim($gb))

　　return$gb;

　　$filename="gb2312.txt";

　　$tmp=file($filename);

　　$codetable=array();

　　while(list($key,$value)=each($tmp))

　　$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);

　　$utf8="";

　　while($gb)

　　{

　　if(ord(substr($gb,0,1))>127)

　　{

　　$this=substr($gb,0,2);

　　$gb=substr($gb,2,strlen($gb));

　　$utf8.=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));

　　}

　　else

　　{

　　$gb=substr($gb,1,strlen($gb));

　　$utf8.=u2utf8(substr($gb,0,1));

　　}

　　$ret="";

　　for($i=0;$i

　　$ret.=chr(substr($utf8,$i,3));

　　return$ret;

　　}

　　函数中while循环部分，把汉字逐个按照“对照表”转化为UNICODE，再通过u2utf8函数转化为UTF-8。但从中可以看出，while循环结束后，又用一个for循环，把每三个字节合成了一个UTF-8字符(见http://www.utf8.org/上的规则说明，每个汉字的UTF-8编码为三字节)，没有考虑到其中的西文字符(西文字符的UTF-8编码为一字节)。所以，如果欲输出的内容中不论是开始时出现西文字符，或是汉字当中穿插西文字符，转化为UTF-8后，都会被按照“每三个字节截取”的方式截开，导致乱码。

　　以下是修改后的函数：

　　functiongb2utf8($gb)/*Programwritenbysadlymodifiedbyagun*/

　　{

　　if(!trim($gb))

　　return$gb;

　　$filename="gb2312.txt";

　　$tmp=file($filename);

　　$codetable=array();

　　while(list($key,$value)=each($tmp))

　　$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);

　　$ret="";

　　$utf8="";

　　while($gb)

　　{

　　if(ord(substr($gb,0,1))>127)

　　{

　　$this=substr($gb,0,2);

　　$gb=substr($gb,2,strlen($gb));

　　$utf8=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));

　　for($i=0;$i

　　$ret.=chr(substr($utf8,$i,3));

　　}

　　else

　　{

　　$ret.=substr($gb,0,1);

　　$gb=substr($gb,1,strlen($gb));

　　}

　　return$ret;

　　}

　　修改后的函数将GB转化为UNICODE、UNICODE转化为UTF-8、几个字节合成一个UTF-8字符，这三个步骤在一个循环里完成，尤其是几个字节合成一个UTF-8字符这一步骤，放在判断了字符属于西文还是属于汉字的条件分支里，据此决定截取一个字节还是三个字节。于是结果正确了!

　　以上就是关于“GD输出汉字的函数对比有什么变化”的内容，希望对大家有用。更多资讯请关注学步园。学步园，您学习IT技术的优质平台!

【上篇】php析构函数是什么
【下篇】怎么用PHP模拟SQL Server的两个日期处理函数

作者: admin

该日志由 admin 于4年前发表在编程语言分类下，最后更新于 2020年05月28日.
转载请注明: GD输出汉字的函数对比有什么变化 | 学步园 +复制链接

抱歉!评论已关闭.

学步园

GD输出汉字的函数对比有什么变化

作者: admin

书签

最新文章New

本站推荐

返回首页