现在的位置: 首页 > web前端 > 正文

锟斤拷锟斤拷是什么编码

2020年07月16日 web前端 ⁄ 共 923字 ⁄ 字号 评论关闭

  锟斤拷,是一串经常在搜索引擎页面和其他网站上看到的乱码字符。乱码源于GBK字符集和Unicode字符集之间的转换问题。


  锟斤拷锟斤拷示例


  “锟届瀿锟斤拷雮傡锟斤拷直锟斤拷锟”、“锟斤拷锟斤拷之锟斤拷锟窖э拷锟”……


  上面这些字句是毫无实际意义的,但它们却形象地表达出了一些莫名其妙的问题。这是一个很经典的乱码,最容易出现的地方就是搜索引擎。


  例如这个招聘就非常经典:


  单位性质:外商独资企业


  所属行业:线缆


  单位规模:100-499人


  注册资金:1299万


  联系人:锟斤拷锟斤拷


  联系人职位:锟斤拷锟斤拷


  传真:xxx-xxxxxxxx


  联系电话:


  通信地址:


  邮编:


  单位网址:


  单位介绍:台锟斤拷锟斤拷业锟斤拷台锟斤拷锟斤拷锟侥碉拷f锟斤拷锟斤拷锟斤拷锟?锟斤拷锟斤拷/锟斤拷锟斤拷


  招聘职位:锟斤拷锟斤拷


  人数:20人


  发布日期:2007-07-17


  联系人:锟斤拷锟斤拷


  锟斤拷锟斤拷原因


  我们上网的时候不用去关心网站采用了什么编码格式,但是页面中不时出现的乱码还是会让我们头疼。在这点上,Firefox的用户更是深有体会,用Firefox浏览网页看到乱码的机会要比InternetExplorer多得多。乱码主要与字符编码系统有关。例如一个网页中常出现的乱码“锟斤拷”(百度,Google),它就是新老编码系统转换中出现的。网友est专门写了一篇文章来考证问题来源:


  Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFDREPLACEMENTCHARACTER。那么U+FFFD的UTF-8编码出来,恰好是“\xef\xbf\xbd”。如果这个“\xef\xbf\xbd”,重复多次,例如'\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话,一个汉字2个字节,最终的结果就是:锟斤拷——锟(0xEFBF),斤(0xBDEF),拷(0xBFBD)。


  总之,锟斤拷锟斤拷给大家简单的介绍了一些,希望大家多看看。


  

抱歉!评论已关闭.