锟斤拷锟斤拷是什么编码

现在的位置: 首页 > web前端 > 正文

RSS

上篇下篇

锟斤拷锟斤拷是什么编码

2020年07月16日 ⁄ web前端 ⁄ 共 923字 ⁄ 字号小中大 ⁄ 评论关闭

　　锟斤拷，是一串经常在搜索引擎页面和其他网站上看到的乱码字符。乱码源于GBK字符集和Unicode字符集之间的转换问题。

　　锟斤拷锟斤拷示例

　　“锟届瀿锟斤拷雮傡锟斤拷直锟斤拷锟”、“锟斤拷锟斤拷之锟斤拷锟窖э拷锟”……

　　上面这些字句是毫无实际意义的，但它们却形象地表达出了一些莫名其妙的问题。这是一个很经典的乱码，最容易出现的地方就是搜索引擎。

　　例如这个招聘就非常经典：

　　单位性质：外商独资企业

　　所属行业：线缆

　　单位规模：100-499人

　　注册资金：1299万

　　联系人：锟斤拷锟斤拷

　　联系人职位：锟斤拷锟斤拷

　　传真：xxx-xxxxxxxx

　　联系电话：

　　通信地址：

　　邮编：

　　单位网址：

　　单位介绍：台锟斤拷锟斤拷业锟斤拷台锟斤拷锟斤拷锟侥碉拷f锟斤拷锟斤拷锟斤拷锟?锟斤拷锟斤拷/锟斤拷锟斤拷

　　招聘职位：锟斤拷锟斤拷

　　人数：20人

　　发布日期：2007-07-17

　　联系人：锟斤拷锟斤拷

　　锟斤拷锟斤拷原因

　　我们上网的时候不用去关心网站采用了什么编码格式，但是页面中不时出现的乱码还是会让我们头疼。在这点上，Firefox的用户更是深有体会，用Firefox浏览网页看到乱码的机会要比InternetExplorer多得多。乱码主要与字符编码系统有关。例如一个网页中常出现的乱码“锟斤拷”（百度，Google），它就是新老编码系统转换中出现的。网友est专门写了一篇文章来考证问题来源：

　　Unicode和老编码体系的转化过程中，肯定有一些字，用Unicode是没法表示的，Unicode官方用了一个占位符来表示这些文字，这就是：U+FFFDREPLACEMENTCHARACTER。那么U+FFFD的UTF-8编码出来，恰好是“\xef\xbf\xbd”。如果这个“\xef\xbf\xbd”，重复多次，例如'\xef\xbf\xbd\xef\xbf\xbd'，然后放到GBK/CP936/GB2312/GB18030的环境中显示的话，一个汉字2个字节，最终的结果就是：锟斤拷——锟（0xEFBF），斤（0xBDEF），拷（0xBFBD）。

　　总之，锟斤拷锟斤拷给大家简单的介绍了一些，希望大家多看看。