JAVA的默认字符编码

现在的位置: 首页 > 综合 > 正文

JAVA的默认字符编码

2013年10月09日 ⁄ 综合 ⁄ 共 1410字 ⁄ 字号小中大 ⁄ 评论关闭

大家都说java使用的字符集是unicode，那么默认编码不就是应该是UTF8,UTF16之类的unicode编码吗？

可是调用Charset.defaultCharset()的结果并非如此。

import java.nio.charset.Charset; public class javaCode { public static void main(String args[]) { String defaultCharsetName=Charset.defaultCharset().displayName(); System.out.println("defaultCharsetName:"+defaultCharsetName); } }

执行结果如下

defaultCharsetName:GBK

多次试验发现，这个默认字符编码是由windows的语言地域里的设定决定的

语言设定

这个字符编码肯定不是java内部的字符编码，那会不会是文件读入时的字符编码？

先用Emeditor之类的编辑器，生成一个UTF8的txt文件，输入内容：門(door)，保存。

用下面的代码读入

import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.nio.charset.Charset; public class javaCode { public static void main(String args[]) { String defaultCharsetName=Charset.defaultCharset().displayName(); System.out.println("defaultCharsetName:"+defaultCharsetName); try { InputStream is = new FileInputStream("F://shifjst.txt"); //等于 InputStreamReader streamReader = new InputStreamReader(is,Charset.defaultCharset()); InputStreamReader streamReader = new InputStreamReader(is); char[] chars = new char[10]; streamReader.read(chars, 0, 10); System.out.println(chars); } catch (FileNotFoundException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }

结果是乱码：

defaultCharsetName:windows-31j
髢?door)

再把那个文件的格式改成shift-jis,正确读出来了。

defaultCharsetName:windows-31j
門(door)

看来，java读入文件时的字符编码是根据系统的默认编码来的。