大家都说java使用的字符集是unicode,那么默认编码不就是应该是UTF8,UTF16之类的unicode编码吗?
可是调用Charset.defaultCharset()的结果并非如此。
public class javaCode {
public static void main(String args[])
{
String defaultCharsetName=Charset.defaultCharset().displayName();
System.out.println("defaultCharsetName:"+defaultCharsetName);
}
}
执行结果如下
defaultCharsetName:GBK
多次试验发现,这个默认字符编码是由windows的语言地域里的设定决定的
这个字符编码肯定不是java内部的字符编码,那会不会是文件读入时的字符编码?
先用Emeditor之类的编辑器,生成一个UTF8的txt文件,输入内容:門(door),保存。
用下面的代码读入
public class javaCode {
public static void main(String args[])
{
String defaultCharsetName=Charset.defaultCharset().displayName();
System.out.println("defaultCharsetName:"+defaultCharsetName);
try {
InputStream is = new FileInputStream("F://shifjst.txt");
//等于 InputStreamReader streamReader = new InputStreamReader(is,Charset.defaultCharset());
InputStreamReader streamReader = new InputStreamReader(is);
char[] chars = new char[10];
streamReader.read(chars, 0, 10);
System.out.println(chars);
} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
结果是乱码:
defaultCharsetName:windows-31j
髢?door)
再把那个文件的格式改成shift-jis,正确读出来了。
defaultCharsetName:windows-31j
門(door)
看来,java读入文件时的字符编码是根据系统的默认编码来的。