现在的位置: 首页 > 综合 > 正文

javamail乱码问题

2014年02月28日 ⁄ 综合 ⁄ 共 3442字 ⁄ 字号 评论关闭

从网上收集,加上自己的摸索总结:

 

 

发邮件:

邮件头(参见RFC822,RFC2047)只能包含US-ASCII字符。邮件头中任何包含非US-ASCII字符的部分必须进行编码,使其只包含US-ASCII字符。所以使用java mail发送中文邮件必须经过编码,否则别人收到你的邮件只能是乱码一堆。不过使用java mail 包的解决方法很简单,用它自带的MimeUtility工具中encode开头的方法(如encodeText)对中文信息进行编码就可以了。

 例子:

         MimeMessage mimeMsg = new MimeMessage(mailSession);

// 让javamail决定用什么方式来编码 ,编码内容的字符集是系统字符集

mimeMsg.setSubject( MimeUtility.encodeText( Subject) );

// 使用指定的base64方式编码,并指定编码内容的字符集是gb2312

mimeMsg.setSubject( MimeUtility.encodeText( Subject,”gb2312”,”B”)); //B为base64方式

 

        

通常对邮件头的编码方式有2种,一种是base64方式编码,一种是QP(quoted-printable)方式编码,javamail根据具体情况来选择编码方式。

         如“txt测试”编码后内容如下:

=?GBK?Q?Txt=B2=E2=CA=D4

         里面有个=?GBK?Q?,GBK表示的是内容的字符集,?Q?表示的是以QP方式编码的(?B?则是以base64方式编码),后面紧跟的才是编码后的中文字符。所以用MimeUtility工具编码后的信息里包含了编码方式的信息。

 

邮件正文

邮件的正文也要进行编码,但它不能用MimeUtility里的方法来编码。邮件正文的编码方式的信息是要放在Content-Transfer-Encoding这个邮件头参数中的,而MimeUtility里面的方法是将编码方式的信息放在编码后的正文内容中。所以如果你对正文也用MimeUtility进行处理,那么其他邮件程序就不会正常显示你编码的邮件,因为其他邮件软件如outlook,foxmail只会根据Content-Transfer-Encoding这个里面的信息来对邮件正文进行解码。

其实,邮件正文部分的编码javamail已经自动帮你做了,当你发送邮件的时候,它会自己决定编码方式,并把编码方式的信息放入Content-Transfer-Encoding这个邮件头参数中,然后再发送。所以你所要做的就是直接把邮件正文的内容放入邮件中就可以了。

对邮件正文的编码方式比较多,包括了base64和QP方式,还有一些如7bit,8bit等等,因为javamail自动为邮件正文编码,所以我就不一一祥叙了。

 

例子:

// 处理邮件正文

MimeBodyPart mbp=new MimeBodyPart();

if ( ContentType == null || ContentType.equals("")) // ContentType为编码类型,如GBK等

mbp.setText( Content ); // 由JavaMail来决定编码

else

mbp.setContent( Content, ContentType); // 指定编码格式

 

javamail包中的MimeUtility工具中也提供了对邮件信息解码的方法,都是以decode开头的一些方法(如decodeText)

例子:

String Subject = mimemsg.getSubject();

String ChSubject = MimeUtility.decodeText(Subject);

对于base64和QP编码后信息,decode* 方法能将他们正确的解码,但是,如果指定的字符集不对,那么javamail就会出现错误,不能正确地将其解码。

如有的邮件系统将”txt测试”编码后如下:

=?x-unkown?Q?Txt=B2=E2=CA=D4

这里指定的字符集是x-unknown,是非明确的字符集,javamail就不能正确的处理了,但是”测试”这两个中文字还是按照gbk字符集编码的,所以你可以手工的将编码方式信息改正确,再用decode*方法来解码。

例子:

if ( str.indexOf("=?x-unknown?") >=0 ){

str = str.replaceAll("x-unknown","gbk"); // 将编码方式的信息由x-unkown改为gbk

try{

str = MimeUtility.decodeText( str ); //再重新解码

} catch( Exception e1){

return str ;

}

         }

         邮件正文

decode*方法都是根据在编码信息中包含的编码方式的信息来解码,所以decode*方法对邮件正文解码是无效的,因为邮件正文中不包含编码方式的信息。

同编码一样,邮件正文的解码也是由javamail做了。Javamail根据Content-Transfer-Encoding里的信息,来对邮件的正文解码。

客户程序从javamail取得的正文内容字符集为iso-8859-1,所以还要将字符集转换一下。

例子:

String CorrectContent = new String( Content.getbytes(“iso-8859-1”),”gb2312”);

CorrentContent为正确的邮件正文了

 

收邮件

 

javaMail收邮件的操作是:1.连接到Pop3邮件服务器2.得到邮件对象数组3.查看指定邮件的信息4.删除邮件。

javamail通过pop3接收到发件人的乱码问题:

邮件发件人的格式为:姓名+<邮件地址>

而有些邮件没姓名,直接是<邮件地址> 。可以把它看成一个字符串,这个字符串先经过编码,然后可以被加密。由于Email的规范,在smtp传输中不可使用中文字符。所以可以使用内置类的MimeUtility方法encodeText将收件人、发件人名字编码即可。编码方式有两种:"B"代表Base64、"Q"代表QP(quoted-printable)方式。

从163的pop3的服务器上读取我的邮件,并输出发件人。中文出现了乱码。收件人字符串格式有:utf-8,gbk,gb2312,gb18030。加密形式有"B"代表Base64如:=?gb2312?B?1sfBqtXQxrj=?= <a.jiaji@support150.zhaopin.com>",可以看出,这个字符串的编码格式是:gb2312,而采用了base64加密。Q表QP(quoted-printable)方式

 

对于没有加密的字符串,直接用rtnStr=new String(str.getBytes("iso-8859-1"));就能正确显示。对于加密的字符串,需要用rtnStr=MimeUtility.decodeText(str);就能解决。

 

关于邮件正文处理乱码方式:

   部分代码:

 InputStream in = part.getInputStream();
                 try{
                 if(contenttype.toLowerCase().indexOf("charset") == -1){
                 StringBuffer sb = new StringBuffer();
                
                 InputStreamReader isr=new InputStreamReader(in,"GBK");
                 BufferedReader br=new BufferedReader(isr);
                 String strLine=br.readLine();
                 String s=new String(strLine.getBytes("gbk"),"gbk");
                 sb.append(s);
                 isr.close();
                 result.append(sb.toString());

 

 

 

 

 

 

 

 

 

 

【上篇】
【下篇】

抱歉!评论已关闭.