现在的位置: 首页 > 综合 > 正文

文件下载(解决中文文件名下载乱码问题) 收集

2013年10月12日 ⁄ 综合 ⁄ 共 6545字 ⁄ 字号 评论关闭
文章目录

 在前面一篇文章里(浅谈 COMMON-FILEUPLOAD1.1 的使用 )我介绍了用JSP上传文件的方法,提到上传与之对应的便是下载,可能很多网友会说下载直接做个超连接不就可以了,当然对于一般的文件(不怎么重要的,或者是用来共享的)就足够用了,但是涉及到一些安全问题,或者是一些图片,txt,word这类的文件下载时就会碰到问题了,最常见的问题就是当你点击图片的链接时,图片是直接打开而不是提示保存的,可能有的时候你不喜欢直接打开而是直接保存,这时我们就要用到数据流来控制下载,

        长话短说,这里我只提个重点:就是当下载中文名称的文件时,提示保存时显示的文字是乱码,这就是我们今天要重点解决的.

相关资料:

      Java的内核和class文件是基于unicode的,这使Java程序具有良好的跨平台性,但也带来了一些中文乱码问题的麻烦。原因主要有两方面,Java和JSP文件本身编译时产生的乱码问题和Java程序于其他媒介交互产生的乱码问题。

  首先Java(包括JSP)源文件中很可能包含有中文,而Java和JSP源文件的保存方式是基于字节流的,如果Java和JSP编译成class文件过程中,使用的编码方式与源文件的编码不一致,就会出现乱码。基于这种乱码,建议在Java文件中尽量不要写中文(注释部分不参与编译,写中文没关系),如果必须写的话,尽量手动带参数-ecoding GBK或-ecoding gb2312编译;对于JSP,在文件头加上<%@ page contentType="text/html;charset=GBK"%>或<%@ page contentType="text/html;charset=gb2312"%>基本上就能解决这类乱码问题。

  要重点讨论的是第二类乱码,即Java程序与其他存储媒介交互时产生的乱码。很多存储媒介,如数据库,文件,流等的存储方式都是基于字节流的,Java程序与这些媒介交互时就会发生字符(char)与字节(byte)之间的转换,例如从页面提交表单中提交的数据在Java程序里显示乱码等情况。

  如果在以上转换过程中使用的编码方式与字节原有的编码不一致,很可能就会出现乱码。

解决方法:

  对于流行的Tomcat来说,有以下两种解决方法:

  1) 更改 D:/Tomcat/conf/server.xml,指定浏览器的编码格式为“简体中文”:

  方法是找到 server.xml 中的

    <Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
    enableLookups="false" redirectPort="8443" acceptCount="100"
    connectionTimeout="20000" disableUploadTimeout="true" URIEncoding='GBK' />

我实现的代码:

import java.io.*;
import javax.servlet.*;
import javax.servlet.http.*;
import bhcode.bhcommon.bhString;
public class bhDown extends HttpServlet{
   public void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException,IOException{  
   try {  
       String filename = request.getParameter("file");   
    if(filename!=null)
    {   
    String filename2 = new String(request.getParameter("file").getBytes("GBK"),"ISO_8859_1");
    bhString bhstr = new bhString(); //我自己定义的类
    filename2 = bhstr.getFileName(filename2);//用来获取文件名,比如提交的是upload/test.jpg,取得test.jpg
    String rootpath = getServletContext().getRealPath("/");  
    String filepath = rootpath + filename;
    FileInputStream fis = new FileInputStream(filepath);
    ServletOutputStream fout = response.getOutputStream();
     response.setContentType("application/octet-stream;charset=GBK");     
    response.setHeader("Content-disposition","attachment;filename=/""+ filename2 + "/"");  
    int byteRead;   
    while((byteRead = fis.read())!=-1){
       fout.write(byteRead);   
    }
   fis.close();
   fout.close();
   }
    }
    catch (Exception e) {}  
  return;  
   }
   public void doGet(HttpServletRequest request, HttpServletResponse response){
   try{
     doPost(request,response);
  }
  catch(Exception e){}
 }
}

前提:修改配置文件server.xml

    <Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
    enableLookups="false" redirectPort="8443" acceptCount="100"
    connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="GBK"/>

注意红色的就是要加上去的.

好了,原理和重点我都讲了,剩余的任务就是你自己去测试一下了,有什么问题可以直接给我回帖或来信blackhawkcn@126.com  更多文章请关注我的博客,共同交流,共同进步!

本文来自CSDN博客http://blog.csdn.net/chinabh/archive/2006/05/23/751429.aspx

 

 

文件下载(解决中文文件名下载乱码问题)

关键字: jsp

文件下载页面:download.jsp

java 代码
  1. <%@ page contentType="text/html;charset=utf-8" %>   
  2. <%@ page import = "java.util.*" %>   
  3. <%@ page import = "java.io.*" %>   
  4. <%@ page import = "java.net.*" %>   
  5. <%   
  6. //防止IE缓存   
  7. response.setHeader("pragma","no-cache");   
  8. response.setHeader("cache-control","no-cache");   
  9. response.setDateHeader("Expires",0);   
  10. //设置编码   
  11. request.setCharacterEncoding("UTF-8");   
  12.   
  13. String fileName = request.getParameter("fileName");   
  14. //取到文件   
  15. File file = new File(application.getRealPath("/")+"upload/" + fileName);   
  16. response.reset();   
  17. response.setContentType("application/octet-stream;charset=UTF-8");   
  18. //System.out.println(response.getCharacterEncoding());   
  19. //一定要对fileName进行decode   
  20. response.addHeader("Content-Disposition""attachment; filename=" + java.net.URLEncoder.encode(fileName, "UTF-8"));   
  21. response.setContentLength((int) file.length());   
  22.   
  23. byte[] buffer = new byte[4096];   
  24. BufferedOutputStream output = null;   
  25. BufferedInputStream input = null;   
  26.   
  27. // 写缓冲区:   
  28. try {   
  29.     output = new BufferedOutputStream(response.getOutputStream());   
  30.     input = new BufferedInputStream(new FileInputStream(file));   
  31.   
  32.     int n = (-1);   
  33.     while ((n = input.read(buffer, 04096)) > -1) {   
  34.         output.write(buffer, 0, n);   
  35.     }   
  36.     response.flushBuffer();   
  37. }   
  38. catch (Exception e) {   
  39. // maybe user cancelled download   
  40. finally {   
  41.     if (input != null) input.close();   
  42.     if (output != null) output.close();   
  43. }   
  44. %>  

 

 

 

 

response.setHeader(...)下载中文文件名乱码问题

关于中文文件下载的问题,网上的咨询和答疑已经很多,

我原来处理下载的代码如下:

response.setHeader("Content-Disposition", "attachment; filename=" + java.net.URLEncoder.encode(fileName, "UTF-8"));

下载的程序里有了这句,一般在IE6的下载提示框上将正确显示文件的名字,无论是简体中文,还是日文。不过当时确实没有仔细测试文件名很长的中文文件名。 先如今经过仔细测试,发现文字只要超过12个字,就不能下载了。经过好一番google和反复测试,总算对这个问题有了系统的认识,

分列如下: 一. 通过我原来的方式,也就是先用URLEncoder编码,当中文文字超过17个时,IE6 无法下载文件。这是IE的bug,参见微软的知识库文章 KB816868 。原因可能是因为ie在处理 Response Header 的时候,对header的长度限制在150字节左右。而一个汉字编码成UTF-8是9个字节,那么17个字便是108个字节,所以便会报错。微软提供了一个补丁,可以从 这里 下载。这个补丁需要先安装ie6 sp1。因为我平时勤打补丁,我的IE6版本号是 6.0.2800.1106.xpsp2_xxxxx。所以我可能已经安装过了补丁,从而可以下载,但仍然出现文件名被截断的现象。微软让我们等待IE下 一个service pack的发布。我今天也上网看到了好消息,迫于firefox的压力,IE7可能在年中发布。另外,Firefox 不支持这样的方式,将把编码后的%xx%xx直接作为文件名显示。

二. 我尝试使用 javamail 的MimeUtility.encode()方法来编码文件名,也就是编码成 =?gb2312?B?xxxxxxxx?= 这样的形式,并从 RFC1522 中找到对应的标准支持。不过很遗憾,IE6并不支持这一个标准。我试了一下,Firefox是支持的。

三. 按网上很多人提供的解决方案:将文件名编码成ISO8859-1似乎是有效的解决方案,代码如下: response.setHeader( "Content-Disposition", "attachment;filename=" + new String( fileName.getBytes("gb2312"), "ISO8859-1" ) ); 在确保附件文件名都是简 体中文字的情况下,那么这个办法确实是最有效的,不用让客户逐个的升级IE。如果台湾同胞用,把gb2312改成big5就行。但现在的系统通常都加入了 国际化的支持,普遍使用UTF-8。如果文件名中又有简体中文字,又有繁体中文,还有日文。那么乱码便产生了。另外,在我的电脑上Firefox (v1.0-en)下载也是乱码。

折中考虑,我结合了一、三的方式,

代码片断如下: String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");

 if (fileName.length() > 100)

{ String guessCharset = xxxx /*根据request的locale 得出可能的编码,中文操作系统通常是gb2312*/

 fileName = new String(atta.getFileName().getBytes(guessCharset), "ISO8859-1");

}

 response.setHeader("Content-Disposition", "attachment; filename=" + fileName);

 

下面是解决文件名空格问题

String fileName = StringUtils.trim(file.getName());

String formatFileName = encodingFileName(name);

//在后面定义方法encodingFileName(String fileName);

response.setHeader("Content-Disposition", "attachment; filename=" + formatFileName );

//处理文件名中出现的空格

//其中%20是空格在UTF-8下的编码

public static String encodingFileName(String fileName)

{

String returnFileName = "";

 try {

returnFileName = URLEncoder.encode(fileName, "UTF-8");

returnFileName = StringUtils.replace(returnFileName, "+", "%20");

if (returnFileName.length() > 100)

{

returnFileName = new String(fileName.getBytes("GB2312"), "ISO8859-1");

returnFileName = StringUtils.replace(returnFileName, " ", "%20"); } } catch (UnsupportedEncodingException e) { e.printStackTrace();

if (log.isWarnEnabled()) { log.info("Don't support this encoding ..."); } }

 return returnFileName; }

 

 

 

 

 

 

抱歉!评论已关闭.