现在的位置: 首页 > 综合 > 正文

批量把文件编码由GBK转为UTF8

2013年10月15日 ⁄ 综合 ⁄ 共 6677字 ⁄ 字号 评论关闭

 

import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.OutputStreamWriter;
import java.io.UnsupportedEncodingException;
import java.text.MessageFormat;

/**
 * 批量把文件编码由GBK转为UTF8,可以继续完善做成在命令行中执行的程序,
 * 可以添加文件名过滤等功能,暂时未实现。
 *
 * @author tony tan
 * @since 2011-7-26
 */
public class FileGBK2UTF8 {

    public static void main(String[] args) {
        //需要转换的文件目录
        String fromPath = "D:\\workspace\\03src";
        //转换到指定的文件目录
        String toPath = "D:\\workspace\\03src1";
       
        info("start transform [from path]={0} [to path]={1}", fromPath, toPath);
       
        //递归取到所有的文件进行转换
        transform(fromPath, toPath);
    }
   
    /**
     * 把一个目录中的文件转换到另一个目录中
     * @param fromPath -- 来源文件目录
     * @param toPath -- 目标文件目录
     * @return
     */
    public static boolean transform(String fromPath, String toPath) {
        File ftmp = new File(fromPath);
        if (!ftmp.exists()) {
            info("转换文件路径错误!");
            return false;
        }
       
        info("frompath is [{0}], topath is [{1}]", fromPath, toPath);
       
        //如果是文件,则转换,结束
        if (ftmp.isFile()) {
            byte[] value = fileToBytes(fromPath);
            String content = convEncoding(value, "gbk", "utf-8");
            return saveFileUtf8(toPath, content);
        } else {
            //查找目录下面的所有文件与文件夹
            File[] childFiles = ftmp.listFiles();
            for (int i = 0, n = childFiles.length; i < n; i++) {
                File child = childFiles[i];
                String childFrom = fromPath + "/" + child.getName();
                String childTo = toPath + "/" + child.getName();
               
                transform(childFrom, childTo);
            }
        }
       
        return true;
    }
   
    /**
     * 把文件内容保存到指定的文件中,如果指定的文件已存在,则先删除这个文件,
     * 如果没有则创建一个新文件,文件内容采用UTF-8编码方式保存。
     * 如果指定的文件路径不存在,则先创建文件路径,文件路径从根目录开始创建。
     *
     * @param fileName -- 文件路径
     * @param content -- 文件内容
     * @return
     */
    public static boolean saveFileUtf8(String fileName, String content) {
        if (fileName == null || fileName.length() == 0)
            return false;
        if (content == null) return false;
       
        //路径中的\转换为/
        fileName = fileName.replace('\\', '/');
        //处理文件路径
        createPath(fileName.substring(0, fileName.lastIndexOf('/')));
       
        File file = null;
        FileOutputStream out = null;
        try {          
            //创建或修改文件
            file = new File(fileName);
           
            if (file.exists()) {
                file.delete();
            } else {
                file.createNewFile();
            }
           
            out = new FileOutputStream(file);
            //添加三个字节标识为UTF-8格式,也是BOM码
            //out.write(new byte[]{(byte)0xEF,(byte)0xBB,(byte)0xBF});
            out.write(content.getBytes("UTF-8"));
        } catch (FileNotFoundException e) {
            e.printStackTrace();
            return false;
        } catch (IOException e) {
            e.printStackTrace();
            return false;
        } finally {
            if (out != null) {
                try {
                    out.flush();
                    out.close();
                } catch (IOException e) {
                    e.printStackTrace();
                    return false;
                }
            }
        }

        return true;
    }
   
    /**
     * 把文件内容转换为字节数组输出。
     * @param fileName -- 文件名
     * @return
     */
    public static byte[] fileToBytes(String fileName) {
        FileInputStream ins = null;
        ByteArrayOutputStream bos = null;
        try {
            //创建文件读入流
            ins = new FileInputStream(new File(fileName));
            //创建目标输出流
            bos = new ByteArrayOutputStream();
           
            //取流中的数据
            int len = 0;
            byte[] buf = new byte[256];
            while ((len = ins.read(buf, 0, 256)) > -1) {
                bos.write(buf, 0, len);
            }
           
            //目标流转为字节数组返回到前台
            return bos.toByteArray();
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            try {
                if (ins != null) {ins.close(); ins = null;}
                if (bos != null) {bos.close(); bos = null;}
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
       
        return null;
    }
   
    /**
     * 检查指定的文件路径,如果文件路径不存在,则创建新的路径,
     * 文件路径从根目录开始创建。
     *
     * @param filePath
     * @return
     */
    public static boolean createPath(String filePath) {
        if (filePath == null || filePath.length() == 0)
            return false;
       
        //路径中的\转换为/
        filePath = filePath.replace('\\', '/');
        //处理文件路径
        String[] paths = filePath.split("/");
       
        //处理文件名中没有的路径
        StringBuilder sbpath = new StringBuilder();
        for (int i = 0, n = paths.length; i < n; i++) {
            sbpath.append(paths[i]);
            //检查文件路径如果没有则创建
            File ftmp = new File(sbpath.toString());
            if (!ftmp.exists()) {
                ftmp.mkdir();
            }
           
            sbpath.append("/");
        }
       
        return true;
    }
   
    /**
     * 取路径中的文件名
     * @param path -- 文件路径,含文件名
     * @return
     */
    public static String getFileName(String path) {
        if (path == null || path.length() == 0) return "";
       
        path = path.replaceAll("\\\\", "/");
        int last = path.lastIndexOf("/");
       
        if (last >= 0) {
            return path.substring(last+1);
        } else {
            return path;
        }
    }
   
    /**
     * 字符串的编码格式转换
     * @param value -- 要转换的字符串
     * @param oldCharset -- 原编码格式
     * @param newCharset -- 新编码格式
     * @return
     */
    public static String convEncoding(byte[] value, String oldCharset, String newCharset) {
        OutputStreamWriter outWriter = null;
        ByteArrayInputStream byteIns = null;
        ByteArrayOutputStream byteOuts = new ByteArrayOutputStream();
        InputStreamReader inReader = null;
   
        char cbuf[] = new char[1024];
        int retVal = 0;
        try {
            byteIns = new ByteArrayInputStream(value);
            inReader = new InputStreamReader(byteIns,
                    oldCharset);
            outWriter = new OutputStreamWriter(byteOuts,
                    newCharset);
            while ((retVal = inReader.read(cbuf)) != -1) {
                outWriter.write(cbuf, 0, retVal);
            }
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            try {
                if (inReader != null) inReader.close();
                if (outWriter != null) outWriter.close();
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
       
        String temp = null;
        try {
            temp = new String(byteOuts.toByteArray(), newCharset);
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        //System.out.println("temp" + temp);
        return temp;
    }
   
    /**
     * 显示提示信息
     * @param message -- 信息内容
     * @param params -- 参数
     */
    private static void info(String message, Object... params) {
        message = MessageFormat.format(message, params);
       
        System.out.println(message);
    }
}

抱歉!评论已关闭.