Java-IO流 文件的编码

2017-05-06 02:40
  • 文件的编码
  • package cn.test;
    
    import java.io.UnsupportedEncodingException;
    
    public class Demo15 {
        public static void main(String[] args) throws UnsupportedEncodingException {
            String str = "你好ABC123";
            byte[] b1 = str.getBytes();//转换成字节系列用的是项目默认的编码
            for (byte b : b1) {
                //把字节(转换成了int)以十六进制方式显示
                System.out.print(Integer.toHexString(b & 0xff) + "  ");
            }
            
            System.out.println("");
            //utf8编码,中文占用3个字节,英文和数字占用1个字节
            byte[] b2 = str.getBytes("utf8");
            for (byte b : b2) {
                System.out.print(Integer.toHexString(b & 0xff) + "  ");
            }
            
            System.out.println("");
            //gbk编码,中文占用两个字节,英文和数字占用1个字节
            byte[] b3 = str.getBytes("gbk");
            for (byte b : b3) {
                System.out.print(Integer.toHexString(b & 0xff) + "  ");
            }
            
            System.out.println("");
            //java是双字节编码 utf-16be
            //utf-16be编码,中文占2个字节,英文和数字也占用2个字节
            byte[] b4 = str.getBytes("utf-16be");
            for (byte b : b4) {
                System.out.print(Integer.toHexString(b & 0xff) + "  ");
            }
            
            System.out.println("");
            //当字节序列是某种编码时,这时候想把字节序列变成字符串,也需要用这种编码方式,否则会出现乱码
            String str1 = new String(b4);//使用项目默认的编码
            System.out.println(str1);
            String str2 = new String(b4, "utf-16be");
            System.out.println(str2);
        }
    }

      执行结果:

    e4  bd  a0  e5  a5  bd  41  42  43  31  32  33  
    e4  bd  a0  e5  a5  bd  41  42  43  31  32  33  
    c4  e3  ba  c3  41  42  43  31  32  33  
    4f  60  59  7d  0  41  0  42  0  43  0  31  0  32  0  33  
    O`Y}ABC123
    你好ABC123

      文本文件就是字节序列,可以是任意编码的字节序列。

      如果我们在中文机器上直接创建文本文件,那么该文本文件只认识ansi编码(中文系统下,ansi编码代表gbk编码)