教你用不同的编码标准解码字符 | 带你学《Java语言高级特性》之六十

简介: 在Java开发过程中,有时会发现自己曾经的代码里汉字部分变成了奇形怪状的字符,这往往是由于字符的编码解码标准不统一引起的,本节将为读者介绍几种常用的编码标准。

上一篇:实战文件流,完成文件拷贝 | 带你学《Java语言高级特性》之五十九
在Java开发过程中,有时会发现自己曾经的代码里汉字部分变成了奇形怪状的字符,这往往是由于字符的编码解码标准不统一引起的,本节将为读者介绍几种常用的编码标准。

【本节目标】
通过阅读本节内容,你将了解到几种常见的编码标准与其表达能力,知道UTF-8是最常用的编码标准,并能够通过代码查看机器的属性,学会强制使用指定的编码标准对数据进行编码或解码。

字符编码

在计算机的世界里面只认0、1的数据。如果要想描述一些文字的编码就需要对这些二进制的数据进行组合,所以才有了现在可以看见的中文。但是在进行编码的时候如果要想正确显示出内容则一定需要有解码,所以编码和解码肯定要采用统一的标准。那么如果不统一的时候就会出现乱码。

那么在实际开发中,对于常用的编码有如下几种:

  • GBK/GB2312:国标编码,可以描述中文信息,其中GB2312只描述简体中文,而GBK包含简体中文和繁体中文;
  • ISO8859-1:国际通用编码,可以用其描述所有的字母信息,如果是象形文字,则需要进行编码处理;
  • UNICODE编码:采用十六进制的方式存储,可以描述所有文字信息;
  • UTF编码:象形文字部分使用十六进制编码,而普通的字母采用 ISO8859-1编码,它的优势在于适合快速的传输,节约带宽,也就成为了开发中首选的编码,主要使用“UTF-8”编码。

如果要想知道当前系统中支持的编码规则,则可以采用如下代码列出全部的本机属性。

范例:列出本机属性

public class JavaAPIDemo {
    public static void main(String[] args) throws Exception {
        System.getProperties().list(System.out);
    }
}

部分信息:
文件的路径分割符:file.separator=;
文件默认编码:file.encoding=UTF-8;

也就是说如果现在什么都不设置,则采用的编码就是UTF-8;

范例:编写程序

import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
public class JavaAPIDemo {
    public static void main(String[] args) throws Exception {
        OutputStream output=new FileOutputStream("D:" + File.separator + "mldn.txt");
        output.write("中华人民共和国万岁".getBytes());
       //   output.write("中华人民共和国万岁".getBytes("utf-8"));
        output.close();
    }
}

此时为默认的处理操作,不设置编码的时候就将采用默认的编码方式进行。

范例:强制性设置编码

import java.io.File;
import java.io.FileOutputStream;
import java.io.OutputStream;
public class JavaApiDemo {
    public static void main(String[] args) throws Exception {
        OutputStream output=new FileOutputStream("D:" + File.separator + "mldn.txt");
        output.write("中华人民共和国万岁".getBytes("ISO8859-1"));
        output.close();      
    }
}

项目中出现的乱码问题就是编码和解码标准不统一,而最好的解决乱码的方式,就是所有的编码都采用“UTF-8”。

想学习更多的Java的课程吗?从小白到大神,从入门到精通,更多精彩不容错过!免费为您提供更多的学习资源。
本内容视频来源于阿里云大学

下一篇:运用内存操作流实现IO操作 | 带你学《Java语言高级特性》之六十一
更多Java面向对象编程文章查看此处

相关文章
|
3月前
|
存储 人工智能 算法
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
这篇文章详细介绍了Dijkstra和Floyd算法,这两种算法分别用于解决单源和多源最短路径问题,并且提供了Java语言的实现代码。
106 3
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
|
2月前
|
监控 Java API
如何使用Java语言快速开发一套智慧工地系统
使用Java开发智慧工地系统,采用Spring Cloud微服务架构和前后端分离设计,结合MySQL、MongoDB数据库及RESTful API,集成人脸识别、视频监控、设备与环境监测等功能模块,运用Spark/Flink处理大数据,ECharts/AntV G2实现数据可视化,确保系统安全与性能,采用敏捷开发模式,提供详尽文档与用户培训,支持云部署与容器化管理,快速构建高效、灵活的智慧工地解决方案。
|
3月前
|
存储 安全 Java
Java Map新玩法:探索HashMap和TreeMap的高级特性,让你的代码更强大!
【10月更文挑战第17天】Java Map新玩法:探索HashMap和TreeMap的高级特性,让你的代码更强大!
91 2
|
9天前
|
自然语言处理 Java
Java中的字符集编码入门-增补字符(转载)
本文探讨Java对Unicode的支持及其发展历程。文章详细解析了Unicode字符集的结构,包括基本多语言面(BMP)和增补字符的表示方法,以及UTF-16编码中surrogate pair的使用。同时介绍了代码点和代码单元的概念,并解释了UTF-8的编码规则及其兼容性。
81 60
|
1天前
|
存储 监控 算法
探秘局域网桌面监控:深入剖析 Java 语言核心算法
在数字化办公时代,局域网桌面监控如同企业的“智慧鹰眼”,确保工作效率与数据安全。本文以Java为载体,揭示哈希表在监控中的关键应用。通过高效的数据结构和算法,哈希表能快速索引设备连接信息,大幅提升监控的时效性和响应速度。代码示例展示了如何用Java实现设备网络连接监控,结合未来技术如AI、大数据,展望更智能的监控体系,助力企业在数字化浪潮中稳健前行。
|
2月前
|
SQL 安全 Java
安全问题已经成为软件开发中不可忽视的重要议题。对于使用Java语言开发的应用程序来说,安全性更是至关重要
在当今网络环境下,Java应用的安全性至关重要。本文深入探讨了Java安全编程的最佳实践,包括代码审查、输入验证、输出编码、访问控制和加密技术等,帮助开发者构建安全可靠的应用。通过掌握相关技术和工具,开发者可以有效防范安全威胁,确保应用的安全性。
59 4
|
3月前
|
存储 Java API
优雅地使用Java Map,通过掌握其高级特性和技巧,让代码更简洁。
【10月更文挑战第19天】本文介绍了如何优雅地使用Java Map,通过掌握其高级特性和技巧,让代码更简洁。内容包括Map的初始化、使用Stream API处理Map、利用merge方法、使用ComputeIfAbsent和ComputeIfPresent,以及Map的默认方法。这些技巧不仅提高了代码的可读性和维护性,还提升了开发效率。
127 3
|
3月前
|
存储 安全 Java
Java Map新玩法:深入探讨HashMap和TreeMap的高级特性
【10月更文挑战第19天】Java Map新玩法:深入探讨HashMap和TreeMap的高级特性,包括初始容量与加载因子的优化、高效的遍历方法、线程安全性处理以及TreeMap的自然排序、自定义排序、范围查询等功能,助你提升代码性能与灵活性。
33 2
|
3月前
|
Java 程序员 编译器
在Java编程中,保留字(如class、int、for等)是具有特定语法意义的预定义词汇,被语言本身占用,不能用作变量名、方法名或类名。
在Java编程中,保留字(如class、int、for等)是具有特定语法意义的预定义词汇,被语言本身占用,不能用作变量名、方法名或类名。本文通过示例详细解析了保留字的定义、作用及与自定义标识符的区别,帮助开发者避免因误用保留字而导致的编译错误,确保代码的正确性和可读性。
71 3
|
3月前
|
移动开发 Java 大数据
深入探索Java语言的核心优势与现代应用实践
【10月更文挑战第10天】深入探索Java语言的核心优势与现代应用实践
117 4