java乱码有哪几种可能?乱码跟JAVA没有半毛钱关系,但是JAVA开发中乱码问题随处可见!

先解释下乱码是怎么产生的:

我们都知道计算机机器识别的是电信号,也就是高低电平,对应数字中的1和0,也就是说所有语言在最后执行的时候都是解释为0和1了,我们把原本的文字,字母,符号转化为二进制数据(0和1的序列)称之为编码,反过来称之为解码!

最早的编解码规则是美国定制的ASCII(美国信息交换标准代码),把a-z,A-Z,还有键盘上的一些键(空格,tab等)定义了一套转化,比如A是65,对应的二进制为01000001。

java乱码有哪几种可能

但是ASCII是对英语量身定做的,对于中文汉字等不提供支持,所以国家专门提出了第一个中文编码GB2312,但是GB2312也只提供六千多个字的编码,中文博大精深没法覆盖,于是全新的GBK,utf-8等支持中文的编码相继出现,后来GBK和utf-8广泛应用在我们的日常开发中。

但是由于各种编码方式的标准不同,相同的字也可能会得到不同的编码,解码的时候也会差异巨大,比如编码的时候用utf-8,解码的时候使用GBK,解释出来的文字可能就是乱码了!

java乱码有哪几种可能

那为什么说JAVA中的乱码很多呢?因为乱码主要发生在网页,数据库存取时,都是JAVA的常用场景,举例如下:

①,页面使用gb2312,后台传数据使用别的编码,可尽量选择同一个编码方式!

②,后台接受参数为乱码,比如使用tomcat,就很容易出现乱码,通常在tomcat的server.xml文件中设置解码方式,和应用程序中添加字符过滤!

③,读取文件出现乱码,按照文件的编码定义方式来解码,读取!

④,数据库根据需要选择与业务系统对应的编解码方式!

解决办法:尽量使用同一种编解码标准!

乱码也算是开发中比较基本,也比较折磨人的问题了,只要注意编解码对应上就行了。