java乱码有哪几种可能?
java乱码有哪几种可能?乱码跟JAVA没有半毛钱关系,但是JAVA开发中乱码问题随处可见!
先解释下乱码是怎么产生的:
我们都知道计算机机器识别的是电信号,也就是高低电平,对应数字中的1和0,也就是说所有语言在最后执行的时候都是解释为0和1了,我们把原本的文字,字母,符号转化为二进制数据(0和1的序列)称之为编码,反过来称之为解码!
最早的编解码规则是美国定制的ASCII(美国信息交换标准代码),把a-z,A-Z,还有键盘上的一些键(空格,tab等)定义了一套转化,比如A是65,对应的二进制为01000001。
但是ASCII是对英语量身定做的,对于中文汉字等不提供支持,所以国家专门提出了第一个中文编码GB2312,但是GB2312也只提供六千多个字的编码,中文博大精深没法覆盖,于是全新的GBK,utf-8等支持中文的编码相继出现,后来GBK和utf-8广泛应用在我们的日常开发中。
但是由于各种编码方式的标准不同,相同的字也可能会得到不同的编码,解码的时候也会差异巨大,比如编码的时候用utf-8,解码的时候使用GBK,解释出来的文字可能就是乱码了!
那为什么说JAVA中的乱码很多呢?因为乱码主要发生在网页,数据库存取时,都是JAVA的常用场景,举例如下:
①,页面使用gb2312,后台传数据使用别的编码,可尽量选择同一个编码方式!
②,后台接受参数为乱码,比如使用tomcat,就很容易出现乱码,通常在tomcat的server.xml文件中设置解码方式,和应用程序中添加字符过滤!
③,读取文件出现乱码,按照文件的编码定义方式来解码,读取!
④,数据库根据需要选择与业务系统对应的编解码方式!
解决办法:尽量使用同一种编解码标准!
乱码也算是开发中比较基本,也比较折磨人的问题了,只要注意编解码对应上就行了。