在使用JSP的过程中,最使人头疼的一个问题就是中文乱码问题,以下是我在软件开发中遇到的乱码问题以及解决方法。
1 POST提交表单是乱码
常见的情况为:页面都正常,但新插入的数据全是乱码.
这种情况,就是因为提交的数据被程序接收后就是乱码,这个乱码又插入数据库了,所以显示不正常
解决方案:
a 修改配制来完成
修改tomcat的配制文件server.xml中的连接器,加上URIEncoding="GB2312"就OK了
b 自己写编码转换程序
b.a 在与表单交换数据的时候,做转换,这种方式灵活
每一个页面请求写一个转换,或者写一个公共的类,在接收的时候,都做一下转移,代码如下:
- public static String ISOGBChange(String s)
- {
- return EncodeChange(s,"ISO8859-1","GB2312");
- }
- public static String EncodeChange(String s,String source_encode,String dest_encode)
- {
- if(s==null)
- return null;
- try
- {
- byte[] tmpbyte = s.getBytes(source_encode);
- s = new String(tmpbyte,dest_encode);
- return s;
- }
- catch (Exception e)
- {
- return "ERROR";
- }
- }
b.b 使用tomcat的web.xml中定义的过滤器filter来转换所有的请求编码
这个需要自己去研究一下过滤器的写法,再具体的转换编码,还是b.a中的代码进行编码转换的,只是转移不用再写在每个程序中了.
2 数据库中本来就是乱码
就是说数据库里面的数据本来就是乱码,无论您用什么编码连接数据库,查看到的都是乱码.如何确定数据库中本来就是乱码呢?(其实也不太容易确定,我们仅给出一个大概的判断)
您用客户端连接数据库的时候,一定要选择连接编码为GB2312,UTF-8,ISO-8859-1等常见的编码格式,连接并查看您的表中内容是不是正常的,若没有一种情况是正常的,应该就可以判定为乱码了.
当然,这个判定并不标准,甚至问题很多,但在国内,我想99%以上都用这几种编码.所以我认为这个判定准确性是可以被接受的.
解决方案:您用客户端连接数据库的时候,一定要选择连接编码为GB2312或者GBK,然后于重新执行数据库脚本,保证数据库里保存的是正常的字符.而不是乱码
3 从数据库提取出来就是乱码
数据库里本来是正常的,但用JAVA连接后,一经提取,就全乱了.
解决方案:修改JAVA连接数据库的URL,加上或者修改URL中的编码为UTF-8,characterEncoding=UTF-8,若是hibernate的配置问题,jdbc连接url不能有&符号,会导致出错或者后面不生效,我用&代替就好了
不要以为用的是GB2312这里就指定为GB2312(个人认为若指定为GB2312,驱动又多做了一次编码转换,所以就又成了乱码了)
当然,也可能驱动太旧等情况
上面只说了常见的几种,乱码问题95%以上的应该都是上面讲到的,还有很多情况,就需要您自己慢慢分析了。