1.在计算机中是没有字符的,所有的字符都需要编码后存入计算机中,当然拿出来的时候也需要解码,所以如果你两个过程用的编码方式不同,就出现了乱码。
2.严格来讲java只能判断简单的乱码 例如:用正则表达式判断一行字符串是否有字母,数字,等等吧 但是不准确。乱码一般情况下是没有字母或者数字的。但是java没法准确的判断字符串是否为乱码。解决办法就是自己定义一种编码(比如utf-8),只要不是此编码的都认定为乱码。
项目中有一个功能 在IE中GET方式提交会产生乱码 但有两个入口都会走这同一段代码
固不能直接转码,所以要进行判断传过来的该值是不是乱码
可用以下方式验证:
[java] view plain copy
java.nio.charset.Charset.forName("GBK").newEncoder().canEncode("测试") //判断是不是GBK编码 即是否乱码
[java] view plain copy
//使用request.getQueryString()获取通过URL传过来的值 有可能是乱码 如:q=éæ¥
String s = request.getQueryString();
if(s!=null){
if(!(java.nio.charset.Charset.forName("GBK").newEncoder().canEncode(s))){
try {
s = new String(request.getQueryString().getBytes("ISO-8859-1"),"UTF-8");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
}
}
PS:看着挺复杂的。以上方式可用。