Tomcat JSP Web 開發(fā)中的亂碼問題小結(jié)
1. 靜態(tài)頁面的亂碼問題
文件的編碼和瀏覽器要顯示的編碼不一致。
1) 檢查文件原始的編碼, 可以用記事本打開, 然后選擇另存為來看;
2) 給當(dāng)前頁面加入一個指令來建議瀏覽器用指定的編碼來顯示文件字符內(nèi)容.
<meta http-equiv="content-type" content="text/html; charset=GBK">
3) 如果系統(tǒng)是英文XP,沒裝東亞字符集支持, 也會顯示亂碼.
2. JSP 頁面的亂碼問題
1) page 指令有個 pageEncoding="GBK" 這個會指定當(dāng)前頁面保存的編碼, 如果寫成
ISO8859-1 就不能保存漢字;
2) page 指令的 contentType="text/html; charset=ISO8859-1" 也會像靜態(tài)頁面一樣讓
瀏覽器來優(yōu)先選擇一種編碼.
如果JSP 亂碼的話,一般就顯示成?,而且不管你給瀏覽器選什么樣的編碼,它都不能正
確顯示
3. 表單提交的亂碼問題(Tomcat 特有)
1). POST 的亂碼
MyEclipse 6 Java 開發(fā)中文教程
157 劉長炯著
a. 首先瀏覽器提交表單的編碼是根據(jù)表單所在頁面來決定的, 而不是根據(jù)提交后的
JSP 頁面的編碼來決定的. 把所有的頁面的編碼都設(shè)置成一樣的,例如 GBK.
b. 處理方式就是在獲取參數(shù)之前設(shè)置編碼:
request.setCharacterEncoding("GBK");
c. 可以用過濾器的方式來解決, Tomcat 已經(jīng)帶了一個現(xiàn)成的:
apache-tomcat-5.5.23\webapps\jsp-examples\WEB-INF\classes\filters\SetCharacter
EncodingFilter.java
web.xml
<filter>
<filter-name>Set Character Encoding</filter-name>
<filter-class>filters.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>GBK</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>Set Character Encoding</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
2) GET 方式的亂碼
用 setCharacterEncoding() 不能解決. TOMCAT 的一個BUG, GET 方式傳送的表單參
數(shù)總是用的 ISO8859-1 編碼. 我們要把它轉(zhuǎn)成 GBK 方式.
String username = request.getParameter("username");
System.out.println(username);
// 轉(zhuǎn)碼, 先取得原始的二進(jìn)制字節(jié)數(shù)組
byte[] data = username.getBytes("ISO8859-1");
// 根據(jù)新的字符集再構(gòu)造新的字符串
username = new String(data, "GBK");
小結(jié):
所有的頁面(除了最后的 GET 的亂碼問題)都用統(tǒng)一的編碼(GBK 或者UTF-8), 就不會出現(xiàn)
亂碼問題
以上內(nèi)容為【轉(zhuǎn)】
下面是一個完整的過濾器例子:
package filters;
import java.io.IOException;
import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletRequestWrapper;
public class TomcatFormFilter implements Filter {
/**
* Request.java 對 HttpServletRequestWrapper 進(jìn)行擴(kuò)充, 不影響原來的功能并能提供所 有的
* HttpServletRequest 接口中的功能. 它可以統(tǒng)一的對 Tomcat 默認(rèn)設(shè)置下的中文問題進(jìn)行解決而只 需要用新的 Request
* 對象替換頁面中的 request 對象即可.
*/
class Request extends HttpServletRequestWrapper {
public Request(HttpServletRequest request) {
super(request);
}
/**
* 轉(zhuǎn)換由表單讀取的數(shù)據(jù)的內(nèi)碼. 從 ISO 字符轉(zhuǎn)到 GBK.
*/
public String toChi(String input) {
try {
byte[] bytes = input.getBytes("ISO8859-1");
return new String(bytes, "utf-8");
} catch (Exception ex) {
}
return null;
}
/**
* Return the HttpServletRequest holded by this object.
*/
private HttpServletRequest getHttpServletRequest() {
return (HttpServletRequest) super.getRequest();
}
/**
* 讀取參數(shù) -- 修正了中文問題.
*/
public String getParameter(String name) {
return toChi(getHttpServletRequest().getParameter(name));
}
/**
* 讀取參數(shù)列表 - 修正了中文問題.
*/
public String[] getParameterValues(String name) {
String values[] = getHttpServletRequest().getParameterValues(name);
if (values != null) {
for (int i = 0; i < values.length; i++) {
values[i] = toChi(values[i]);
}
}
return values;
}
}
public void destroy() {
}
public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) throws IOException,
ServletException {
HttpServletRequest httpreq = (HttpServletRequest) request;
if (httpreq.getMethod().equals("POST")) {
request.setCharacterEncoding("utf-8");
} else {
request = new Request(httpreq);
}
response.setCharacterEncoding("utf-8");
chain.doFilter(request, response);
}
public void init(FilterConfig filterConfig) throws ServletException {
}
}
web.xml中加入如下配置信息
<filter>
<filter-name>TomcatFormFilter</filter-name>
<filter-class>filters.TomcatFormFilter</filter-class>
</filter>
<filter-mapping>
<filter-name>TomcatFormFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
上述都是使用統(tǒng)一的GBK編碼,如果想用utf-8編碼的話,稍作修改就可以了。
在解決了JSP亂碼問題之后,還有一個問題,就是數(shù)據(jù)庫亂碼問題。
我使用的數(shù)據(jù)庫是mysql
在hibernate的配置文件中加入
<property name="connection.useUnicode">true</property>
<property name="connection.characterEncoding">UTF-8</property>
就算是一整套的中文解決方案了。