之前舊的部落格發過幾篇解決 Tomcat 中文亂碼問題的文章,確實是解決了一些中文顯示的問題,但今天在 Struts2 時,又再度遇到中文亂碼的問題,所以想把幾個可能忽略的步驟記錄下來。

其實解決中文亂碼,只要把所有的編碼格式都調整成一致,比如說,編輯器預設儲存編碼為 Big5,卻把頁面設定成 <%@ page contentType=”text/html; charset=utf-8″ %>,這樣一來,在瀏覽器開啟的網頁,中文就會是亂碼。(反過來也會是亂碼)。唯有兩者設定都是相同編碼的時候,在網頁上才能正確顯示中文。
上面提到,把所有的編碼都設成 Big5,這麼一來,也符合了「所有編碼都設為相同」的原則,當然包括編輯器預設儲存編碼也是 Big5,如此網頁可以正確顯示中文字,但是 … 如果後端需要加上 MySQL 資料庫,如何在表單跟 MySQL 之間正確傳遞中文,可能又會是一個花時間的問題,經過幾番折騰之後,決定把所有的編碼都設定為 utf-8 比較方便。

  1. 編輯器預設儲存編碼 => 設定成 UTF-8
    以 EditPlus3 為例,可從「工具」->「偏好項」->「檔案」->「預設編碼模式」改成 UTF-8,
    注意之前可能存成 Big5 的,可以按另存新檔後,最下面編碼模式可以改變。
  2. 每個 JSP 頁面 charset 設定成 UTF-8
    e.g. <%@ page contentType=”text/html; charset=utf-8″ %>
  3. MySQL my.ini 設定成
    [client]
    default-character-set=utf8
    [mysqld]
    default-character-set=utf8
  4. 資料庫、資料表及欄位的 character-set 設為 utf8,collation(校對)設定為utf8_unicode_ci。
  5. 資料庫連結部份改成
    Connection con=DriverManager.getConnection(“jdbc:mysql://localhost/user?useUnicode=true&characterEncoding=utf8“, “帳號”, “密碼”);
  6. Servlet 部份同樣把 charset 設定成 UTF-8
    e.g. request.setContentType(“text/html; charset=utf-8”);
  7. GET 亂碼解決 => 在 %TOMCAT_HOME%\conf\server.xml 中,找到 <connector port=”8080″ … 部分,加上 URIEncoding = “UTF-8”,重啟 Tomcat。
  8. POST 亂碼解決 => 若是有多個網站,將 %TOMCAT_HOME%\webapps\jsp-examples\WEB-INF\classes\filters\SetCharacterEncodingFilter.class 複製到%TOMCAT_HOME%\shared\classes\filters 下,(若沒有資料夾可以自己新增),修改 %TOMCAT_HOME%\webapps\(mytest)\WEB-INF\web.xml (mytest 為網站目錄),加上以下內容

    <filter>
      <filter-name>SetCharacterEncoding</filter-name>
      <filter-class>filters.SetCharacterEncodingFilter</filter-class>
      <init-param>
        <param-name>encoding</param-name>
        <param-value>Big5</param-value>
      </init-param>
      </filter>
      <filter-mapping>
        <filter-name>SetCharacterEncoding</filter-name>
        <url-pattern>/*</url-pattern>
      </filter-mapping>

    若有多個網站,就修改每個網站下的 WEB-INF\web.xml 檔案,完成後,重啟湯姆貓。

照著這些步驟做,應該就能有個能正確顯示中文的平台(或許吧!至少小蛙現在的環境就是)如果發現什麼問題,再隨時補上。
2009/07/31 補充:
在使用 Prototype.js 的 Updater / Requester function 時,編碼為 big5 傳遞中文會發生亂碼,
PHP 的解決方式 -> header(“Content-Type:text/html;charset=BIG5”);
JSP 解決方式 ->  response.setHeader(“Charset”,”BIG5″); 
這裡 AJAX 的傳遞方式要用 get
(參考資料: Real-Blog)

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *