2009年2月25日 星期三

Shape檔案圖資編碼的轉換

ESRI Shape的BDF使用Big5中文編碼,僅支援之13,060個中英文字,對處理地理資料實在不夠用,若要處理多國語言更是沒有辦法。有兩個辦法解決這個問題,第一使用空間資料庫來存放資料,可以參考這篇;第二使用utf-8編碼的DBF檔案。要如何將big5的dbf檔案轉成utf-8呢?答案是使用QGIS,方法如下的步驟一、二,若要編輯屬性資料請參考驟三。

一、開啟Big5編碼的ESRI Shap,如下圖

若您的檔案不是Big5,則要選取對應的編碼,目前QGIS支援的編碼有BIG5-HKSCS、EUCJP、EUCKR、GB2312、GBK、GB18030、JIS7、SHIFT-JIS、TSCII、UTF-8、UTF-16、KOI8-R、KOI8-U、ISO8859-1、ISO8859-2、ISO8859-3、ISO8859-4、ISO8859-5、ISO8859-6、ISO8859-7、ISO8859-8、ISO8859-8-I、ISO8859-9、ISO8859-10、ISO8859-13、ISO8859-14、ISO8859-15、IBM 850、IBM 866、CP874、CP1250、CP1251、CP1252、CP1253、CP1254、CP1255、CP1256、CP1257、CP1258、Apple Roman及TIS-620。

2009-02-25_104112

二、另存成utf-8編碼的shape檔案,方法如下兩的畫面

2009-02-25_105411

2009-02-25_105534

三、改屬性資料

  1. 點選unicode圖層
  2. 按開啟[屬性工作表]按鈕
  3. 按[切換編輯狀態]按鈕
  4. 找到要編輯的資料,例子是 蕃薯”藔”廳,「藔」字在Big5中無此字。
  5. 關閉且存回資料

2009-02-25_110241

2009-02-25_110307

使用QGIS兩個步驟就完成Shape檔Big5編碼轉utf-8編碼,非常地簡單。之後用QGIS開啟也是非常地簡單。若要用ArcGIS或SuperGIS開啟utf-8編碼Shape,請先禱告後,再參考這篇文章