2007年8月23日 星期四

用gedit開啟各種編碼的純文字文件

以往在Windows上頭,要處理不同語言編碼的純文字文件,最方便的工具是EmEditor,然而EmEditor是商業軟體,必須花錢購買使用。而在Linux上頭,我似乎沒有看到媲美EmEditor的軟體。但其實擁有相同功能的軟體,就近在眼前-gedit

gedit是GNOME桌面環境內建的輕量級文字編輯器,如果在Windows上頭就相當於筆記本(Notepad),但是gedit的功能相對於筆記本要來的強大許多,像是存取各種語言編碼的文件就是最好的例子。不過要讓gedit能夠處理各種編碼的文件,還需要動點手腳...。以設定成中文安裝的Ubuntu Linux來說,上頭的gedit只能開啟以UTF-8、繁體中文與簡體中文編碼的檔案,開啟其他編碼的文件則會變成亂碼。不過只需要修改一些設定,就可以讓gedit處理各種編碼的文件。下面以安裝有Ubuntu Linux的環境來說明,其他的Linux應該也是大同小異,但是安裝其他桌面環境的除外!

首先要開啟GNOME的組態編輯器,最方便的作法是按下Alt+F2,然後輸入gconf-editor,按下執行。
gconf-editor

開啟之後,展開apps/gedit-2/preferences/encodings。
gconf-gedit

選擇auto_detected,點兩下開啟。這個設定鍵所設定的鍵值代表著gedit在開啟文件時,能夠自動辨識哪些語言的編碼。
edit key

因為我經常需要編輯以日文編碼的cuesheet檔案,所以我就把ISO-2022-JP、SHIFT_JIS與EUC-JP三種編碼給新增進去。按一下新增。
add new key
新增完之後,記得將你常用的編碼往上移。

而show_in_menu這個設定鍵的鍵值,則是可以讓你以指定的編碼來開啟或儲存檔案。你可以在此處新增你需要的編碼,或者直接在gedit中新增。在「字元編碼」這個下拉式選單中選擇「加入或移除」。
open file

選擇你需要的編碼之後,按「新增」。
add encoding

EmEditor的介面,對使用者來說或許是比較方便的,因為你不需要額外設定,就可以在右下角的狀態列上直接選擇各種編碼。但是現在我可以理解gedit的介面沒有如此設計的理由,因為gedit具備自動偵測編碼的功能,如此根本不需要在開啟時另外選擇其他的編碼。