台島萬里行 – 地名Gazetteer

一般網路的使用者要找台灣的全地名蒐錄﹝中英文﹞,最後必然會跑到:

* 臺灣地區地名查詢系統建置計畫

這是中研院歷史語言研究所、中研院計算中心和內政部﹝不知道哪個轄下單位﹞所共同開發的系統。這系統內有不少豐富的資料,但若是快速查詢就顯得有些不能負荷。一來是系統設計可能以學務研究性質為主,所以對使用者的親和度差了些,二來這計畫也告一段落,因此內外連的URI有不少早已失效。我的問題來了,如果我要找兩萬筆左右的中英文台灣地名對照名單,那麼除了這套系統之外,我有什麼樣的選擇和資源?

三年多前我逛到GeoCommunity,發現他們竟然在販售全台的地名資料。這下好了,只要開個十塊美金的帳號就能通通抓下來,那我為什麼還要辛苦的找台灣網路上的資料?可是這樣作也不是沒有問題。下載的兩萬六千多筆地名資料,只有英文,沒有中文。如果我要抓中英對照,只能透過清單中所給的經緯度再猜個大概。這可是極為耗費心神的工人智慧啊!

但我需要這筆資料。我跑台島萬里,其中的一個目的就是希望能將跑過的地名透過英文來表達。我跑的路線遍佈全台,所以常用的標準英文譯名絕對不夠我使用。如果有個現成的地名對照表,那麼我在各網站下CGM(consumer_generated media)媒體的標籤﹝tag﹞時,直接沿用通俗泛稱即行,省得自己使用漢語還是通用拼音,猜個半天還弄不出來。就算弄出來了,也無法和現有的台灣英文觀光資源做個表面上的「連結」。

這譯命名的問題還真是令人頭痛啊。:(

5 thoughts on “台島萬里行 – 地名Gazetteer

  1. 台灣地區地名整合檢索系統的中文部分看來還算完整,但好像沒有英譯。

  2. “台灣地區地名整合檢索系統"有英譯,和中研院那套應該是系出同門。但是英譯的部分只有到縣市和各鄉鎮,小一點的地名就沒有了。:p

  3. 剛剛在「線上地名譯寫系統」的「3.現有成果檢索」挑了幾個縣的資料試了一下,村里聚落名稱都有英譯(通用拼音)。

    我也注意到,即使是審核過的英譯也還是會有錯誤。例如「林森」在資料庫中審核過的拼法是 Linsen,但因為這是全名(「林」是姓,「森」是名),應拼寫為 Lin Sen 才對。不過,對你的用途來說,應該是可以不用在意這類細節吧。

  4. 我的作法是會到下面的網站(IE-only):

    http://140.111.34.69:8080/nationallibrary/index.jsp

    到 “中文單字譯音查詢" 去查中文單字的譯音。然後 tag 的時候用漢語、通用系統並行,再配合中文。

    這樣的作法也很像外交部在辦護照時,處理中文人名的方式。我記得外交部辦護照的網頁有注音符號與英語對照表,你可以去找看看。

    路牌的外文問題一直很大。

  5. 補:從傅瑞德兄那裡看到的訊息

    Korea to build open source national map system
    http://z.la/pg2vh

    南韓用開放原始碼計畫重劃市街
    http://z.la/qbm94

    慚愧。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s

%d 位部落客按了讚:
search previous next tag category expand menu location phone mail time cart zoom edit close