本短文五千多字,寫在 Open Campus 活動舉辦之前,據說會刊在營隊的手冊當中。內文資料的參考來源是 wiki.opendata.tw 以及我寫的這一篇。台灣的現況我很簡短的帶過,之後會把目前發展的狀況,再畫圖表一張呈現。感謝張維志兄在手冊部分的大力翻譯。

開放資料的定義

我們對於開放資料 (Open Data) 的定義取自於由英國開放知識基金會所主導,台灣的青平台基金會負責中文翻譯的 “Open Data Handbook” 一書。關於「開放資料」的完整定義,書中有更詳細的說明,在此我們僅列出其中最重要的幾點。但請記住,由於這是一個新興而且正在蓬勃發展的運動,因此所有的定義都會隨著時間而有所改變,但基本的精神是不變的:

1.資訊近用 (accessibility) : 資料必須完整釋出,同時只能徵收適當的資料再製成本費用。最好能提供網路下載。同時提供的資料格式也必須是方便和可被修改的。

2. 重新使用與散佈 (Reuse and Redistribution) : 資料在釋出時必須允許資料重新使用和散佈,並允許與其他資料混合使用的授權聲明。

3. 分享的普遍性 (Universal Participation): 任何人都可使用,重新使用和散佈開放資料 – 不能限制資料能使用的範圍,或是使用者的資格。例如,「非商業用途」將限制資料在所有「商業性質」的使用,或是限制資料只能使用在某個範圍(例如,只能作為教育上使用)。這些限制都是不被允許的。

更簡單來說,開放資料的最主要目的,在於資料的互通性 (interoperability) 。互通性代表的是不同的系統與組織可以共同運作 (inter-operate) 的能力,讓不同的資料集 (datasets) 可以彼此互用或是相互混和的能力。

或許我們用一些例子來說明會更清楚,也會讓您更有感受。我們仍然引一段來自開放資料手冊的章節來做說明:

「政府資料的開放也可以讓你在每日的生活中,做出更好的決定,或是讓你更積極的參與社會活動。在丹麥有位女士建立了一個名為 findtoilet.dk 的網站。該網站列出了丹麥所有的公共廁所。這樣一來,一些她所認識有膀胱控制問題的人,都可重新拾回信心,並願意更常出門。在荷蘭,有個網站 vervuilingsalarm.nl 提供了一個空氣品質的警告服務。當你所在地區的空氣品質,隔日將會超越你預設的標準時,這個網站就會發一封警告訊息給你。在紐約你可以很輕鬆地找到可以溜狗的地方,或是找到其他也一樣會去這些公園的愛狗人士。有一些服務使用了政府開放出來的資料,例如在英國的 “mapumental" 或是在德國的 “mapnificent" ,都讓你方便找到符合你居住條件的住所。你可以依照例如通勤時間,住屋價格和居住景觀等設定來做篩選。」

資料的開放對政府本身來說,也能創造新的價值。我們也可以參考手冊內的這一段章節:

「資料開放對對政府本身來說,也能創造新的價值。例如,它可以有效的提升政府的服務效率。當荷蘭教育部將他們所有與教育相關的資料,都公布開放放上網路讓任何人都可自由使用後,他們平常需要處理的問題開始大量減少。這也讓部門的工作負擔與經費使用一併降低。而剩下需要處理的問題,也能比較容易找到答案,因為所有資料都已經清楚公開出來。資料開放能夠讓政府的效能提升,而最終這一切,都可減少部門運作所需的經費。荷蘭管理文化資產的部會,很積極的將他們的資料釋放出來,同時還與許多例如 Wikipedia 基金會的歷史愛好者組成的社團與組織合作,將工作分配出去,同時執行上也有更高的效能。這種合作關係不只提升了他們自己的資料的品質,同時也縮減了部會在人事與經費上的需求。」

手冊內提到了開放資料最重要的價值之一是:

「如果我們能將政府資料轉化成開放資料,我們就能將這未開發的潛能釋放出來。只有當資料是真正開放時,這一切才有可能實現。開放,意味著對於資料的使用與使用者沒有任何的限制(法規上的,財務上的或是技術上的)。每一種限制都會禁止人們使用這些公部門資料,而我們就更難找到這些資料可能擁有的應用方式。公部門資料需要真正的開放,才能完全釋放出資料的潛能。」

接下來我們將介紹一下各國的發展現況,然後再回來看看台灣目前的狀況。

美國的開放政府 (Open Government) 和開放資料 (Open Data)

美國歐巴馬總統在2009年1月9日就任的是日,立即簽署了「透明與開放政府備忘錄(Transparency and Open Government Memorendum)」,以作為聯邦政府在未來四年的政策準則。備忘錄所揭露的準則包含了(一)政務透明、(二)公民參與以及(三)協同合作的政府(collaborative government)。2009年12月8日,在歐巴馬總統首度任命的聯邦資訊長和技術長領銜之下,在公眾諮詢的程序完成後,聯邦政府發佈「開放政府指令(Open Government Directive)」,要求聯邦預算與管理局(Office of Management and Budget)針對聯邦各級單位明確訂定措施,以實現政務透明、公民參與以及協作政府的準則。主要目的是為了有效的提高政府效能,改造政府,以期許在21世紀能穩固美國的民主基石,促成民有、民治、民享的開放政府。

OMB 在「開放政府指令」提出四大主軸,包含(一)網路出版政府資訊(二) 提升政府資訊品質(三)強化開放政府文化,以及(四)建立政策架構。指令具體列出了數十項作業要點以及辦理期限,要求聯邦各級單位由資深管理人員主導,基於單位之各別專業,訂定該單位之開放政府計畫說明。例如在45天之內辨認出內部最具有價值的三項資料集(data set),60天內於公開網站,明確公布承辦狀況,以及在90天內,會同聯邦技術長辦公室,辨識落實開放政府的阻礙。目前具體的成果,可以在 www.data.gov 的網站上取得。 由於白宮的重視,加上大幅度啟用來自矽谷的科技人才進入政務體系,因此如美國太空總署、衛生部(Department of Health & Human Services)、環境保護局(Environment Protection Agency)等大型部會,皆陸續以開放格式釋出巨量資料(Big Data)和演算軟體服務,促成民間的資訊近用,達到開放政府的實質效益。

英國的開放資料(政府、民間)

英國在公共部門資訊(Public Sector Information)早在1786年即有性質類似的機構專職成立, 全權負責英國政府出版品的業務,機構則設置於英國皇室文具署(HMSO)底下。但在1996年後,為了因應時代的變化,歷經民營與合併的動作。到了2006年3月,由於民間對於英國地理測量局(Ordinance Survey)的資料釋出政策,申訴案件日益增加,英國衛報(The Guardian)遂發起了 “Free Our Data” 的系列報導,前後為期超過一個月。此舉在英國引起輿論普遍的關注。2007年6月,英國首相官邸委託民間機構,進行撰寫一份名為「The Power of Information」的研究報告,這是英國政府正式討論「開放資料(open data)」的濫觴。這份報告指出了公部門資訊的巨大機會,並且彙整了由公民和國家所產生的資訊之使用以及發展現況。

報告指出,目前的政策工具和執行面都尚未充分把握機會,建議政府部門應該(一)歡迎並擁抱以使用者內容 (user-generated) 為中心的網路服務商以及其社群用戶,因為這些服務有助於追求共同的社會和經濟目標(二)提供資料給運用創新模式重製 (re-use) 政府公開資訊的民眾,當他們需要政府提供資料時,應在最大限度之內以保障全體公民長遠利益的方式提供,並且(三)為了確保公眾利益,應準備更為充分的資料(即使有時資料是不可靠的),並且協助可能因為此舉而被排斥於數位機會外的團體,取得競爭優勢。2008 年 3 月,英國國會議員 Tom Watson 在前首相 Gordon Brown 的任命之下,成立「Power of Information」的工作小組,將開放資料提高到內閣的層級,具體擘畫英國公共資訊的未來發展藍圖。2009年9月,英國開放資料政府網站正式上線,成為指標性的開放資料網站。2012年4月,在首相辦公室數位長的擘劃之下,推出完全以搜尋引擎為基礎的政府入口網(www.gov.uk)。2012年5月,在現任首相的支持下,由網際網路的發明人 Tim Berner’s-Lee 主導,宣布完成募捐一千萬英鎊為營運的初期資金,成立民間的開放資料研究所 ODI (The Open Data Institute)。此研究機構的成立目的在於發掘公開資料(public data)的商業潛力,並且為英國國內之公部門和學術單位,提供創新育成環境。這是英國政府和民間發展開放資料的具體里程碑。

歐盟的開放資料(政府、民間)

歐盟雖然在開放資料的發展較鄰近英國為晚,但在歐盟執委會 2003/98/EC 指令,已具體揭露歐盟執委會在鼓勵各會員國對於公共部門資訊的再用(re-use)的立場。2011年9月,歐盟執委會(EU Commission)提出了「開放資料戰略」(Open Data Strategy for Europe),預計可為會員國創造出每年超過400億歐元的產值。執委會代表 Neelie Kroes 說明目前業界在取得公共部門資訊,面臨了不少的困難。在一份執委會委託六家私人機構的共同研究報告也指出,相較於美國而言,歐盟各會員國在開放資料的應用仍處於落後的局面,尤其是在地理空間資訊的部分。委員會所調查的受訪者中,有將近80%的人表示,他們對於地理空間資訊取得的挫折,主要來自於高昂授權費用障礙,沒有明確的再利用規範和慣例,或是無法確認資料的擁有者到底歸屬於哪個機關等問題。

在美國和英國開放資料網站的影響之下,歐盟各會員國和城市,如荷蘭、義大利法國、葡萄牙、西班牙等諸國,則是接連在「開放資料戰略」宣布後的2011年底,競相推出官方的開放資料網站,成為一股方興未艾的風潮。

台灣的現況(簡述)

開放資料目前在台灣的發展,可以分為三塊,分別是非政府組織社群、法人組織以及政府單位。雖然相對於歐美各國,尚未有具體蓬勃的發展,但整體所顯現的活力,卻遠遠高居亞太區域之冠。這也可能跟台灣民間力量活躍的社會特性,有著正向的關係。

開放資料在台灣的整體的發展,可以回溯到2011年,這是開放資料 (Open Data) 在台灣生根的一年。早在過去幾年,有些具有研究能量的單位開始注意到 open data 在國際發展的趨勢,例如長期耕耘來自中研院的「Quantum GIS資源網@Sinica」網站,以及探討資訊人權的洪朝貴所撰寫的部落格。而部分於國家型數位典藏計畫內工作的人員,也因為計畫即將結束,在不少討論的場合提到了數位典藏所累積的珍貴文物資料,是否可以以開放資料的精神來釋出,成為數位文創的種子。

若干應用程式開發者以及網路營運商,也注意到了這波風潮。可是由於各家的出發點不一,所以部分具有運用開放資料能量的中小企業,多半仍在嘗試和觀望。 政府資料取得的重重障礙,是中小企業不願積極涉入開放資料平台或應用程式開發的主要的關鍵之一。在非營利組織的部份,國內僅有即為少數的法人組織,例如「青平台基金會」,曾經在多次的營隊推廣開放資料的概念。社群則是有不少關心開放資料的人士,也在不同的地點辦理開放資料的相關座談,試著將開放資料的理念,更進一步的傳播到有興趣的民眾。

在政府單位的部份,由於政府組織改造的業務調整行政院研考會也在2010年所完成的報告之內提到開放資料,也在 weblog 提到美國歐巴馬政府的 Open Government 計畫,以電子治理的方向出發。在網路上,「城市格局」也從年初持續關注開放資料的各個面向,例如2010年所釋出的「我的社區」就是運用資料視覺化手法,來說故事的最好例子。

2011年3月,台北市政府資訊處也在內部開始針對資料入口網站的雛形進行討論,並且在同年9月推出 data.taipei.gov.tw,作為城市嘗試建立開放資料入口的第一個官方範例。2011年7月份,由青平台所主導的 opendata.tw 上線,目的是彙整國內開放資料發展的訊息,並且讓不同的社群間互通有無。目前已至少有 Creative Commons Taiwan, AccessTaiwan, Makoci.com, OpenStreetMap Taiwan, 神饃天氣等平台,分別從不同的角度,實作開放資料的示範。

2011年底,行政院科技會報辦公室以資料加值的角度,召開兩次的開放資料策略會議(),希望透過民間健保資訊的釋出,作為加值運用的範例, 詳細的訊息可以在網站上取得。此舉由於有侵害資訊人權之疑慮,因此台灣人權促進會聯合相關團體,針對個人資料的應用可能造成的隱私權侵害狀況,提出立法規範的訴求。社群也認為若要開放資料,應該先從無隱私疑義的政府資料開放起,而不是從全民的健保資料開始。

2012年開始,台灣民間討論 open data 的活力又上了一層,有開放資料手冊的翻譯,有每個月的 R0 活動,討論資料分析以及資料的應用,也成立了 “Code For Tomorrow” 等網路組織,希望透過結合城市的資料,打造出下一代的數位城市的協作平台。

青平台於2012年7月,更舉辦了 Open Campus 營隊,內容將涵蓋 Open Data 觀念說明,實際範例與現狀,如何自己開始動手 open data,有哪些工具可以使用,Open Data 與「資料新聞學」的關係和應用,如何將資料轉換為圖表和如何將這一切整理出一份完整的報導和使用圖表來說故事。