最近因為台灣的台北市電腦公會正在籌備「Open Data 聯盟」,我在第二次籌備會時,對於各國開放資料的發展做了一點介紹。不過有點心虛,心虛的並不是講不出來,而是30分鐘僅能抓個概況,再加上「產業」一詞實在是畫的過早。不過在籌備會後的討論相當精采,我也當場直言,開放之路相當繁瑣艱難,絕對不如一般想像之簡單。

隔幾日收到數個單位和朋友來信,情商開放資料人才培育一事。以課程為法,希望能加速培育人才。我覺得這件事雖立意良善,但有點錯亂。快寫幾言,僅供參考:

1. 開放資料貧瘠

台灣目前堪稱開放政府資料的資料源,幾乎寥寥無幾。大多是公開資料 (public data) 而不是開放資料 (open data),在資料源貧瘠的情況之下,你說要培養開放資料的人才,是要人才做什麼?寫 scraper 爬政府網站資料嗎?還是只要教會用圓鍬,就可以直接帶隊進沙漠挖礦了?

2. 只專注在開放資料本身,的確很難有商機

一直要強調開放資料有商機,是很有問題的。不是說沒商機,而是商機不會是落在 “kitchen.gov.tw” 給妳一匙鹽一杯油一顆蛋全部下鍋炒一炒,就會有炒蛋可以賣的這種譬喻。資料的擷取、彙整、轉換、整理、分析、認證、刊登、印刷出版,或是提供各種人為介入或消費者自理的檢索服務等,的確是有不少的機會。但開放資料貧瘠先不說,地方政府所釋出號稱開放資料的資料在授權上,全部都是有問題時,請問,你是要有什麼商機?

3. 商機在學研、委託和活動

如果台灣的開放資料發展順利,那麼在2013年Q2之後,我們就有機會看到純粹運用開放資料所萌發的「商機」。今年所謂的商機,我想主要就是學術和研究機構會做一些案子。至於其他部分,商機處處,但沒有這麼快,除非(一)你經手計畫的所有人從上到下都能體會 “open data on the web" 的價值而且也有 web 服務的實務經驗,或是(二)很知道資料的轉換處理怎麼在本地捆包賣出價值,不然是不可能的。

4. 歐盟的高手也還在摸索,承認吧

此外,據我所知,幾個在歐盟各計畫內負責開放政府資料相關計畫的朋友們,都還停留在探索公開資料 (public data) 的產業鏈到底是什麼的階段。歐盟各國的開放資料發展,相當不錯,因為會員國不少,每週都有不少令人驚奇的開放資料集 (datasets) 上線。運用這些資料的單位,也並不特別限於新創或是已上市的公司。比如說,A公部門透過開放資料集的釋出,而能快速拿到B部門的業務資料,可能就省去了不知多少的人時成本。

5. 所以人才培育要開什麼課?

開課當然是可以的,但那「商機」不太是想像中的那樣。對於開放資料應該更有興趣的,其實是新聞媒體業者,這在我之前的受訪文章已經談過一次。就以英國 ODI 和 Journalism.co.uk 所合辦的「開放資料與新聞」的課程來看,總時數七個小時,相當豐富,定位就是提供一個基礎的入門的「學習框架」:

  • 什麼是資料?
  • 資料如何被法律所保護?
  • 運用資料說故事
  • 找到可以信任的資料來源
  • 取得的資料的信度是否足夠?如何確認資料是正確的?
  • 如何和資料源保持同步?
  • 從資料中找出故事
  • 運用現成工具分析資料
  • 清理資料
  • 試算表的基本功夫
  • 透過群眾外包模式讓群眾協助分析資料
  • 資料授權的選擇如何影響到你的新聞作品
  • 如何運用主流的資料視覺化工具?

很實際的課程,但每項課程內容都有更為深度發揮的餘地,不只是像表面上看起來如此淺顯。

6. 最該被培育的是,政府

事實上我覺得最該好好「上課」的,就是實際在擬定開放資料政策、執行開放資料計畫的人員,這包含從策略到執行階段的承辦人員都是。在2013年這個階段,資料的開放,最大的長遠受益者是政府單位,因為開放資料是來解決政府內部自己本身的數位落差,所以人才的培育要從上游、中游(例如工研院、資策會)開始,而不是孤立的從下游加速進行。我個人偏向不使用「上課」一詞,而是開放資料的發展本來就很需要「共同協作」,無論是透過網路或是實體的活動來達成。這也是 Code For Tomorrow 會什麼要在4月27日舉辦「地球日開放發展工作坊」的主要目的之一。

政府少了點數位落差,多點數位包容,數位機會就會多出很多。

7. 什麼課不該開出來

最後,只要課程裡有出現「雲端」兩個字的,百分之百一定和 Open Data 的人才培育沒有實質關係。