最近因為台灣的台北市電腦公會正在籌備「Open Data 聯盟」,我在第二次籌備會時,對於各國開放資料的發展做了一點介紹。不過有點心虛,心虛的並不是講不出來,而是30分鐘僅能抓個概況,再加上「產業」一詞實在是畫的過早。不過在籌備會後的討論相當精采,我也當場直言,開放之路相當繁瑣艱難,絕對不如一般想像之簡單。
隔幾日收到數個單位和朋友來信,情商開放資料人才培育一事。以課程為法,希望能加速培育人才。我覺得這件事雖立意良善,但有點錯亂。快寫幾言,僅供參考:
1. 開放資料貧瘠
台灣目前堪稱開放政府資料的資料源,幾乎寥寥無幾。大多是公開資料 (public data) 而不是開放資料 (open data),在資料源貧瘠的情況之下,你說要培養開放資料的人才,是要人才做什麼?寫 scraper 爬政府網站資料嗎?還是只要教會用圓鍬,就可以直接帶隊進沙漠挖礦了?
2. 只專注在開放資料本身,的確很難有商機
一直要強調開放資料有商機,是很有問題的。不是說沒商機,而是商機不會是落在 “kitchen.gov.tw” 給妳一匙鹽一杯油一顆蛋全部下鍋炒一炒,就會有炒蛋可以賣的這種譬喻。資料的擷取、彙整、轉換、整理、分析、認證、刊登、印刷出版,或是提供各種人為介入或消費者自理的檢索服務等,的確是有不少的機會。但開放資料貧瘠先不說,地方政府所釋出號稱開放資料的資料在授權上,全部都是有問題時,請問,你是要有什麼商機?
3. 商機在學研、委託和活動
如果台灣的開放資料發展順利,那麼在2013年Q2之後,我們就有機會看到純粹運用開放資料所萌發的「商機」。今年所謂的商機,我想主要就是學術和研究機構會做一些案子。至於其他部分,商機處處,但沒有這麼快,除非(一)你經手計畫的所有人從上到下都能體會 “open data on the web” 的價值而且也有 web 服務的實務經驗,或是(二)很知道資料的轉換處理怎麼在本地捆包賣出價值,不然是不可能的。
4. 歐盟的高手也還在摸索,承認吧
此外,據我所知,幾個在歐盟各計畫內負責開放政府資料相關計畫的朋友們,都還停留在探索公開資料 (public data) 的產業鏈到底是什麼的階段。歐盟各國的開放資料發展,相當不錯,因為會員國不少,每週都有不少令人驚奇的開放資料集 (datasets) 上線。運用這些資料的單位,也並不特別限於新創或是已上市的公司。比如說,A公部門透過開放資料集的釋出,而能快速拿到B部門的業務資料,可能就省去了不知多少的人時成本。
5. 所以人才培育要開什麼課?
開課當然是可以的,但那「商機」不太是想像中的那樣。對於開放資料應該更有興趣的,其實是新聞媒體業者,這在我之前的受訪文章已經談過一次。就以英國 ODI 和 Journalism.co.uk 所合辦的「開放資料與新聞」的課程來看,總時數七個小時,相當豐富,定位就是提供一個基礎的入門的「學習框架」:
- 什麼是資料?
- 資料如何被法律所保護?
- 運用資料說故事
- 找到可以信任的資料來源
- 取得的資料的信度是否足夠?如何確認資料是正確的?
- 如何和資料源保持同步?
- 從資料中找出故事
- 運用現成工具分析資料
- 清理資料
- 試算表的基本功夫
- 透過群眾外包模式讓群眾協助分析資料
- 資料授權的選擇如何影響到你的新聞作品
- 如何運用主流的資料視覺化工具?
很實際的課程,但每項課程內容都有更為深度發揮的餘地,不只是像表面上看起來如此淺顯。
6. 最該被培育的是,政府
事實上我覺得最該好好「上課」的,就是實際在擬定開放資料政策、執行開放資料計畫的人員,這包含從策略到執行階段的承辦人員都是。在2013年這個階段,資料的開放,最大的長遠受益者是政府單位,因為開放資料是來解決政府內部自己本身的數位落差,所以人才的培育要從上游、中游(例如工研院、資策會)開始,而不是孤立的從下游加速進行。我個人偏向不使用「上課」一詞,而是開放資料的發展本來就很需要「共同協作」,無論是透過網路或是實體的活動來達成。這也是 Code For Tomorrow 會什麼要在4月27日舉辦「地球日開放發展工作坊」的主要目的之一。
政府少了點數位落差,多點數位包容,數位機會就會多出很多。
7. 什麼課不該開出來
最後,只要課程裡有出現「雲端」兩個字的,百分之百一定和 Open Data 的人才培育沒有實質關係。
Discover more from T.H. Schee
Subscribe to get the latest posts sent to your email.
Open Data in Taiwan.
https://plus.google.com/u/0/101557590873105234449/posts/emcmFarxGb3
Big Data’s Promise and Limitations : The New Yorker”
http://www.newyorker.com/online/blogs/elements/2013/04/steamrolled-by-big-data.html