資料開放了,需求在哪裡

編按:本文原刊載於 Code for Tomorrow 網站

本次 Data Weekend 最大的收穫,有幾個原則性的挑戰,藉由活動和很多很棒的講者,相信有更多朋友能體會。

看起來一樣的資料,來源卻一定不一樣

對大多數民眾而言,所謂的「政府」就是一個集合名詞。當我們在提到開放(政府)資料時,民眾對於資料的擁有者隸屬什麼單位,通常是沒有,也不需要有概念。原因是資料的「生產」本來就有專責單位在處理最前端的資料收集工作。可是我們想想,在一般民眾生活當中,例如縣市的交通事故資料,我們舉酒駕的統計資料為例,想當然耳應該是某個單位所持有。是警察局嗎?你答對了,但也好像不對,有些縣市的事故資料,雖然是警察局在第一線做處理,但彙整和定期發佈的,卻是落在交通局的身上。

所以你若是要資料,在某些縣市,請跟交通局(的網站或專線)要,而不是警察局。資料的「品質」不盡理想,統計的基期太長(以月累積為例)不適合作為更精確的分析,你必須找交通局,不是警察局。

這有什麼問題呢?也就是說,你想要拿到酒駕資料,各縣市的處理態度不盡相同,中央機關所定期彙整的資料,有網路平台,無論是開放或是半開放,但資料本身的缺佚、格式,以及發佈的時間,都不好掌握,更遑論資料本身是如何在事故現場蒐集的等這些很源頭而且牽涉到資源分配的問題。

但是當你要從消費者端來好好運用這些資料,問題就來了。

編按:本段靈感來自於講者 Odie Ke

看起來可以比較的,其實背後更有玄機

這個主要是評律網的例子。我們一般非法律相關的工作人員,可能在找律師或是溝通官司的勝敗訴時,若以勝率或打擊率來溝通,一定很快就買單。但很可惜的是,所謂的勝敗,還需要更多的比較基礎,而且通常很難量化,或許只能在統計上有些比較中位數區間的詮釋手法。

編按:本段靈感來自講者 David Chuang

有經驗的,通常來自你出乎意料之外的領域

這大概是 PGi 的感想,他們代理的 Tableau 堪稱是近年來的當紅炸子雞,講者的背景也相當有深度。過去本著處理客戶資料起家的團隊,在竹科的生態也有相當的經驗。這些資料的生態是從 web 切入的比較沒有經驗的,如何將龐大的資料轉化為商業決策,進行製程品質的控管,我不懂,但這些經驗以及建立起的經驗法則,肯定在應付資料開放的今天,很有價值。

當然 PGi 的講者在會後也私下表示,他沒想到 lightning talk 時幾位即席分享的年輕朋友,竟然這麼有想法,而且對於自己怎麼看資料,將資料運算的經驗過程,透過易用的試算表,來開放提供給更多人下載使用,能講的這麼好。

有經驗的,很可能來自於其他領域。

編按:本段靈感來自於講者 Scott 和 Muyueh Lee

資料開放了,需求在哪裡?

在這次 data weekend 比較特別的是,幾位講者對於資料是誰會用,誰怎麼用,怎麼產生,被用了會有什麼可能的風險,以及要用這些資料需要什麼樣的事先體認,有更多的著墨。資料的開放,若是變成只有從製造業裡取得靈感,只要產能足夠,資料就能源源不斷,這條路線是最直接也是最能在初期突破的,但在後續提供資料運用的誘因上,或是建立資料的需求多樣部分,可以有更多的想像和途徑。

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.