前幾篇的零落短文提到:
不過一直沒有機會正面談我對這兩個「概念」的想法。可是最近常被問到 big data 和 open data 倒底有什麼關係,或是說有什麼不一樣。這其實很好回答,也不好回答,因為沒有正確答案,所以很好回答,所以也不好回答。端看問的人的的目的是什麼而定:是要可被執行的見解,是想做點功課,還是就春風追一把。
前幾篇的零落短文提到:
不過一直沒有機會正面談我對這兩個「概念」的想法。可是最近常被問到 big data 和 open data 倒底有什麼關係,或是說有什麼不一樣。這其實很好回答,也不好回答,因為沒有正確答案,所以很好回答,所以也不好回答。端看問的人的的目的是什麼而定:是要可被執行的見解,是想做點功課,還是就春風追一把。
Eric Schmidt 最近的動作很有趣,跟 Vint 的角色不太一樣,首先是4月23日新書上市:The New Digital Age: Reshaping the Future of People, Nations and Business
另外就是他日前和阿桑奇的會談,逐字稿釋出。逐字稿內一些不重要的要點:
另外就是 Vint 倒是具名發給了 UN 談 IGF 的問題,就在此時,Google Japan 也有人在瑞士搞 open the IGF,所以這是怎麼回事。
午餐前快寫兩點。
1. 越開放越會被吃豆腐
從各利益相關者的本位來看,有句白話說叫做「敵暗我明」。開放資料雖然是越開放越有力量,但誰要先開放?開放什麼資料?怎麼開放資料?開放了之後我原本收的規費要怎麼辦?上面有政策要開放,要先開放哪些資料集?部門內懂 IT 的也只有那幾位服替代役的役男,要去其他部門問嗎?還是?資料出去之後,人家是會寫信來問的,這跟本來的流程要怎麼串?如果當初出去的案子根本就沒寫客服這一段,那要怎麼辦?如果有人走原本的政府公開資訊流程來申請開放資料,那?
本位是很正常的,不本位就奇怪了。在不少國家,率先帶頭開放資料的單位,通常會面臨被「剝削」的狀況。誰有這麼多的豆腐可以給人家吃?誰的業務型態是因為豆腐被吃多了,在績效的表達上反而會更好寫?資料集被下載很多次就表示可以交代了?有沒有想過這些資料集其實是因為好奇的開發者和媒體的引用,才會有這麼高的檢閱數量(例如台北市的公廁資料)?誰的豆腐被吃了的時候,承辦人(或團隊)還會心甘情願並且下次還有預算來釀豆腐?A單位的突破經驗,為什麼要跟B單位分享?案子兩邊不是搶的很兇嗎?
2. 開放之路需要一路的陪伴
去年第二季時,有個單位來找我說想辦理 open data 的程式馬拉松(hackathon),我說這並不難,難的是一路上需要有經驗的人陪伴,因為即使是辦一個 hackathon 也是有不少奧妙的。案子多半有必須服務的目的,而那些目的通常也會和 hackathon 的精神有些衝突。是以多半辦的好的例子,要不然就是商業公司以高額獎金自定遊戲規則,要不就是純粹市民型態的程式馬拉松活動。至於公、民合辦的活動,通常承辦的朋友,一路上都會遇到很多的繁瑣問題。這問題沒辦法一次講明,只有一路陪伴,才有多一點機會可以辦出個像樣的程式馬拉松。不是難易的問題,而是有沒有經驗比較關鍵。
搞不好你的團隊裡面就有高手,只是在行政位階上應該沒有被「扶正」。
吃飯去。
最近因為台灣的台北市電腦公會正在籌備「Open Data 聯盟」,我在第二次籌備會時,對於各國開放資料的發展做了一點介紹。不過有點心虛,心虛的並不是講不出來,而是30分鐘僅能抓個概況,再加上「產業」一詞實在是畫的過早。不過在籌備會後的討論相當精采,我也當場直言,開放之路相當繁瑣艱難,絕對不如一般想像之簡單。
針對三文做一抒發:
IoT 和 Big Data 商機的迷思
https://www.facebook.com/notes/ben-jai/iot-%E5%92%8C-big-data-%E5%95%86%E6%A9%9F%E7%9A%84%E8%BF%B7%E6%80%9D/10151577263144113
Big Data技術是台灣的未來?是有機會的,但是不要編神話好嗎?
http://hungsh-ntucsie.blogspot.tw/2013/04/big-data.html
關於Big Data的一些想法
http://pinky-monkey.blogspot.tw/2013/04/big-data_20.html
對台灣來說,其實 Big Data 關鍵之一就在 Industrial Internet(工業網路)而不是物聯網啊。兩者乍看相同,但企圖完全不同。一點想法:
簡短說明如上。
我六月會去 INET Bangkok 會議的壓軸最後一場,主談 open data。INET 台灣的朋友可能比較陌生,是 Internet Society(國際網路學會)的年會,總部設在日內瓦,為互連網之父 Vint Cerf 與其同事所創辦,以促進開放網路、連結人類和共創發展為目的。由這個機構所產生的主要標準,會交到網際網路工程工作小組(IETF)和網際網路結構委員會(IAB)。
我會談的是開放資料的 public-private partnership 的經驗。
七月受邀去英國衛報的 Activate Summit,高峰會主軸是社會、開放和技術創新。不多說,網站有更詳細的介紹。今年主題也是 open data,我會跟經濟學人的講者共同探討開放資料改變世界的探索經驗(不限於台灣經驗)。
台灣的商周在《六位IBM總字輩 來台抓小偷》報導內所提到關於我的部分,雖然只有一句,但不只誤植,而且是無由來風。澄清幾點:
特此聲明。
2013. 4.11 12:25 更新:
特此聲明。謝謝。
這個脈絡發展了八個月,總共在四個不同場合提過,分別是社群@台北、活動@高市議會、活動@北市文化局以及演講@新北市資訊中心。每次都不一樣,這是在台北市文化局的活動。繼續努力,開放發展。
2009年那次,摩托車騎到四國的愛媛縣內子町,在老街的街廓外停好車後,信步慢走。不一時喜見一店,牆上掛了幾雙草鞋,小樸粗美,我很是喜愛。但因不熟日文,四下回顧,又是無人看店,不知如何墊款。揣揣離去,好有罣礙,幾年來的心頭總是寄付了這雙草鞋。草鞋雖非日常所須,且此年頭,紀念思古顯然多於實用。但平常在室,習慣光腳而行,出外旅行,也多是五指鞋代步。不入草鞋,忝為行者啊。
四年後舊地重遊,一語不發,直接將費用投入旁邊的竹桶。接過手後,忙著換上。尺寸單一,沒有得選。後腫裸空,但不要緊。我走路本可不由足跟接地,雖然小腿負荷會大些,步幅也會減短,但步姿稍有墊跳,節奏明顯。精神奕奕,走來似有宏大目標在前。滯日十來天,相隨一起。又,三月底適逢櫻吹紛飛,酒已當歌,草鞋伴履,也不失一番姿趣。
但現代畢竟是現代,側人眼目,十指裸誠相見,失禮或有。只要路面溼滑,腳底也會冰涼一陣。血氣循環不佳者,可能還會被地氣侵襲。我唯一抱怨的是,如廁時總會懷疑踩到不該的液體。果然,還是四下無人,如犬般在路邊洩去,還是安心的些。
回台後三日皆雨,草鞋兩週來已薄片草蓆 (around 30k of abusive use)。尋思明日門口燒燒,也算是愛護地球。只是不知何時才能再納?我想,我是愛上了草鞋。
台灣之光越落俗套,追捧兩三輪,就成了家喻戶曉。
比如說運動好了,運動本身就是個非常複雜的產業。各單項運動之間,壁壘分明,井水不犯河水。支撐各國際賽事聯盟、地區賽事聯盟、國家賽事聯盟的歷史結構,也都不太一樣。在馬拉松,有好一些在北美城市的主辦單位,根本就是規則的制定者。但在奧運,也會有男子和女子馬拉松。大家的距離都一樣,但你在波士頓馬拉松拿了第一名,跟你在夏季奧運的馬拉松拿了第一名,那個光沒有高下之分,但卻是很不一樣的。
電子媒體的趣聞荒聞,乖誕慫恿,今天這個哭,明天那個笑。越是無關緊要的小細節,才能支撐毫不需要秉其實論的大作文章。實在的東西不好發揮,容易被揭穿無知,只好就越往飲食男女靠攏。這是新聞,還是娛樂?
訊息的空間維度,原來也可以被逼迫到只有明顯東南西北的四極點。地域上的島嶼,不只造就資料難以交流海外的怪異屏障,連每天吃的新聞,也把人的腦袋罩上了此套套。一股腦天天猛發洩,但真要生個兒子,卻怎麼都生不出來。
撥亂返正,是被荒誕無稽大力打下後的自然反應。今天正這個,明天正那個。精通此道者天天出招,開放射擊。入戲者游擊回擊,飽食彈幕。不入局的觀眾,也只好紛紛帶開,邊躲邊閃。空間上的緊迫所造成的行為侷限,也讓人們只有反射動作,連帶套的大腦都免了。
這邊出招的打下來,戰略是,只要讓越多人趨於精通反射動作即可。事實證明,這轟掉大腦的次世代戰略,不只影響到生活見聞。連不管是叫人外看西洋,還是反省內看東洋,黏答答的社交訊息流,也把人的眼睛糊上了一濛迷糊。
海何其大?但放眼乘著機會的,有多少?
對於 TED 系列的論壇沒有特別的喜好,但有些經驗是透過相當大的週期所累積下來的,應該有點價值。當時沒談的很好,現在可以更簡潔具象。
講題:Open Data 商務模式探討與案例分享
開放資料的發展與二十年前的網際網路,有何類同?促進資料的開放流通,在文化、經濟、環境和社會效益面,如何爆發需求、創造和傳播知識,滿足消費者需求? 將資料轉化為有價資產,為什麼需要開放?位處訊息孤島的台灣產業,如何在全球浮現的 Open Data 價值鏈,翻轉地域劣勢,取得先機?資料更為巨量、即時的面貌,如何影響城市、企業、智庫、組織和個人的生命?更為開放的各國政府資料,是機會還是危機?
感謝:範圍抓的太大,也因為刻意把 social impact 拉的太廣一點,所以和適合在這種場合談的,有些脫離。最後是總結台灣公部門和中小企業在發展開放資料策略時,可能落入的死胡同,算是一些觀察。
– Confrontational (political movement) 採取對抗而非協同
– Black market (data as product) 鼓勵黑市資料交易
– Forbidden city (cultural taboo) 忽略資料和文化禁忌
– Forgotten role of science (research) 忽略科研基礎
– Spiraling downstream (policy & positioning) 自動往生態下遊移動
– Night market syndrome (small pieces loosely joined?) 夜市生態
沒時間寫文,很快的針對 Dongpo Deng 這篇文章再帶出一些看法。昨天下午那場我不是 Keynote speakers, 但是是與談人,所以全程在場。
不過講實話,以原民會這個例子,最好先把資料和公共運輸的各種道路標誌以及印務文宣的背後資料 pipeline 處理好就是完美了。從需求情境回推過來,例如旅遊業者怎麼拿到這些資料,作文宣,畫地圖。在做這件事的過程中,一步一步把 linked data 試著處理完畢,沒問題就整批放出來,往 linked open data(後簡稱 LOD)走。至於說要走到最後 last mile 也根本不用原民還是 ITRI/IEK 開這種標。其一是 CfT 來和 TCA 合作,就可以辦 LOD Challenge 了,足夠的 stakeholders 進來,是非常非常重要的。我不認為不夠開放的組織文化能好好的做開放的事,這是有衝突的。其二是,國旅之下的原住民旅遊的資訊,最好還是考量給所謂的「傳統」人家有生意做,例如前面所提到的旅遊內容的相關印務,讓人家有錢賺比較好。這是有地域經濟精神放到 open data 發展的思維。直接全部跳過去這種現場的文宣品寄放點,做到 web / app 或是聽起來不知所云的「雲端」來,只能 cover 到很少的國旅遊客吧。LOD 該做,但不該把作的東西僭越其他價值,想走到最前面,或是想整段一次做完,要給地域住民和經濟集落有角色。
當然對國外又是另外一回事。
簡單來講就是,ITRI/IEK 的想法就是 solution without context, 天真到不可思議。我在與談時(四分鐘)來不及提日本道之驛 [1] 和重要傳統建造物保存地區 [2] 的例子。希望下次有機會。
2015年底會發生的事 [1],歐盟境內居民可對境內任一消費品(排除健康與教育商品),無論購自網路或是實體通路,直接在汎歐網路平台上實行「訴訟外紛爭解決制度 (ADR)」權力,白話來說就是透過網路實行調解和仲裁程序。各會員國有兩年的緩衝佈署的時間。三小時前的新聞稿:
http://europa.eu/rapid/press-release_MEMO-13-192_en.htm?locale=en
東西想賣進去歐洲嗎?長線策略還來得及佈署,你有兩到四年的時間。本通過之法案主要是為了保障未來的歐盟數位單一市場的消費者權利而推動。還有疑問嗎 [2]?
[1] http://ec.europa.eu/consumers/redress_cons/adr_policy_work_en.htm
[2] http://europa.eu/rapid/press-release_MEMO-13-193_en.htm
欣聞 www.data.gov.tw 即將在四月份上線,快寫部分意見:
先這樣。
昨日一場盛大的開放資料論壇在台北展開,現場側寫,推薦閱讀 Technews 此文,未能赴會,但快寫一些心得:
此外,ODI 的的做法可以參考。他們日前也透過台灣雲端運算產業協會的邀請,過境台灣一趟,但我不認為台灣各環節在執行上能夠脫離窠臼,開放創造出新的氣象。所以直接移植就免了,覆轍定可期。
這只是英國開放資料發展策略的執行工具而已,但已經讓我手癢想要直接加入會員。原因無它,因為多年來你知道英國人在這一塊是做真的,既然是真,那麼才有真的機會。
推動開放資料也不需要好高騖遠,說起來很難,但做起來很簡單。開始做的時候也不用想太多,最好就是從自己的工作習慣想起。
本文原出處:http://codefortomorrow.org/post/43713576147
鼓起勇氣,報名!
觀察大概是在 Open Data Day 前最重要的一件事。你可以觀察很多東西,例如 Open Data Day 是怎麼在數年前發起,然後今年在台灣和日本各大城市開始的。這些資料都透明的公開在網路上。於是你想說,最近聽說 open data 好像很熱門,但搞不太清楚,既然有活動,看起來野蠻輕鬆的,鼓起勇氣參加試試。希望這是一個好的開始。
或許有些人不知道怎麼到會場,你可能需要地址,而且主辦單位也在報名網頁提供。你想先在家裡查查到底會場在哪,但因為你不是科技業者, 所以你對內湖科學園區不熟。沒關係,在 Google Maps 鍵入地址或是場地名稱之後,你就找到會場所在。 繼續閱讀 “資料就在你身旁,沒了它會很麻煩"
Google 台灣的簡立峰在財訊的專訪,提到了幾個關於海量資料 (big data) 和產業發展的關鍵,雖然此篇專訪是以海量資料為核心,但我認為對於台灣的產業和社會發展,開放資料 (open data) 遠比海量資料來的重要。 繼續閱讀 “在台灣,開放資料遠比海量資料重要(一)"
一口茶的時間。
剛在某郵件論壇裡,瞥見 Giuseppe Attardi [1] 在談傳統組織在網路治理的無效和不彰(例如台灣 NCC 或是其他主責機關)的問題,竟然會提到 Albert-László Barabási [2] 和 Elinor Ostrom [3]。前者是 network theory 的大腕,後者是2009年的諾貝爾經濟學獎得主,主要研究是公共財和公共 “Commons" 治理的政治歷史。Giuseppe 下面的這段話,很貼切說明了所謂「台灣網路失落的15年(編按:我不同意,但暫且引用)」遇到的是什麼問題:
跳轉,無論是 TIEA 或是近日想要成立 Open Data 聯盟的 TCA,能否在網路公共財的治理上扮演好角色,我認為從作事的每一個環節就可以清晰判別。
[1] http://www.di.unipi.it/~attardi/
[2] http://en.wikipedia.org/wiki/Albert-L%C3%A1szl%C3%B3_Barab%C3%A1si
[3] http://en.wikipedia.org/wiki/Elinor_Ostrom
一杯咖啡的時間。
歷年來的 Open Data Day 雖然多以 hackathon(程式馬拉松)型態來慶祝,但在今年邁入第四年,拓展到超過一百個城市舉辦之後,狀況有些不同。不少城市的主辦單,並沒有採取 hackathon 型態進行,例如菲律賓馬尼拉以開放街圖為主軸,而尼泊爾加德滿都則是講座,香港則是 BarcampHK 撞日(報導)。當然這背後的因素很多,有些是當地城市開放資料根本尚未獲得討論,所以僅能以座談方向展開。聽眾遠多於動手實作的,與會者也停留在問什麼是「開放資料」的過程。另外幾個城市的極端是,舉辦當地城市的政府公開資料,早就採取開放授權,所以 hackathon 也有特定的主題,例如倫敦、柏林、華沙等,專注且精采,不在話下。韓國首爾以及日本八個都市,也都各有味道。
參考之前 Open Law 的建議,前因後果是:
在 Open Data Day 當日,行政院回應民間對於「開放資料」的要求,已將函送行政院及所屬各級機關政府資料開放作業原則至各所屬機關,純文字版本可供快速檢閱。
最近幾篇文章,值得一讀。例如談源自於學界為官來主導的科研政策,在新興產業的面前是多麼的捉襟見肘 [1],我在前政委張進福下台前,也曾在公開場合請教他這個問題 [2]。
[1] http://techliberation.com/2013/02/18/what-big-bang-disruption-says-about-technology-policy/
[2] https://blog.schee.info/2012/05/07/digital-convergence/
網路發展受國界和地域的影響是越來月明顯。在日前「是方事件」後,台灣的各位應該更有所感 [3]。
[3] http://www.foreignpolicy.com/articles/2013/02/25/the_new_westphalian_web?page=0%2C3
站在數位匯流的前面,過早立法不是什麼好事 [4]。ITU 在 WCIT 之後的角色轉換和各方角力 [5],值得玩味 [6],當然也值得台灣業者多關心。
[4] https://blog.schee.info/2013/01/03/opendata-premature/
[5] http://mondediplo.com/2013/02/15internet
[6] http://www.circleid.com/posts/20130225_itu_20_take_time_to_make_good_decisions/
從電信談到終端到終端 (end-to-end),從網路治理到政策,從多樣的利益相關者到科技發展。雖然不是談台灣最近幾個事件的發展,例如 Google Play 付費市場重新開放,還是說是方事件,但談的完整,架構宏觀。台灣檯面上的賢達之士在追擊熱門網路話題時,尤其是談到政策時,應有此等水平。