Google 台灣的簡立峰在財訊的專訪,提到了幾個關於海量資料 (big data) 和產業發展的關鍵,雖然此篇專訪是以海量資料為核心,但我認為對於台灣的產業和社會發展,開放資料 (open data) 遠比海量資料來的重要。
比如說,在最為關鍵的層面,專訪內也提到,台商在海內外具有規模且公開運作的產業聚落,其生意多以 B2B 為主,對於海量資料的需求和掌握意願,自然會落到服務原本就存在的商業目的這一段。當然,企業規模大到即使在供應鏈的任何環節能夠做出優化,然後落實到資源調度上,這樣的想像當然會提供業者部分的誘因,進而投入資料儲存和分析的資源。便利商店和流通業者等,就是這樣脈絡下的例子。
但這卻還不是巨量資料最令人興奮的領域,因為本來在市場上必須處理相對大量資料的電信、金融業者,很自然能理解海量資料的重要性。急迫是另外一回事,願不願意投注資源在統計和資料分析,這也是另外一回事。或是服務面向相對純化的領域,如氣象局的天氣預測、或是無市場績效指標的研究機構,海量資料的這個浪潮,到頭來總會遇上的。另外一面向是台灣的電商,在淘寶的威脅下,是否會儘快佈署海量資料的運算和分析架構,這就不在本文討論之列。能源和智慧電網也是,但都在未定之天,可能都還不到上戰場的程度。
可是 Big Data 令人興奮的應用,都不是上面幾種情境。反而是如(一)美國疾病管制中心 (CDC) 流感爆發前夕和後來被特別拉抬的 Google Flu Trends,或是(二)社交媒體與奧運期間的安全管制:但這有相當挑戰,主要是在判斷什麼樣的事件程度需要啟動不同層次的現場維安反應,還是說(三)去年的美國總統大選。這很好,一人得道雞犬升天,在選舉花招相當多元的台灣來看,應該有機會,但實際上是很難的。因為 Google Taiwan 並不怎麼碰公共議題,這點和鄰近的 Google Japan 不太一樣(例一、例二),剛好是介於香港和日本中間。
以上這些是已經上戰場的海量資料運用案例,但都不是單一企業所能承受。對於擅長處理資料、資料、資料,能方便提供企業各部門跑各種跑數據介面的 Google 來說,越多的資料能被釋放在開放的網路,當然是好事。
因此,Big Data 對於 Google Taiwan 乃至於台灣的產業和社會而言,只有掛在 Google.org 專攻災難防救的 Crisis Response,以及處理地理空間資訊的 Google Maps/Earth 產品線,才是明顯和 Big Data 以及台灣的社會衝擊會直接有關的服務。Google Taiwan 已經本地化的相當多產品線,當然也都有所謂 Big Data 的影子,但這部份不好講,也不用多講,簡立峰會舉災難防救為例,也是因為西太平洋發生災難的機率,本來就比其他幾十個 Google 辦公室來得高。
不過若說海量資料要帶來社會整體的「商機」和變革,讓更多的企業和社會各環節,轉化為資料驅動的組織,我覺得會相當有限。尤其是當我在專訪看到簡立峰提到健保資料的時候,深感此時實在不妥。因為這個層面是相當具有爭議的,也不純粹是技術或法律的問題。專訪內他提到:
- 不過,最有價值的寶庫是台灣的全民健保,我認為這堪稱是全台灣的共同財產。從藥品、醫院、病人就診紀錄……,整個醫療產業貫穿上下游資料都在健保裡。而且幾乎全台民眾都加入這個體系,全世界只有台灣擁有如此完整的資料庫。這些資料可以創造出極大的價值與商機,但目前還沒有太多人投入。
我覺得不妥的原因在於台灣的醫療體系對於 “privacy by design” 在實務上的落實相當不足,以及資料的隱私 (privacy)、安全 (security ) 和自主權 (data ownership) 一直沒有好的討論和作法。因此,開放資料所談到的很多面向,剛好在此時可以提醒我們許多被科技效率所遺忘,但卻在後來必須正視的問題。
比如說隱私就是一個最重要的面向,美國和歐盟對於隱私的作法相當的不同,甚至已經是高到處理態度的本質不同。Google 的起源地是美國,不同垂直產業的隱私是由不同單位來監管 (sectoral approach),但歐盟則是提高到人權層次,所以 Google Street View 產品,才會在許多歐洲國家面臨來自不同團體的壓力,這包含政府的行政以及司法單位。
待續。