思想沙龍

Open Data时代来临 你该怎么做?

台湾开放资料长期倡议者、科技顾问公司Fertta Communication执行长徐子涵。
李唐峰
第135期
郑少凡
到底甚么是开放资料(open data)?
开放资料在社会中有甚么意义?能带来甚么商机?

2009年,美国总统欧巴马推动了「开放政府前瞻」(Open Government Initiative)的各项作为。此举在世界造成风潮,各国争相效仿。

台湾也不例外,台北市、新北市、台中市政府纷纷设立了政府开放资料(open data)网站。去年8月上线的内政部「不动产交易实价查询服务网」,就是开放数据的实例。

今年4月,台湾中央政府的资料入口网站测试版正式上线,标示着台湾在推动开放资料的重要分水岭。目前测试版搜集了中央各部门5笔开放资料,行政院政务委员张善政表示,这是第一波的开放,第二波开放会在今年年底前,要求各政府部门再开放50笔数据放上数据入口网。「民间希望政府部门开放哪些资料,都可在这期间提供意见给各部门。」张善政强调。

到底甚么是开放资料(open data)?开放资料在社会中有甚么样的意义?能带来甚么商机?

《看》杂志专访了科技顾问公司Fertta Communication执行长徐子涵(在网络上以英文名Schee著称),他长期在民间推动开放信息(open data)和开放政府(open government)的政策和研究,对于国际和台湾的开放信息有着第一手的观察。

徐子涵的经历很特别,他挑战了台湾的教育体制,光是国中就读了5年。他曾赴澳洲就学,16岁独自骑重型机车横越澳洲大陆,因无照驾驶被遣返回台湾。后来保送师大英语系,大一暑假辍学。他独自骑车环岛三次。算一算他总共念了16所学校,而正式学历只有高中毕业。

骑重车与独特的就学经验,让徐子涵对「开放」的概念情有独钟。

之后,徐子涵选择网络这个不需学历背景的领域经营,2001年起投入数字运动;2002年结合国内外同好,将部落格引进华文地区;推动维基百科;在入口网站、中研院、跨国公司、电视台和新创公司担任管理要职。他曾参与创办台湾数字文化协会,所发起之计划包含「胖卡」数字落差车、莫拉克网络灾情中心,以及Punch Party数字聚会。

以下即为徐子涵对于「开放资料」相关问题的专业见解。

 

问:甚么是「开放资料」(open data)?和政府公开信息的关系是甚么?

徐:政府有公开信息(public data),政府把资料上网公开,但上网后民众找不找得到?公开信息还可能是特定格式,民众能不能打开?也就是格式友不友善?

而「开放数据」(open data)就是要将这些政府公开数据转为「格式自由」与「授权自由」的数据。

格式开放,民众可以不需用特定软件就能读。很重要的是,政府必须允许商业用途,因为以前政府就是不希望民间把资料拿去卖,有很多复杂的法规限制。

 

问:《政府信息公开法》2005年颁布以来,许多核心信息都被政府技术性回避公开,在这情况下,政府的公开信息足够民间开放使用吗?

徐:台湾其实在电子政府来讲做得还不错,而且台湾的IT(网络科技)技术不错,在网络上有很多政府的公开数据,非常非常地多!连那种用Excel报表做一个网页丢到网络上的都有。

但因为民情的关系,除了一些紧要的事情像是报税、缴罚单等情况外,民众没有逛政府网站的习惯。由于《政府信息公开法》的关系,每个政府网站(包括369乡镇网站)都有政府信息公开专区,数据非常多,有很好也有很差的资料。所以由政府公开信息转开放信息来讲,台湾的底是够的。

有个公营当铺,现在改名为「台北市动产质借处」,台北市每个区都有这公营当铺标售一些商品,这些数据都有上网,例如之前有一台警方退下来的BMW重型机车标售8万到15万块而已,很划算吧?但一般人不知道这讯息,这数据放出来的管道和时间点只有内行人才知道。

因为之前很多数据大家找不到、格式很难处理,一般人不会去阅读那数据。现有政府公开信息开放的话,就会差很多了。

 

问:从2009年美国总统欧巴马喊出开放政府以来,开放资料成为全世界的风潮,很多国家都在设立开放资料的政府网站,亚洲国家的脚步如何?

徐:新加坡、香港、台湾、日本、韩国都有跟进,大家做的方法都不一样,台湾是民间最蓬勃的。

香港、新加坡都有政府开放资料入口网站(data.gov),但香港的政府开放数据网站上面没甚么数据,大概就只有天气、交通的资料而已。

新加坡是集权国家,政府放出的数据只能做产业应用,加速巨量数据(Big Data)的科技发展,如政府可以直接监测出租车的行车纪录:停在哪里?停多久?然后将这些东西去识别化,开放出来给民间应用后,就可以演算甚么时间点出租车排班是最多的,进而有交通疏导与流量的应用。他们玩得很快,政府一下令,大家就跟着做,但新加坡不准民间用开放资料做公民监督。

香港近来就很头大,以前香港的制度跟英国走,公司登记信息是公开的。现在中国富二代、太子党很多钱都是从香港跑出去的,特区政府就想把这些资料关起来。民间觉得不可,所以最近有些人聚集开始在讨论,和主管机关政府资讯科技总监办公室(OGCIO)在谈。

亚洲国家里,台湾在推动开放资料的脚步比较健康,不管是由上而下或是由下而上都很强,比较平均一点,只是上下的能量不知如何彼此leverage(发挥杠杆作用)。台湾上面是游击战、下面也是游击战,所以很活跃,但是开放数据的样子抓不太出来。

日本跟韩国的做法比较不一样。日本是亚洲最民主的,人民又信任政府,但是311大地震后,大家拿不到东京电力公司核辐射的资料,民众都不相信政府了,所以日本在那之后将开放资料的策略整个转方向,现在虽然没有架设开放政府资料网站,但他们从每个环节慢慢去做,先研究法规法制,遇到问题一关一关解,看有甚么单位适合把数据开放出来,然后找学界合作,所以走得很面面俱到、慢慢做上来。政府跟民间、产业合作,是集体战。

韩国开放资料的脚步是从首尔开始。因为首尔市长是无党籍的,他甚么都可以做,所以首尔的开放数据入口网是亚洲做得最棒的,而且做得很早──首尔市的政府开放资料入口网站2010年就上线了。

 

问:4月行政院研考会推出了全国开放资料入口网试用版(data.gov.tw),先搜集了各部会5笔资料开放,年底要各部会提交至少50笔开放资料,你对这入口网的评价?

徐:以亚洲来讲,政府敢宣誓中央等级的开放数据入口网站(data.gov.tw)上线,在政治意义上是巨大的,是很不简单的。亚洲其他国大概不敢这样做,这等于是宣告政府政务透明化,这是很难的事情。在这层次上台湾在全球、在亚洲算是快的。

亚洲虽然新加坡、香港有中央等级的开放数据入口网站,但他们都不算正常国家──香港是特区,新加坡是集权,连韩国都没有中央等级的开放数据入口网站,泰国曾经上线过,但政治压力太大,六个月就下线了。

至于上线数据的质量和更新速度,这全世界都差不多,一上线数据一定会有很多错,而且很多没有用的数据也上线,更新又不实时,美国也一样。

现在台湾上线的开放资料也很少,总共二百多份,里面也有一些奇怪的数据,比如说台铁班车时刻信息有八十几万笔。资料是很多,但我去台铁网站查就好了,干嘛放这里?

另外,五都里面有三都(台北市、新北市、台中市)已经有数据入口网站,除了台北市之外,其他二都都冲太快,因为没甚么数据就上线了,而数据维护又赶不上。

数据是需要维护的,不是放一堆数据之后就没下文了,首长们想要超英赶美、追上国际风潮是好的,但不了解执行端在国外做开放数据背后需要甚么样的生态圈──法规、营运、预算层面怎么处理。

 

问:民间该怎么看待这些开放资料?

徐:不管是营利事业、非营利事业、媒体、乡民,透过看政府网站、已经释放出来的数据去关心公共事务,你会知道国家是怎么运作的、资源是怎么分配的、有甚么机会。这对于民间、对产业来讲是一种新的型态,是一种很大的信息交换文化的变革。

比如环保署公开PM2.5悬浮粒子各个观测站的数据,还有测站的每5分钟的观测截图,这数据一般人看不懂,到底现在空气污染很严重吗?会让小朋友过敏、气喘吗?那就需要有专业的人去解读。像这样的原始资料很多,开放这些资料后就可让一般人获得,专家可以解读,或是有兴趣的人去找出意义,可以去监督政府、创造新兴产业,或是运用到自己的生意,这都是可能的。

或像是政府标案信息,这本来就是行政院公共工程委员会网站上的公开数据,只是这些信息的检索接口让民众很难查,不容易看整个全貌,但有好心人把这些资料全部扒出来。

你可以拿去年一整年的标案数据分析,就可发现哪些公司政府标案打击率最高。一样按照游戏规则玩,为何工研院打击率九成?资策会只有四成五?有些公司一看就很清楚是陪榜公司,因为一年投了三百多个标只中一个?这些资料就很好玩。

另外,我把卫生署公开的医院名单几千笔用软件工具标在台湾地图上,发现真的在南回那里都没医院。可能大家大概知道医疗资源不平均,但标在地图上就造成视觉震撼;还可以迭上人口比例,用医院分布图加上人口比例转成直方图去看,这样就可以更精准的与民众做政策沟通。你用讲的民众没感觉,但图一做出来就会很震撼。

一个比较民主的社会才会去关注公共议题,台湾、亚洲大部分国家都比较不敢碰公共事务,都会认为是碰政治,去看资料的话就会发现问题、议题和机会。

至于商机部分,国外已经有一些公司搜集各国的开放数据,整理成开放数据的仓储。因为这么多国家都有开放数据,但是对于想看数据、想买数据的人其实没有时间去一一看,自然就会有厂商或是网络服务商来当作数据的中介者,提供给智库、网络服务商、做App的人等等。

但是台湾因为开放资料量不够,还没办法形成数据的规模经济去卖,而且台湾在开放资料授权上也有很多不清楚的地方,像是目前开放的二百多笔数据授权方式有二十几种!授权不清楚就很难应用。

 

问:开放数据(Open Data)和巨量资料(Big Data)的关系是甚么?

徐:其实这两者处理数据的层面不一样。

开放数据处理的是「格式」和「授权」。而巨量数据处理的是:有这么多复杂、变动这么快的数据,你要如何交叉运用,比如说在脸书的数据跟消费习性的数据、在哪里打卡的数据,这种数据是异质性的,怎么在这么多数据中快速地找出价值?这就是Big Data!

以实务上来讲,巨量资料像是金融、消费数据、悠游卡、网络上的消费行为,这些数据都不是开放数据。因为这都是企业所拥有的数据,所以跟开放是没关系的,企业当然可以玩自己的Big Data。

开放数据和巨量数据要有关系的话,应该这么讲:大部分国家里大量资料的拥有者其实是政府单位,像是气象是由国家的气象中心在做。这些国家的资料授权开放出来后,民间就可以用Big Data的技术、模式、应用来将这些数据发展,造成社会的创新。

所以国家如果有资料民主,民间就可以用新的技术创造新的价值。

 

徐子涵小档案

英文名:T.H. Schee

现任:Fertta Communication 执行长

学历:高中毕业

经历

忠泰生活开发股份有限公司网络事业体总监

忠泰生活开发股份有限公司  副执行长室特助

群利科技股份有限公司资深产品经理

三立电视股份有限公司数字内容事业部开发副理

神达计算机股份有限公司行动通讯事业处区域产品经理(台湾、俄罗斯)

中央研究院信息科学研究所项目经理

蕃薯藤信息股份有限公司信息整合服务处副理

顾问

英国开放知识基金会地区大使

奥地利林兹电子艺术大奖(电子社群)国际委员会

联合国全球地理空间信息计划(GGIM)愿景小组咨询顾问

部落格:http://blog.schee.info/

你可能會有興趣的文章

官商圈錢百億 湖南爆10萬人抗議
湖南湘西吉首市9月4日起爆發大規模群眾抗議示威。各個主要街道均被因官商勾結非法融資而受害的群眾攔堵,吉首市火車站被堵,火車停駛,…
看塑化風暴 「追塑」台灣食品安全問題
5月23日,昱伸香料公司負責人賴俊傑被彰化地檢署帶走,爆出了該公司生產的起雲劑含致癌及會導致生殖系統異變的有毒物質「塑化劑」。自此,…
陳光誠,大丈夫
陳光誠自由了!一位盲人,連滾帶爬地逃亡了二十個小時,然後在見義勇為者的幫助下進入了美國駐北京大使館。美國官員說陳光誠不願意離開中國,…
今夕何夕,見此良人
父親去世後,家裡冷清很多。獨居的母親開始參與大量的活動,希望藉此遠遠地逃離那份揮之不去的空虛。我知道她心中有塊地方已經空掉了,…
「上尊」B2B網路行銷 壓克力鑽、鈕釦新客戶成長三倍
網路時代之下,不僅許多消費者在網路上搜尋產品或服務,連許多企業都也在網路上尋求「解決方案」。過去,台灣非常多傳統產業的老闆或業務,…
香港回歸14週年前夕 民調重創一國兩制
就在香港主權回歸中國滿14週年的前夕,香港中文大學與香港大學個別民調顯示,超過半數的港人認為,目前的情況比回歸前還要差。無疑對中國當局「…
《香港人權與民主法案》遠水難解香港近渴
自從7月以來,香港反對派人士的重心一是放在繼續勇武抗爭,另一方面則努力遊說美國國會通過《香港人權與民主法案》(Hong Kong…
草木有情 植物也會自救與求援
人們常說:「人非草木,孰能無情。」實際上可能恰好相反,因為有的植物也是有感情、有知覺的。古文人也說過「感時花濺淚」、「草木同悲」、「…