人工智能自学三天 能胜出人类千年?

2016年3月,AlphaGo以4比1的成绩打败顶尖棋手李世石。Getty Images
第185期
岳超

北京时间10月19日凌晨,谷歌旗下的人工智能公司DeepMind在世界顶级科学杂志《Nature》上宣布:新一代AlphaGo Zero可以在没有人类干预下自我学习,而且仅自我学习三天,就以100比0的成绩战胜第一代AlphaGo。AlphaGo项目的主要负责人David Silver表示:「过去人们普遍认为机器学习是基于巨量的大数据,但是从AlphaGo Zero身上,我们发现算法比数据更重要。」

AlphaGo于2015年10月问世,在与韩国棋手李世石对弈之前,它已经打败了欧洲围棋冠军樊麾。樊麾曾表示,当时他认为,一个计算机程序不可能打败职业棋手,结果,他以0比5输给了AlphaGo。他也因此加入DeepMind团队,帮助训练AlphaGo。

2016年3月,AlphaGo以4比1的成绩打败顶尖棋手李世石;2017年初,AlphaGo化名为「Master」,在网络上挑战60名人类棋手,保持全胜;2017年5月,以3比0战胜目前人类最强棋手中国棋王柯洁。

5个月后,第三代AlphaGo Zero问世,仅仅自学了三天,就分别击败了第一代AlphaGo和第二代AlphaGo Master。面对无师自通碾压一切前辈的AlphaGo Zero,柯洁说:「人类显得太多余了……」

柯洁被认为是围棋天才,6岁开始学棋,17岁时在世界排名第一。一个人类天才学习了十几年,被Alpha Zero用三天时间超越。

DeepMind在《Nature》的论文公布后,悲观、甚至恐慌的情绪蔓延,甚至有媒体一本正经地探讨「未来是《魔鬼终结者》还是《黑客任务》」。

 

人控的「无师自通」

在AlphaGo Zero下棋的过程中,人类知识和经验真的一点用都没有吗?事实并非如此。

据业内专家介绍,AlphaGo Zero并非没有从人类的对局经验和数据中学习,但这个算法依然需要人类向它灌输围棋的规则:哪些地方可以落子、怎样才算获胜等。这一版去掉了人类教授棋谱的过程,一开始训练时,AI(人工智能)落子完全是随机的,AlphaGo团队的负责人David Silver透露,它一开始甚至会把开局第一手下在1-1(棋盘上不占目数的位置)。在和自己对弈过程中,算法才逐渐掌握了胜利秘诀。Zero的确可说是第一次做到了无师自通。

然而,AlphaGo Zero虽然在棋盘上「威风八面」,但围棋规则以及判定棋局输赢,依然需要人类预先「设定」。所以「人类无用」、「机器可以自己产生认知」之说,都是错误理解。

 

「全面碾压人类」实为空谈

AlphaGo Zero发布后,媒体询问:「这个算法以后会用在哪些其他领域?」网友担心:「这个AI会不会在各个领域全面碾压人类?」

DeepMind联合创始人哈萨比斯(Demis Hassabis)说,AlphaGo团队的成员都已经转移到其他团队,尝试将这项技术用到其他领域。

DeepMind期待AlphaGo Zero解决的是「其他结构性问题」,例如:蛋白质折迭、降低能耗、寻找革命性的新材料。哈萨比斯说,AlphaGo可以看做是一个在复杂数据中进行搜寻的机器,包括新药发现、量子化学、粒子物理学,也是AlphaGo可能大展拳脚的领域。

然而,AlphaGo Zero能否真的能迅速移植到其他领域呢?

有专业人士认为,这需要先了解它现在所解决的问题——围棋具有哪些特性。首先,围棋可以复盘,是能够完美重现的算法模型;其次,围棋对弈双方只有二个,讯息完全可观测,不像在麻将、扑克里,观测不到对手的讯息;最后也是最重要的一点,围棋对局可以用计算机迅速仿真,很快输出输赢信号。

这些围棋特性对AlphaGo算法的影响至关重要,因为能快速输出结果反馈,才有了AlphaGo Zero创造的「无师自通」的奇迹。

对比其他领域,几乎都比围棋还要复杂,例如:「发现新药」问题,这和下围棋有非常显著的区别,就是「输赢信号」能不能很快输出。新药品很多内部的结构需要通过搜索后,再制成药,再到如何检验这个药有效,这个死循环的代价非常昂贵、非常慢,现阶段几乎不可能。

这些现实让AlphaGo强大的「自我学习」能力施展不了。不难推想,AlphaGo Zero在某些小领域内可以做得非常好,但其实并没有「全面碾压人类」的潜力。

分析人士认为,AlphaGo Zero的工程和算法确实非常厉害。但千万不要对此产生误解,认为人工智能是万能的,所有人工智能都可以无需人类经验从零学习,得出人工智能威胁论。AlphaGo Zero证明了AI在快速发展,让我们看到在有些领域可以不用人类知识、人类数据、人类引导就做出突破。但是,AlphaGo Zero只能在单一简单领域应用,更不具有自主思考、设定目标、创意、自我意识。即便聪明如AlphaGo Zero,也只能是人类给下定目标后,再由AI做好数字优化而已。

你可能會有興趣的文章

第十章 香道
般若酒泠泠,飲多人易醒。余住天台山,凡愚那見形。 常遊深谷洞,終不逐時情。無思亦無慮,無辱也無榮。(唐.拾得) 最近陰雨綿綿,…
MSN將停用 來回憶您的「登登登」經驗吧!
曾經是許多人仰賴與親友維持聯繫的通訊軟體MSN將退場。微軟表示,明年度起,登入MSN隨即將被轉至通訊軟體Skype,也就是說,…
蔡衍明親上火線 旺中案爭議更「旺」
5月7日,國家通訊傳播委員會(NCC)舉辦了「旺中案」(旺中寬頻併購中嘉有線系統台案)第二次公聽會。…
1000 萬退休金 做好三大規劃享受生活
要有多少錢,才能過退休生活?2015年2月,花旗銀行公布2014年「個人財務健檢」調查結果,資料顯示有58%的國人認為,需有1,…
美國政府險「關門」 午夜驚魂過關
美國政府近日的「關門危機」鬧得沸沸揚揚,整個事件戲劇性十足。4月8日,在距離臨時預算到期僅1小時的最後時刻,…
如何運用自媒體(之十七): 臉書廣告沒有效怎麼辦?
2017年很多網路商家都不免心中有痛,只要是過去兩、三年至今持續在臉書(Facebook)購買付費廣告的賣家,都能明顯地感覺「…
普印通切入利基市場 「除味」服務成為一門生意
想像剛吃完火鍋,離開餐廳前,你在門口的「除味機器」前轉個三圈,身上的火鍋味隨之消失,這樣的設備似乎頗受消費者的喜愛。知名火鍋連鎖店「海底撈…
武士道並不那麼可貴 宅男並不全然頹廢
織田信長是日本安土桃山時代的大名(「大名」是日本封建時代對大領主的稱呼)。正當室町幕府式微,天下板蕩之際,他崛起於尾張一國,…