人工智慧自學三天 能勝出人類千年?

2016年3月,AlphaGo以4比1的成績打敗頂尖棋手李世石。Getty Images
第185期
岳超

北京時間10月19日凌晨,谷歌旗下的人工智慧公司DeepMind在世界頂級科學雜誌《Nature》上宣布:新一代AlphaGo Zero可以在沒有人類干預下自我學習,而且僅自我學習三天,就以100比0的成績戰勝第一代AlphaGo。AlphaGo項目的主要負責人David Silver表示:「過去人們普遍認為機器學習是基於巨量的大數據,但是從AlphaGo Zero身上,我們發現演算法比數據更重要。」

AlphaGo於2015年10月問世,在與韓國棋手李世石對弈之前,它已經打敗了歐洲圍棋冠軍樊麾。樊麾曾表示,當時他認為,一個電腦程式不可能打敗職業棋手,結果,他以0比5輸給了AlphaGo。他也因此加入DeepMind團隊,幫助訓練AlphaGo。

2016年3月,AlphaGo以4比1的成績打敗頂尖棋手李世石;2017年初,AlphaGo化名為「Master」,在網路上挑戰60名人類棋手,保持全勝;2017年5月,以3比0戰勝目前人類最強棋手中國棋王柯潔。

5個月後,第三代AlphaGo Zero問世,僅僅自學了三天,就分別擊敗了第一代AlphaGo和第二代AlphaGo Master。面對無師自通碾壓一切前輩的AlphaGo Zero,柯潔說:「人類顯得太多餘了……」

柯潔被認為是圍棋天才,6歲開始學棋,17歲時在世界排名第一。一個人類天才學習了十幾年,被Alpha Zero用三天時間超越。

DeepMind在《Nature》的論文公布後,悲觀、甚至恐慌的情緒蔓延,甚至有媒體一本正經地探討「未來是《魔鬼終結者》還是《駭客任務》」。

 

人控的「無師自通」

在AlphaGo Zero下棋的過程中,人類知識和經驗真的一點用都沒有嗎?事實並非如此。

據業內專家介紹,AlphaGo Zero並非沒有從人類的對局經驗和數據中學習,但這個演算法依然需要人類向它灌輸圍棋的規則:哪些地方可以落子、怎樣才算獲勝等。這一版去掉了人類教授棋譜的過程,一開始訓練時,AI(人工智慧)落子完全是隨機的,AlphaGo團隊的負責人David Silver透露,它一開始甚至會把開局第一手下在1-1(棋盤上不占目數的位置)。在和自己對弈過程中,演算法才逐漸掌握了勝利祕訣。Zero的確可說是第一次做到了無師自通。

然而,AlphaGo Zero雖然在棋盤上「威風八面」,但圍棋規則以及判定棋局輸贏,依然需要人類預先「設定」。所以「人類無用」、「機器可以自己產生認知」之說,都是錯誤理解。

 

「全面碾壓人類」實為空談

AlphaGo Zero發布後,媒體詢問:「這個演算法以後會用在哪些其他領域?」網友擔心:「這個AI會不會在各個領域全面碾壓人類?」

DeepMind聯合創始人哈薩比斯(Demis Hassabis)說,AlphaGo團隊的成員都已經轉移到其他團隊,嘗試將這項技術用到其他領域。

DeepMind期待AlphaGo Zero解決的是「其他結構性問題」,例如:蛋白質摺疊、降低能耗、尋找革命性的新材料。哈薩比斯說,AlphaGo可以看做是一個在複雜數據中進行搜尋的機器,包括新藥發現、量子化學、粒子物理學,也是AlphaGo可能大展拳腳的領域。

然而,AlphaGo Zero能否真的能迅速移植到其他領域呢?

有專業人士認為,這需要先了解它現在所解決的問題——圍棋具有哪些特性。首先,圍棋可以復盤,是能夠完美重現的演算法模型;其次,圍棋對弈雙方只有二個,訊息完全可觀測,不像在麻將、撲克裡,觀測不到對手的訊息;最後也是最重要的一點,圍棋對局可以用電腦迅速模擬,很快輸出輸贏信號。

這些圍棋特性對AlphaGo演算法的影響至關重要,因為能快速輸出結果反饋,才有了AlphaGo Zero創造的「無師自通」的奇蹟。

對比其他領域,幾乎都比圍棋還要複雜,例如:「發現新藥」問題,這和下圍棋有非常顯著的區別,就是「輸贏信號」能不能很快輸出。新藥品很多內部的結構需要通過搜索後,再製成藥,再到如何檢驗這個藥有效,這個閉環的代價非常昂貴、非常慢,現階段幾乎不可能。

這些現實讓AlphaGo強大的「自我學習」能力施展不了。不難推想,AlphaGo Zero在某些小領域內可以做得非常好,但其實並沒有「全面碾壓人類」的潛力。

分析人士認為,AlphaGo Zero的工程和演算法確實非常厲害。但千萬不要對此產生誤解,認為人工智慧是萬能的,所有人工智慧都可以無需人類經驗從零學習,得出人工智慧威脅論。AlphaGo Zero證明了AI在快速發展,讓我們看到在有些領域可以不用人類知識、人類數據、人類引導就做出突破。但是,AlphaGo Zero只能在單一簡單領域應用,更不具有自主思考、設定目標、創意、自我意識。即便聰明如AlphaGo Zero,也只能是人類給下定目標後,再由AI做好數字最佳化而已。

你可能會有興趣的文章

西湖之美 演繹中華神奇傳說
「上有天堂、下有蘇杭」是古往今來人們對杭州的讚美。而杭州之美,首推西湖秀麗的風光和迷人的景致。西湖位於浙江省杭州市西面,面積60平方公里,…
賴弘毅的家 30年垃圾不出門
晚餐時刻,一家人正愉快用餐。突然聽到熟悉的音樂「少女的祈禱」由遠而近。於是其中一人不得不放下碗筷,提著垃圾袋奪門而出…… 「垃圾」…
因為「天氣太好」 王如玄擔下勞委會主委重任
現任勞委會主委王如玄在入閣前,就已經是名律師,也是台灣著名的女權運動者。雖然和藍綠重量級政治人物都保持很好的關係,但無黨無派的王如玄,…
網路股價格回落 逢低買進時候到了?
自金融海嘯後,不僅金融類股票疲軟不堪,在過去兩年內上市的許多網路和社交網站股票價格也回落了很多。逢低買進的投資者可能想知道,…
「發光」的森林小屋
前幾期本專欄介紹了阿丹為了自建房舍,特意前往賓州添購所需木料,過程中巧遇神祕的阿米許人(Amish)的點滴。 本期,…
媽媽魚安心超市 科技人用半導體精神賣魚
以媽媽為名,「媽媽魚安心超市」的目標在於提供消費者最新鮮、零汙染的魚貨。從漁船捕撈,上岸清洗、去鱗、去肚,六小時內急速冷凍,直送到店面銷售…
惠風文集 - 評審席上
在巨大的家庭與親友期待下從媒體工作回任教職。說「回任」是因為我已經千辛萬苦、想方設法離開過一次,但離開得不夠徹底,結果當然是「斬草不除根,…
經濟分析:理性自殺還是不理性自殺
經濟學分析問題,特別是情緒問題,像自殺這種人命關天的事,常會被批評為「冷血」。其實不是,是「冷靜」。新古典經濟學的開創者馬夏爾(…