比 AlphaGo更恐怖 ! AlphaZero榮登《科學》雜誌

▲(圖/翻攝自 DeepMind 網站)
編輯中心/綜合報導-2018-12-11 12:58:45
由人工智慧研發團隊 DeepMind 發表的 AlphaZero 登上最新一期《科學》雜誌封面。這已經不是 DeepMind 第一次登上國外權威雜誌的封面,每一次 DeepMind 被報導都會獲得人工智慧學界的一陣歡呼,這次更是如此。同時擊敗圍棋、將棋、西洋棋最強 AI 的 AlphaZero ,被認為可能代表著深度學習 AI 的終極解答。

我是廣告 請繼續往下閱讀

《科學》雜誌表示,如果人們想透過一套計算方式去解決多個不同的複雜問題,那麼唯一能夠達成這目標的辦法就是,創造一個自主學習的人工智能系統,讓它自行學著去解決問題。而 AlphaZero 辦到了。

▲(圖/翻攝自 fossbytes )

根據 DeepMind 的介紹, AlphaZero 使用完全無需人工特徵、無需任何人類棋譜、甚至無需任何特定最佳化的通用強化學習演算法。舉例來說,由於圍棋的規則明顯和其他棋類如西洋棋、將棋不同,像是圍棋的每一子都是完全相同的、且棋盤也是完全對稱的。

為了因應圍棋的特殊性, AlphaZero 的前身 AlphaGo Zero 便有設計專為圍棋使用的特殊計算程式。但 AlphaZero 沒有,作為一個「通用型」學習 AI , AlphaZero 完全僅依靠深度神經網絡和蒙特卡洛搜索樹算法的自我學習。在完全沒有輸入人類的棋譜、沒有輸入特別設計的專用計算程式的情況下,只藉著自我對弈的不斷學習, AlphaZero 就已經能夠分別在圍棋將棋西洋棋擊敗了原本的世界最強 AI 。

而且, AlphaZero 打敗原本的西洋棋世界最強 AI 只花了 4 小時學習,打敗原本的將棋世界最強 AI 只花了 2 小時學習。打敗原本的圍棋世界最強 AI 只花了 30 小時學習。 AlphaZero 最大的特色就是可以學會並精通不同的棋類競賽,而且它每一步棋所須計算的可能性變化,比之前的 AI 要來得少許多。換句話說, AlphaZero 並不是去無限量的計算棋盤所有可能性,而是透過自己的深度神經網絡研判,專注於小範圍的計算。

▲(圖/翻攝自 DeepMind 網站)

這樣的「思考模式」,其實正和一般人類棋士無異。西洋棋前世界冠軍 Garry Kasparov 就表示, AlphaZero 的下棋風格靈活多變,「和我很像!」,且不同於其他 AI 程式傾向保守的先求立於不敗, AlphaZero 非常具有侵略性,更喜歡冒險。傳統的人工智慧程式在下棋時,憑藉強大計算能力很少犯錯,但在面對不清楚「該計算什麼」的局面時,便容易出現失誤。反觀 AlphaZero ,它呈現出的是一種「感覺」、「洞察」,一種對棋盤上局勢發展的直覺。

曾和 AlphaGo Zero 對奕的圍棋棋士李世石便說過「我改變了看法, AlphaGo Zero 不只是機器,它具有創造性」。而現在同時精通圍棋將棋西洋棋的 AlphaZero ,顯然擁有更強更靈活的創造能力。

我是廣告 請繼續往下閱讀

過往的人工智慧程式,往往只能精通專一領域,只能處理特定情境的問題。但 AlphaZero 不同,它能夠適應各種規則。這讓人相信,未來可以將這深度自主學習的 AI 能力,運用在其他問題上。比如說, DeepMind 團隊開發的最新家族成員 AlphaFord ,便是投入在學習基因序列的蛋白質結構相關問題。假如在此領域 AlphaFord 也能獲得驚人成就,那可不同於在棋類競賽贏過對手,將會真正替人類社會帶來巨大改變。

下一次登上封面的會否就是 AlphaFord ?深度學習的人工智慧究竟能發展到何種里程碑,讓我們一起期待吧。

我是廣告 請繼續往下閱讀

我是廣告 請繼續往下閱讀