日前位在英國倫敦的Google Deepmind團隊發表了一篇最新論文,提出一種全新的強化學習演算法「AlphaZero」,這也是該團隊繼之前推出了擊敗歷代「AlphaGo」的「AlphaGo Zero」後,不到50天又再度突破自我。
根據團隊所發表的論文可見,從零開始的「AlphaZero」,除了學會基本規則之外,沒有任何其他的知識,卻接連取得了多項戰績;包括在4小時內擊敗了有最強國際象棋人工智慧程式之稱的「Stockfish」,在2小時內擊敗了最強將棋人工智慧程式「Elmo」,更在8小時內擊敗了曾經大勝南韓棋王李世乭的初代「AlphaGo」,最後則在34個小時之內,完勝「AlphaGo Zero」。
▲曾經大勝南韓棋王李世乭(前右)的初代「AlphaGo」,也敗給了「AlphaZero」。(圖/達志影像/美聯社 , 2017.12.7)
論文還指出,「AlphaZero」就是一種可以從零開始,通過自我對弈進行強化學習,並在各種不同的任務上,達到超越人類水平的新型演算法,稱作「通用棋類AI」;而DeepMind團隊也表示,期待未來能夠利用「AlphaZero」來解決重大的醫療問題,那些人類歷經了數百年都研發不出的重大疾病療法,靠著這套程式,將可望在數周甚至數日之內研究出來。
我是廣告 請繼續往下閱讀
▲曾經大勝南韓棋王李世乭(前右)的初代「AlphaGo」,也敗給了「AlphaZero」。(圖/達志影像/美聯社 , 2017.12.7)
論文還指出,「AlphaZero」就是一種可以從零開始,通過自我對弈進行強化學習,並在各種不同的任務上,達到超越人類水平的新型演算法,稱作「通用棋類AI」;而DeepMind團隊也表示,期待未來能夠利用「AlphaZero」來解決重大的醫療問題,那些人類歷經了數百年都研發不出的重大疾病療法,靠著這套程式,將可望在數周甚至數日之內研究出來。