AlphaZero問世：8小時完爆圍棋、國際象棋、日本將棋

2017-12-07 11:08　來源: 站長資源平臺　編輯: 等等瀏覽（1035）人

分享按鈕

　　通用AI問世！AlphaZero強化學(xué)習(xí)算法8小時完爆人類圍棋、國際象棋、日本將棋。日前，DeepMind團隊發(fā)表了最新論文，提出了全新的強化學(xué)習(xí)算法AlphaZero，它是一種可以從零開始，通過自我對弈強化學(xué)習(xí)在多種任務(wù)上達到超越人類水平的新算法，堪稱“通用棋類AI”。

　　據(jù)了解，AlphaZero算法可以再8個小時訓(xùn)練擊敗李世石版本AlphaGo；12小時訓(xùn)練擊敗世界頂級的國際象棋程序Stockfish；14小時訓(xùn)練擊敗世界頂級將棋程序Elmo。這是DeepMind團隊繼AlphaGo Zero的研究問世之后，帶給我們的又一全新算法，它是“更通用的版本”。

　　此外，我們看到這次的AlphaZero與AlphaGo Zero有幾點不同，首先AlphaGo Zero是在假設(shè)結(jié)果為贏/輸二元的情況下，對獲勝概率進行估計和優(yōu)化。而AlphaZero會將平局或其他潛在結(jié)果納入考慮，對結(jié)果進行估計和優(yōu)化。其次，AlphaGo和AlphaGo Zero會轉(zhuǎn)變棋盤位置進行數(shù)據(jù)增強，而AlphaZero不會。第三，AlphaZero只維護單一的一個神經(jīng)網(wǎng)絡(luò)，這個神經(jīng)網(wǎng)絡(luò)不斷更新，而不是等待迭代，四，AlphaZero中，所有對弈都重復(fù)使用相同的超參數(shù)，因此無需進行針對特定某種游戲的調(diào)整。

2898站長資源平臺站長工具：http://afrimangol.com/webtool.htm

【版權(quán)與免責(zé)聲明】如發(fā)現(xiàn)內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息發(fā)郵件至 kefu@2898.com ，我們將及時溝通與處理。本站內(nèi)容除了2898站長資源平臺（ afrimangol.com ）原創(chuàng)外，其它均為網(wǎng)友轉(zhuǎn)載內(nèi)容，涉及言論、版權(quán)與本站無關(guān)。

網(wǎng)站	權(quán)重	銷量
知之小工具成語欄目	6	160
海城運勢網(wǎng)	6	1
大寶導(dǎo)航網(wǎng)	5	94
中華萬年歷	5	8
如來助孕	5	0
主持人串詞網(wǎng)	6	25
深圳新聞網(wǎng)	8	7
紅墻健康行	6	16
六月聽書	6	265
星辰影視	5	0

AlphaZero問世：8小時完爆圍棋、國際象棋、日本將棋

上一篇：美的董事長兼總裁方洪波：未來家電人機交互

下一篇：技術(shù)激活媒介與內(nèi)容革新 AI賦能真實商業(yè)場景

北單實體店，一家通宵的北單實體店威信547216

谷歌瀏覽器not secure？google默認https如何關(guān)閉？

市面上考勤系統(tǒng)哪個好？

人力資源管理系統(tǒng)的部署方式有哪些？

網(wǎng)站每天都有收錄但總收錄不增加的原因

北單實體店，一家通宵的北單實體店威信547216

馬斯克慷慨解囊向洛杉磯政府交付1000臺呼吸機

早報：雷軍稱做硬件不賺錢三星Note20曝光

傳富士康正為蘋果測試iPhone折疊原型機

重磅來襲：吉利集團低軌衛(wèi)星互聯(lián)網(wǎng)項目啟動

戴爾公布兩款游戲顯示器兼容Nvidia G-Sync

消息盒

AlphaZero問世：8小時完爆圍棋、國際象棋、日本將棋

AlphaZero問世：8小時完爆圍棋、國際象棋、日本將棋