AlphaGo 將在 2017 年重磅復出,業內人士怎麼看?

導語:DeepMind 正在全力提高 AlphaGo 的智能程度,全新版 AlphaGo 將在 2017 年復出下棋。


今日,DeepMind CEO Demis Hassabis 在 Twitter 上發佈聲明:他們正在全力提高 AlphaGo 的智能程度,全新版 AlphaGo 將在 2017 年復出下棋。DeepMind 會在近期內公佈更多信息。

隨後樊麾也在微博上發文稱 AlphaGo 的棋力得到瞭巨大的提升。

樊麾現任法國圍棋隊總教練,曾三度獲得歐洲冠軍,是第一位與 AlphaGo 交手汽車重低音電容的職業棋手,去年 10 月,他在一場閉門比賽中 0 比 5 敗給機器。隨後樊麾加盟瞭DeepMind團隊,擔任專職陪練。

今年 3 月李世石與 AlphaGo 大戰之後,柯傑非常期待挑戰 AlphaGo。國傢體育總局棋牌運動管理中心黨委書記楊俊安曾在公開場合披露柯潔將挑戰 AlphaGo,消息一出被 DeepMind 否認。據業內人消息,中國棋院確實與 DeepMind 達成對戰協議,但由於特殊原因,遲遲未能公佈。因此,柯潔在明年對戰 AlphaGo 的概率非常大。

一年時間的“閉關修煉”,AlphaGo 可能在幹嘛?此前田淵棟在《AlphaGo 為什麼那麼厲害?》一文中提到:

與之前的圍棋系統相比,AlphaGo 較少依賴圍棋的領域知識,但還遠未達到通用系統的汽車音響後級程度。職業棋手可以在看過瞭寥寥幾局之後明白對手的風格並采取相應策略,一位資深遊戲玩傢也可以在玩一個新遊戲幾次後很快上手,但到目前為止,人工智能系統要達到人類水平,還是需要大量樣本的訓練的。

業內人士分析,AlphaGo 隱退的這一年間,它可能會進行大量的樣本訓練,應用增強學習不斷與自己“左右手互博”:在電腦裡自行模擬,產生新的棋局,使得收集到的經驗和樣本變得更多,逐步增強自己的能力。

與此同時,田淵棟也解釋到,樣本訓練固然重要,但動態實戰經驗所起到的作用可能會更大。

在 AlphaGo 中,增強學習(Reinforcement Learning)所扮演的角色並沒有想像中那麼大。在理想情況下,我們希望人工智能系統能在對局中動態地適應環境和對手的招式並且找到辦法反制之,但是在 AlphaGo 中增強學習更多地是用於提供更多質量更好的樣本,給有監督學習(Supervised Learning)以訓練出更好的模型。

出於這方面的考量,DeepMind ?a href="http://carup.8e.com.tw">擴大機改電容逊獾软敿馄迨终腥膑庀陆o AlphaGo 做陪練,專門進行動態實戰訓練,至於效果如何,暫時還無法得知。IBM 資深工程師兼弈城業餘 4 段棋手Zhuang Zhuang 向雷鋒網(公眾號:雷鋒網)透露:

AlphaGo 對戰李世石時是 V18 版,現在為 V20 版,明年初正式發佈即便是 V21 版也不奇怪。從表面來看,至少三個版本的更迭大致可以看出 AlphaGo 的升級速度相對較快,實力應該有著不少提升。

柯傑與 AlphaGo 誰厲害這一問題一直被擺在熱議話題中,那麼人類棋手在與 AI 對戰時應該註意什麼?Zhuang Zhuang 指出:

與機器交手的心態很重要,這不同於和真人對戰。職業棋手在準備重大比賽的時候,可以研究對手的棋風偏好,可以準備一些佈局套路,對局時可以在一定程度上推測對手的選擇,但這些對 AlphaGo 都不管用。AlphaGo 的棋風是什麼?其實不是那麼容易說清楚,但是有一點應該是公認的,就是價值判斷絕大部分情況下超過人類棋手,它的選擇沒有感情,不是基於棋風,是基於勝率、價值。當棋手面對 AlphaGo 這樣強勁對手,最佳策略就是不斷追求最善、最直接的一手,這樣才能最大化勝率。在這期間,棋手應該多與冷冰冰的機器系統交戰,形成應對機器棋手的獨特心態。

除瞭 AlphaGo 外, Zen 圍棋 AI 目前也已升級到瞭 V13,智能程度不俗。可以預見未來我們看到的不僅是 AI 與人之間的較量,甚至還有各公司水平超越人類的圍棋 AI 系統之間的對決。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow
    全站熱搜

    wwc864o0u8 發表在 痞客邦 留言(0) 人氣()