GO 板


LINE

看板 GO  RSS
AI專家:攻克圍棋原理已找到 GPT學圍棋令人期待   國家圍棋隊官方合作夥伴少年縱橫特約報導。   2017年柯潔淚灑烏鎮後,人類圍棋與人工智慧圍棋之間的對抗徹底沒有了懸念。雖然 AlphaGo退役了,但根據他們的相關論文,後來又衍生出了絕藝、天壤、星陣、KataGo等 諸多圍棋人工智慧,有的已經成為了大家日常研究圍棋的工具。在研發這些人工智慧的專 家眼裡,“人工智慧攻克圍棋了嗎”這個問題是什麼樣的呢?   天壤與樸廷桓的“人機大戰”   李凱華,原天壤圍棋負責人,2018年人機對弈擊敗樸廷桓。   新浪棋牌:您覺得人工智慧攻克圍棋了嗎?   李凱華:沒有。圍棋的變化數量決定了其最優解集合都可能是一個無法估計的大小。 人工智慧當然沒有攻克圍棋。人工智慧目前所做到的是其探索的圍棋變化數量比人類已經 探索的圍棋變化數量大出很多個數量級,大約是:AI目前所有的訓練棋譜 / (人類已經 下過的所有棋譜+人類已經研究過的變化圖) 大約 = 1萬倍到10萬倍。   這個數量距離圍棋合法變化總數也就是10的170次方個盤面,仍然有相當大的差距。   當然對於科學研究來說,AI已經做到了在現有技術條件下最大限度的探索。原因有兩 點:   1。 通過數學層面的推導,可以得出通過深度神經網路和強化學習可以不斷讓棋力變 強,所以只要:人類有足夠的時間和足夠的存放裝置可以生成並存儲10的170次方個盤面 ,一定可以找到圍棋的最優解。科學研究上走通了這條路就可以了。畢竟即使每一顆原子 上都能存一個合法變化的,宇宙裡也只有10的70次方個原子,離圍棋的合法盤面總數還有 10的100次方倍。   2。 圍棋是完全資訊下的零和博弈,相比之下,德撲、麻將這種非完全資訊博弈,以 及協作情況下的非零和博弈,甚至跳出博弈論層面,在生成層面,有更複雜的情況需要去 研究,所以在14年Ian Goodfellow搞出來了生成式對抗網路,17年Google大腦搞出來了《 Attention is All You Need》,也就是ChatGPT的基礎Transformer模型。然後AI研究的 領域前沿就一直是在Transformer模型了。   3。 現在來看結論是客觀上AI並沒有真的攻克圍棋,但是原理上已經找通了攻克圍棋 的方法,所以科學上可以認為“人工智慧已經攻克了圍棋”。   新浪棋牌:您認為當前人工智慧圍棋最高水準達到了什麼程度?   李凱華:1。因為圍棋的合法盤面數是10的170次方,人類大概探索過不超過100萬種 變化,人工智慧探索過差不多100億種變化。即使如此,還有10的160次方種變化,所以如 果圍棋上帝是100的話,目前AI探索了不到兆分之一。人類是AI的萬分之一。離之前說的 7%,都相去甚遠。   2。 當前人工智慧的最高水準如果按最新的KataGo的強化學習來說,最新的模型達到 了13500左右的Elo分。   3。 注意Elo分只能用來比較同一個體系下的相互強弱,也就是AI的Elo分和人的等級 分是兩個體系,不能直接比較數值。除非找到一個錨點,比如用李世石的Elo分來估計 AlphaGo Lee版本的棋力。   4。 但是只有兩個人有充分的對局之後,Elo分所體現的強弱才有效,所以比如古力 和李世石兩個人下了幾十盤棋,他們之間的Elo分差距可以表示他們的棋力強弱,但是想 要Elo分的誤差在5分以內,兩個選手需要對局至少89局。想要誤差在3分以內,兩個選手 需要對局至少200局。所以所謂用李世石的Elo分帶入AlphaGo的Elo分再比較AlphaGo和當 時的棋手之間的棋力差距,純屬娛樂。對局太少。   5。 Elo分還有膨脹的現象,即如果模型都是同一個風格,或者同一個體系的話,同 時沒有外部模型的干擾,如果一個階段的模型出現過擬合的現象,那麼很快分數就會因為 這些模型被膨脹起來。後續也無法進行修正。   6。 目前如果粗略估計一下棋力的話,最強的KataGo如果搭配很好的分散式伺服器, 比如說給個100張A800顯卡,或者最新的那個GB800顯卡,讓人類最強棋手3-4子是可能的 。不過那一局棋的電費恐怕得小10萬了。   2018年與天壤對弈的樸廷桓九段   新浪棋牌:後續研究的終點在哪裡,還有無難關?   李凱華: 1。 從AlphaGo到Leela到KataGo的路線相當於讓一個嬰兒只看棋譜學下棋 。腦子只會下棋。所以需要大量的棋譜來教他。同時因為他其實是看圖學下棋,沒有邏輯 推理能力,所以想要變強只能不停地自己下,看更多的變化來學習下棋。顯得很笨重。   2。 後續可能會希望讓ChatGPT,一個10幾歲智商但是什麼都會的孩子,但是有一定 的語言方面的推理能力,看能不能不通過看圖的方式,而是研究棋譜的方式來學下棋,有 沒有可能用更少的棋譜來實現跟AlphaGo一樣的強度。甚至等更強的ChatGPT 5.0版本,如 果能相當於一個成年人的推理能力,應該會更順利。   人機對弈現場   新浪棋牌:人工智慧圍棋陪練技術有何發展?   李凱華: 1。 如果能走通讓語言模型來下棋的話,那麼讓語言模型來解釋它為什麼 這麼下棋就是一件很輕鬆的事情了。   2。 目前的話職業棋手主要還是靠背和猜來理解人工智慧下的棋。   3。 面向孩子的AI陪練的等級和難度非常能把握,因為孩子棋力的提升是不連續的, 往往是一個階段性躍升的情況。而且不同的棋力所對應的計算力、博弈能力也不是線性提 升的,導致目前所有的調參都很蠢,基本上是無參可調的情況。這一方面可能是一個長期 存在的問題。不妨等著4(a)解決了之後交給AI來解決吧。   (周遊) https://sports.sina.com.cn/go/2024-05-14/doc-inavenmw3616642.shtml --
QR Code



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.176.190.76 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/GO/M.1715696472.A.435.html
1F:推 KAOKAOKAO: 但是沒有理由認為 Chain of Thought 串出來的「解析」 05/15 14:11
2F:→ KAOKAOKAO: 真的是它下出那手的理由 05/15 14:11
3F:推 aegis43210: 近期圍棋AI並沒有革命性的進化,對GPT下棋應該也沒明 05/15 23:10
4F:→ aegis43210: 顯優勢 05/15 23:10







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:Boy-Girl站內搜尋

TOP