作者NoPTT (一角兩角三角形!)
看板specialman
標題Fw: [新聞] 台版AlphaGo在交大 程度接近職業棋士
時間Tue Mar 22 20:58:41 2016
※ [本文轉錄自 Gossiping 看板 #1MwKok83 ]
作者: honamida (honamida) 看板: Gossiping
標題: Re: [新聞] 台版AlphaGo在交大 程度接近職業棋士
時間: Wed Mar 16 20:08:11 2016
※ 引述《celestialgod (天)》之銘言:
: 1.媒體來源:
: 蘋果日報
: 2.完整新聞標題:
: 台版AlphaGo在交大 程度接近職業棋士
: 3.完整新聞內文:
: 備受各界矚目的「人機大戰」最終回剛剛結束,Google團隊開發的人工智慧圍棋軟體
: AlphaGo贏得勝利,以4勝1負結束跟南韓棋王李世石震撼全世界,其實在這之前
: ,國立交通大學就有一台未曝光的電腦圍棋程式CGI,在短短1年研發後,就已成功挑戰職
: 業棋士,並在上月底擊敗棋城(知名對弈網站)業餘七段棋士,以1勝1負的成績與二段職
: 業棋士林杰漢打成平手,成績令人側目。
: 由交通大學資訊工程研究所教授吳毅成的實驗室所研發的人工智慧程式CGI(CGI Go
: Intelligence),主要是由吳廸融同學撰寫,,吳毅成說,10年前蒙地卡羅樹狀搜尋演算
: 法(MCTS),大幅提升了人工智慧程式強度,近年來「深度學習」技術模擬人腦神經元,
: 讓人工智慧辨識更精確、更接近人類大腦,又再大幅提升圍棋程式到「職業段位」,這些
: 技術未來應可應用在醫療、防災等問題上,可對人類作出更多的貢獻。
: 吳毅成說,從去年底,陳冠文、藍立呈兩位同學加入開發團隊,開始研發「深度學習」技
: 術,並應用在CGI程式上,今年2月,在CGOS(圍棋程式網站)排名中,與過去一直都是最
: 強的日本圍棋程式ZEN不相上下,最近兩周,研究團隊密集邀請業餘高段棋士測試,CGI已
: 領先的成績,擊敗許多棋城7段棋士。
: 「前兩天CGI挑戰2段職業棋士,打成平手」,吳毅成說,在沒有讓子的情形下,CGI與2段
: 職業棋士林杰漢打成1勝1負平手,可見CGI棋力已具有業餘高段棋士水準,未來若在更多
: 的資源挹注下,希望有機會成為「台版AlphaGo」。
: 吳毅成表示,AlphaGo使用數千核心電腦、數百顆GPU來執行演算,目前CGI仍未擁有這樣
: 頂級的配備和資源,但實驗室目前擁有非常多優秀研發,例如日前火紅的「2048」遊戲,
: 在研究團隊的研究下,研發出一款人工智慧程式,並成為全世界第一個達到65536方塊的
: 紀錄,成為另類台灣之光。
: 交大表示,吳毅成教授是六子棋的發明人,指導研究團隊多年來發展許多棋牌類遊戲的人
: 工智慧程式不遺餘力,並屢獲得國際奧林匹亞冠軍,2013年更同時獲得五項冠軍(包括六
: 子棋、禁圍棋、暗棋、麻將、Nonograms),為有史以來獲得最多冠軍的團隊。(突發中
: 心黃羿馨/新竹報導)
: 4.完整新聞連結 (或短網址):
: http://www.appledaily.com.tw/realtimenews/article/life/20160315/816708/
: 5.備註:
: 所以跟alphogo用的技術差不多?!
和朋友借帳號來闢謠一下
因為實在不想被說來沾光的
先講結論
相較 AlphaGo 我們和 AlphaGo 差很多
但也沒爛到 只是隨便弄弄
好歹我們常常在實驗室到半夜兩點
當然 Google單機還是比我們強超多
Google 無論在人力上 還是CNN的技術上
都優於我們 (我們去年才開始研究CNN)
但問題還是在於機器數量真的差太大了
如果訓練一個可用的模組 他們用一個禮拜了話
我們因為機器數量的關係 要超過五個月
所以我們連複製 Google 的結果都相當困難
CNN(convolution neural network)
在圍棋AI應用中 大約一年半前才開始有人發相關的PAPER
那個時候的結果還沒有很好
ZEN(最強的AI之一)的作者 也不止一次說
他覺得 重點不是CNN 而在於模擬的過程
而他們模擬的品質也真是我們所望塵莫及的
那個時候 最強的AI的強度大約 KGS(一個下網路圍棋的平台) 六段
而我們只有廢廢的KGS 三段
去年大約10月的時候 大家紛紛發現CNN的強大
Zen CrazyStone Facebook 都開始加了
我們也在11~12月時在我們程式上得到不錯的結果
http://www.yss-aya.com/cgos/19x19/bayes.html
原本在這個網站上 我們 ELO 只有 2400
加完之後馬上 變成2900 而那個時候最強的 ZEN也只有 3000
而在圍棋AI社群中 三月在日本有一個重要的比賽 UEC
大部分強的程式 都會參加
所以當我們聽到 Google 沒有打算參加 都有不小的疑惑
因為聽 Aja 的說法 Google 的結果很好
時間來到今年一月
當大家都透過 CNN 好不容易快要讓各自的程式達到 夢寐以求的職業門檻
連祖克柏都公開自豪的說他們程式很強
Google 就發表了他們的 Paper 表示他們在去年10月就贏了歐洲職業
這就像狠狠打了所有做圍棋AI人巴掌 原來 Google 不參加 UEC 是因為已經不同等級了
而且還敢點名李世石來下
但其實我在看完論文後 還是不相信 Google 能下的贏李世石
因為他還是沒有處理 MCTS的很多致命傷
接下來大家就知道了 李世石被 1:4
Google 應該加了不少新招 減少了MCTC的致命傷
我們也只能等他們新的 paper 才知道了
最後講一個比喻好了
假如贏人類最強 像吃巴龍
以前我們像裸裝 怎麼打 都沒有扣血
有CNN後 我們像有三件裝 血總算開始會扣了 感覺很有希望吃掉
當大家點的很開心的時候
Google 像農了十萬Q的狗頭 突然出現
一棒就把頭撿走了
無奈啊…
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.167.42
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Gossiping/M.1458130094.A.203.html
1F:→ kevin751231: 嗯嗯有道理 03/16 20:10
2F:推 tryagain24: 柯J表示:都不是我的對手 03/16 20:11
3F:推 nolimit: 推....教授要抓你去繼續寫論文? 03/16 20:11
論文現在快沒有辦法發了 如果我們沒有追上Google QQ
4F:推 achihc: 狗頭只要農Q, 沒人能撐過一棒! 03/16 20:12
5F:推 blacktom: 推,真相 03/16 20:13
6F:推 Bihrava: 推 03/16 20:13
7F:推 auir: GNN比較強 03/16 20:14
8F:推 lworld: 只能說Google也有去點外星科技樹 QQ 03/16 20:14
9F:推 s21995303: 專業給推 03/16 20:15
10F:推 momocom: 那你們的程式可以贏黑嘉嘉嗎 03/16 20:15
11F:推 laberic7766: 推 03/16 20:16
12F:推 wyvernlee: 最後一段算宅嗎 ? 03/16 20:16
13F:推 eas06u4: 有笑有推 03/16 20:17
14F:→ newsnew: Google已經上太空 其他人才剛開始殺豬公 03/16 20:17
15F:推 luvfilm: 推推!aja是你? @@ 03/16 20:19
16F:推 appoo: 很淺顯易懂,研究的路很漫長,希望你們繼續走下去 03/16 20:20
17F:推 cka: 推狗頭 03/16 20:22
18F:推 Virus5566: 台灣就是唱衰的人比會做事的多太多 加油吧交大Aja 03/16 20:22
19F:推 calamus: 推 加油~~ 03/16 20:25
20F:推 adonisXD: 好奇問一下是輸在軟體還是硬體 單看排名跟ZEN有的拼說 03/16 20:25
除了Google之外 我們硬體沒有到輸
軟體技術上 跟Google比也還不夠 不過幾乎有理解了
我們傳統做棋類AI的一年前 連想都沒有想要用CNN
21F:推 rodd12345: 113推 03/16 20:26
22F:推 tonyselina: 推。 希望你們加油 03/16 20:26
23F:推 Whitening: 舉例淺顯 03/16 20:27
24F:推 thirtyto: 03/16 20:27
25F:推 maxmessi: 推! 03/16 20:27
26F:推 birdy590: 這領域很燒錢 硬體和維持費用都是 03/16 20:28
真
27F:推 yannicklatte: 推 03/16 20:28
28F:推 birdy590: 所以大型內容業者在這方面有先天上的優勢 03/16 20:30
29F:推 mgdesigner: 1推真誠 03/16 20:31
30F:推 steven211: XD 03/16 20:32
31F:推 coolda: 加油 03/16 20:32
32F:推 bloodashih: 推 03/16 20:33
33F:→ RuleAllWorld: 怎麼交大變成看別人論文,寫程式,比硬體的貨 03/16 20:33
四億鎂加二十幾個菁英弄出來的東西
不學嗎?XD
其實這點上我覺得很幸運
沒有Google 我畢業前也不會有這些東西可以學
我們當然有自己在嘗試的
但那就是機密了
34F:推 a1s2d342001: 推 03/16 20:33
35F:推 uTorrent: google常幹這種事情啊.. 03/16 20:37
36F:推 OAzenO: 人家狗頭有一整個團隊在幫忙農 我們只能撿人家剩下的尾刀 03/16 20:39
37F:推 skizard: 你要註解一下MCTS:蒙地卡羅樹狀搜尋 03/16 20:40
既然你提了 我就介紹一下
其實在 2006年 MCTS 還沒出來前
圍棋AI只有七八級水準
就好像走在路上連小兵都惹不起
38F:推 Virus5566: 碩士誰不是先看別人論文 搞懂後才能站巨人肩上你讀過沒 03/16 20:41
39F:推 OSDim: 幫QQ 03/16 20:41
40F:推 e761031: 推 03/16 20:43
41F:→ skizard: 我認識的業界真正有在研發的都還在看新的論文 03/16 20:43
42F:推 Arminius: 交大推。另外最好做研發的不用學別人已經研發好的輪子當 03/16 20:45
43F:推 polor: 有人很強 都不用看論文就可以做研究了 03/16 20:45
不可能不看 不然發表了時候有人做過了 你就白做了
44F:→ Arminius: 基礎繼續研發啦...文組的? 03/16 20:45
※ 編輯: honamida (140.113.167.42), 03/16/2016 21:12:59
45F:推 TTTTv: 有人真的都不用看別人論文就能做研究? XD 03/16 20:46
46F:噓 a125g: 噓某樓 03/16 20:47
47F:推 Virus5566: 當然可以 不過做出來的東西不是很弱 就是已經被做過的 03/16 20:48
48F:推 blbd: 雖被吳老打槍還是幫推 QQ 03/16 20:48
49F:推 realitysida: 推 03/16 20:53
50F:推 tiefblau: 辛苦了幫QQ 03/16 20:54
51F:推 tree1314: 推 03/16 20:57
52F:推 sioprr: 113推 03/16 20:57
53F:推 greatgatsby: 辛苦了!加油! 03/16 20:58
54F:推 sadmonkey: 很好奇你說的MCTS致命傷是否就是緊氣死活問題很難處理 03/16 20:59
應該說特定的死活問題
緊氣什麼的可以硬刻
55F:→ sadmonkey: 看起來google就是硬用財力掩蓋了死活問題,用一萬倍的 03/16 21:01
56F:推 feliz5566: XD 03/16 21:01
57F:→ sadmonkey: 效能來多算四五手,並用大量自我學習出來的策略函數在 03/16 21:03
58F:→ sadmonkey: 大局觀上贏過頂尖職業棋士 03/16 21:03
Google在做圍棋前 很多相關技術早就成熟了
跟李世石版本用什麼 實在難說
59F:推 bkj123: 有作事就是推 03/16 21:04
60F:推 JJ1622: 113.的小學弟推 03/16 21:06
61F:推 aa01081008tw: 八卦不是一堆(專家)說第四局阿法放水嗎.在原PO眼裡? 03/16 21:08
第四局稍微亂下 就是很正常的
我們只要算一算會輸半目
會亂下的更瘋狂
62F:→ kaiosTW: 最後一段反而看不懂... 03/16 21:09
63F:推 ny397789: 推 03/16 21:10
64F:推 Jiummay: 資源差距太大 本來就不能比 GOOGLE人才跟錢財 幾乎無限 03/16 21:14
65F:推 OstevenO: 113推 03/16 21:14
66F:推 iamhemry: 推! 03/16 21:18
67F:推 fallen01: 113推 03/16 21:19
68F:推 iceman198410: 知道一些內幕也蠻有趣的 03/16 21:25
69F:噓 pro33342: 噓一下 03/16 21:26
70F:推 cleorin: 推 03/16 21:36
71F:推 Marabuda: 推狗頭(害怕 03/16 21:38
72F:推 mocca000: 呃 拍拍 ? 03/16 21:46
73F:推 Edaw: 113推 03/16 21:51
74F:推 Gestapo1121: 當德國還在用馬車運物資的時候,美國已經用通用卡車 03/16 21:52
75F:推 xianyuyu: 03/16 21:52
76F:推 king22649: 推 03/16 21:54
77F:推 ann263028: 加油啊 03/16 21:56
※ 編輯: honamida (140.113.167.42), 03/16/2016 22:15:47
78F:推 milkdragon: 酷!!祝UEC奪冠 03/16 22:08
謝謝 雖然有難度
79F:推 Ladizman: 推 加油啊 03/16 22:12
80F:推 eddyty: 那你覺得表現在棋奕上,alphago的弱點是啥 03/16 22:32
我覺得 alphago 已經超過平常的AI太多了 很難說他們身為AI弱點是什麼
唯一明顯的是會把先手下掉 只要是不虧的就好
但他的棋很穩 所以不會有太多劫材給對面
不過跟人一樣 alphago 也會有盲點 好比第四盤 78手
好像CNN都很難看
81F:推 belleaya: 推! 03/16 22:34
82F:推 renny32: 推 03/16 22:39
※ 編輯: honamida (140.113.167.42), 03/16/2016 22:48:15
83F:推 nickss: wow 加油 03/16 22:41
84F:推 avans: 推! 長知識了! 03/16 22:42
※ 編輯: honamida (140.113.167.42), 03/16/2016 22:49:16
85F:推 mi324: 加油 03/16 22:53
86F:推 a1qazbgt5: 拍拍 加油! 03/16 22:57
87F:推 daniel50506: 夠.....夠宅我喜歡 03/16 23:00
88F:推 mystage: 交大的學弟加油 03/16 23:08
89F:推 chonger: 113學弟加油 03/16 23:09
90F:→ mystage: 不要在意Google在圍棋上走到哪裡,你們技術最終是要實用 03/16 23:09
91F:推 abc0922001: 好想看電腦對奕的畫面喔 03/16 23:21
92F:推 jkspike: 推 03/16 23:37
93F:推 nanlong: 如果想在半年內達到對台灣一般專業棋手勝率6成以上-預計 03/16 23:47
94F:→ nanlong: 研發經費要追加多少? 03/16 23:48
好問題 這是ZEN的計畫
http://japanese.engadget.com/2016/03/01/alphago-deepzengo/
100 台 每台四 TITAN X
95F:推 starahsu: 恐怕不是錢的問題 03/17 00:03
但沒錢一定有問題 QQ
96F:推 randy061: 推 厲害厲害 03/17 00:12
※ 編輯: honamida (140.113.167.42), 03/17/2016 00:25:19
※ sb710031:轉錄至看板 GO 03/17 00:29
97F:推 yesjimmy62: 推推好有趣! 03/17 00:32
98F:推 birdy590: Zen 這方向蠻有趣, 感覺好像想壓寶在 GPU, CPU 反而不多 03/17 00:40
應該說大家都缺 GPU 沒有 GPU 什麼東西都練不起來 (除了google)
99F:推 milkteafood: 遇見神手QQ 03/17 00:40
100F:推 HKuo: 推 不過我可以問一下 這跟助手(くりす)有什麼關係嗎? 03/17 00:47
哈哈 只是作者 個人喜好吧 XD
※ 編輯: honamida (140.113.167.42), 03/17/2016 01:03:44
101F:推 jinmin88: 推 辛苦了 就算用AWS開一堆暴力機器也要花超多錢... 03/17 01:05
102F:推 eldar: 加油! 03/17 01:14
103F:推 birdy590: Google主力是cpu啊 大概6:1弱 不是每台都配滿 03/17 01:17
gpu重要在於訓練 而且cpu其實相較之下好取得許多
104F:推 akay08: 推推 03/17 01:18
105F:推 a3294814: 能問一下為何使用cnn而不考慮其他neural network 方法呢 03/17 01:25
跑的快 收練也快 尤其Go是一個平面的東西 有很多 pattern 可以歸類並抽象化
( CNN最常用於2D 圖像辨視 )
106F:推 zeldeo: 推!!!譬喻得很好 03/17 01:29
※ 編輯: honamida (140.113.167.42), 03/17/2016 01:42:10
107F:推 ytlin5920: 強者我高中同學,曾經的最強狗頭,現今最強索娜 03/17 01:58
108F:推 lyu0001: 推 加油 03/17 07:24
109F:推 AbbeyJien: 推 03/17 07:45
110F:推 rumicco: 加油加油 03/17 07:47
111F:推 YCL13: 加油 03/17 09:16
112F:推 tngduh: 加油 03/17 09:48
113F:推 gtocool: 加油 03/17 09:50
114F:推 Kenqr: 加油! 03/17 09:50
115F:推 brad0315: 台灣LAB要跟GOOGLE拚,勇敢 03/17 12:27
116F:推 nikolas: 請問AlphaGo輸的那一盤 如果同樣步驟在重下一次 03/17 12:29
117F:→ nikolas: 他會重新修正78步棋嗎? 還是跟之前一樣? 03/17 12:30
除非他把棋譜拿去練
不然根據 paper 不會變 一樣看不到
118F:推 lina7inverse: 不只是個推!加油~~~一定可以的! 03/17 12:35
※ 編輯: honamida (140.113.167.42), 03/17/2016 13:05:24
119F:推 bob30727: 同業推一個 03/17 13:33
120F:推 snaketsai: 同校&&有認識你們lab推~ 03/17 14:22
121F:推 birdy590: 正解應該是之前盤面就會變了, 選擇多每次計算不會一樣 03/17 15:07
122F:推 sb710031: 他指的是 擺成76 給alpha 重想77 他不會發現對方可以下7 03/17 15:45
123F:→ sb710031: 8 03/17 15:45
124F:→ birdy590: 擺盤應該一樣算不到... 不過"同樣步驟在重下一次"不可能 03/17 15:54
125F:推 coronach: 上過吳老師阿狗給推XD 學弟加油 03/17 17:58
126F:推 future5566: 下次多插眼選會風箏的角色 狗頭就Q不到你們了 03/17 18:58
127F:推 hinajian: 辛苦了加油! 03/17 21:19
128F:推 shou50: 內行人耶 03/17 23:36
129F:推 wukevinboy: 推 03/18 00:45
130F:推 DemonElf: 推一個 03/18 01:29
131F:推 kscan: 113推,加油 03/19 16:28
132F:推 MiYoung: 加油喔 03/20 02:56
※ 發信站: 批踢踢實業坊(ptt.cc)
※ 轉錄者: NoPTT (202.111.43.247), 03/22/2016 20:58:41