作者dharma (達)
看板Soft_Job
標題[請益] AlphaGo Zero方法的運用場景?
時間Sun Nov 5 23:40:55 2017
圍棋給初始規則後,AI不再需要人類插手(人類棋譜)
因為規則和勝負條件明確
AI可自己產生天文數字的對局來訓練
自行學習進化打敗人類
但如果是語音/影像辨識
好像還是必須靠人類不斷餵題目和正確答案
AI才能由給定的題目和答案,找出其中的關係
語音影像辨識這種AI無法自己製造樣本
AlphaGo Zero方法是不是就不適用
這樣AlphaGo Zero這種模式(不用人類給樣本)
除了益智遊戲
還有哪些可應用啊?
thanks
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.65.89.53
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1509896457.A.495.html
1F:推 sunsamy: 金融交易 11/05 23:57
可行,不用人工一直給確認樣本
2F:推 leoloveivy: 影像聲音才是生成樣本最多的==最近gan那麼紅 11/06 00:42
3F:推 leoloveivy: 現在生成樣本解析度很高了 11/06 00:44
影像聲音還是需要人類給答案啊
4F:推 babogoos: 醫療的應用,像是病理分析、基因定序、遺傳解析、物理 11/06 01:08
5F:→ babogoos: 方面的應用也可以,公式推導、模式預測等等,其實人類 11/06 01:08
6F:→ babogoos: 目前還有很多事物是知道結果並不清楚原因,人工智慧可以 11/06 01:08
7F:→ babogoos: 幫助我們用新的角度檢視既定事實並且釐清過程 11/06 01:08
8F:→ alog: 是說學語音辨識,可以先想想一般人學一門語言也是前人、父 11/06 01:28
9F:→ alog: 母仰賴經驗傳承、大量收集跟閱聽影音訓練出來的嗎 11/06 01:28
10F:→ alog: 所以說,我不認為做語音或影像辨識資料依賴樣本,是有哪裡 11/06 01:29
11F:→ alog: 不正確 11/06 01:29
12F:→ alog: 阿發狗 0 他厲害的地方在於不用仰賴別人的套路,自己找出一 11/06 01:31
13F:→ alog: 些作法來解決該棋局怎麼下到贏,他可能在解決一些人類無法 11/06 01:31
14F:→ alog: 探究或是在有限的時間都無法解決的事情上可能會帶來其他的新 11/06 01:31
15F:→ alog: 觀點 11/06 01:31
16F:→ alog: 但語言辨識用不用著alpha go zero這種 11/06 01:33
17F:→ alog: 我的看法是,你既然要辨識(學習)某些語言 11/06 01:33
18F:推 alog: 你自己想出一個套語言意義何在,那到底是外星語 還是你要學 11/06 01:35
19F:→ alog: 習的那個目標語言?當然要跟別人從溝通、書籍來學習啊.. 11/06 01:35
20F:→ alog: 協助人類做辨識還是得用人類的方法來學習,不然出來的結果 11/06 01:56
21F:→ alog: 未必不好,但看的人未必能同意你辨識的正確。 11/06 01:56
同意
Zero不太適合語音影像辨識
22F:→ charlie60507: 我的理解是Alphago也是從人類棋譜做supervised lear 11/06 04:42
23F:→ charlie60507: ning,再以reinforcement learning不斷強化。若定好 11/06 04:42
24F:→ charlie60507: 規則後就單靠RL一直學,感覺很容易落入local optimu 11/06 04:42
25F:→ charlie60507: m。聽過的類似場景有決策類遊戲,deep mind好像打 11/06 04:42
26F:→ charlie60507: 算征服星海爭霸 11/06 04:42
27F:推 charlie60507: 啊...抱歉 剛看了下alphago zero的相關文章,發現是 11/06 04:58
28F:→ charlie60507: 自己的資訊太落後了,請無視QQ 11/06 04:58
29F:推 Kazimir: 方法是要想的囉 如果你的意思是拿az的RL方法直接套 11/06 05:44
30F:→ Kazimir: 那應用範圍的確不怎麼廣 不過我覺得主要是吸收那個精神 11/06 05:45
31F:→ Kazimir: 怎麼利用RL或者其他方法來減少對labeled資料的需求 11/06 05:46
32F:→ y3k: 初音才不是軟體呢 11/06 08:33
33F:推 maxqq: 自己想像成自己是一個陌生人,到別的環境生存,你會給自己 11/06 10:16
34F:→ maxqq: 怎樣的指令,這就是 AI 11/06 10:16
35F:→ maxqq: 在以前光是分裝貨物與貨物,或許都要寫很多判斷程式 11/06 10:17
36F:→ maxqq: 但交給 AI 負責這塊工作類別,你只需要跟他溝通負責教會他 11/06 10:17
37F:→ maxqq: 而不是重構他的系統程式 11/06 10:18
38F:推 vi000246: 星海爭霸未來可能就會出現能互打的AI了 11/06 14:37
39F:推 nendi: 如果星海的自我學習AI被做出來了,大概實際軍事AI也不遠了. 11/06 17:40
40F:→ pttworld: 星海人機大戰早比完了,人全勝。 11/06 19:11
41F:→ charlie60507: 樓上說的是這個嗎? 11/06 19:58
42F:→ Sieg2010: AlphaGo的星海還沒比吧 11/06 21:31
43F:→ oversky0: 用在氣象預測上會有用嗎? 11/06 21:56
44F:→ followwar: 你知道GAN是什麼嗎? 11/07 02:50
45F:推 senjor: 星海的問題在於沒有可以直接給電腦使用的訓練環境 (? 11/07 10:28
46F:推 Kazimir: 有吧 我印象中deep mind有和bz合作 連環境都開放給大家 11/07 14:04
47F:→ Kazimir: 玩了 這幾個月的事情 11/07 14:04
48F:推 APM99: GAN不就罵人的髒字 以前打遊戲常用 11/08 10:24
49F:推 jbwwwopa: 樓樓上 pysc2 11/11 09:19
※ 編輯: dharma (210.65.89.53), 11/11/2017 16:43:16