作者saltlake (SaltLake)
看板Statistics
標題[問題] 電腦決策(下棋 打怪等)
時間Fri Nov 24 16:01:59 2017
電腦下棋的決策所涉及的數學模式是什麼?
或者說聯繫每一步棋落子的位置之決定和棋盤現有的
敵我棋子分布的數學模型是什麼?
最直觀的是窮舉法 把蒐集得到的各個棋譜的每一步
變化都存到資料庫 下棋的時候在一一比對
但是這樣很花時間不說 萬一出現資料庫存以外的
棋局狀態怎麼辦?
有甚麼書在介紹這方面的嗎?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.136.208.34
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Statistics/M.1511510521.A.6CE.html
1F:→ LiamIssac: markov decicion process可能會是一種 11/24 17:46
2F:推 haolihy: 很多論文 電機系的朋友有做過類似的 11/24 22:11
論文名稱或關鍵字能提供嗎?
※ 編輯: saltlake (220.136.208.34), 11/24/2017 23:09:22
3F:推 expiate: 蒙地卡羅還有reinforcement learning 11/26 06:03
4F:推 expiate: 當然還有最火熱的deep learning 11/26 06:08
5F:推 expiate: 基本上是不會用窮舉法的,而是用大量的棋譜訓練來獲得模 11/26 06:10
6F:→ expiate: 型 11/26 06:10
7F:推 NCTUFatGuy: RL + MCTS 01/08 10:25