作者saltlake (SaltLake)
看板Statistics
标题[问题] 电脑决策(下棋 打怪等)
时间Fri Nov 24 16:01:59 2017
电脑下棋的决策所涉及的数学模式是什麽?
或者说联系每一步棋落子的位置之决定和棋盘现有的
敌我棋子分布的数学模型是什麽?
最直观的是穷举法 把蒐集得到的各个棋谱的每一步
变化都存到资料库 下棋的时候在一一比对
但是这样很花时间不说 万一出现资料库存以外的
棋局状态怎麽办?
有甚麽书在介绍这方面的吗?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 220.136.208.34
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Statistics/M.1511510521.A.6CE.html
1F:→ LiamIssac: markov decicion process可能会是一种 11/24 17:46
2F:推 haolihy: 很多论文 电机系的朋友有做过类似的 11/24 22:11
论文名称或关键字能提供吗?
※ 编辑: saltlake (220.136.208.34), 11/24/2017 23:09:22
3F:推 expiate: 蒙地卡罗还有reinforcement learning 11/26 06:03
4F:推 expiate: 当然还有最火热的deep learning 11/26 06:08
5F:推 expiate: 基本上是不会用穷举法的,而是用大量的棋谱训练来获得模 11/26 06:10
6F:→ expiate: 型 11/26 06:10
7F:推 NCTUFatGuy: RL + MCTS 01/08 10:25