作者x94fujo6 ()
看板StarCraft
标题Re: [心得] AI对战人类心得(已补影片)
时间Sat Nov 4 08:02:45 2017
想说的有点多
如果版主觉得不适合发在本版可以删除 没意见
每次有AI相关的东西
就会发现很多人的观念还停留在上个世纪
以为AI就是写好写死的固定程式
这次比赛的AI
前两个应该是属於上面这种
第三个AI很明显有点类似AlphaGo
有一些比较"非人类"的动作
10年前跟你说AI可以打赢围棋世界冠军
99%的人都会笑着说怎麽可能
现在?
目前最好的AI
所做的各种判断/应对
都不是由人类设计/输入/写好的
而是由AI自己不断"演化"的结果
所以会有一些"非人类"操作是非常正常的事情
不懂的可以看看这影片
我下面会说明
只要几分钟你就能大概理解这种AI
https://www.youtube.com/watch?v=NHtsUls3AnY
这是一个超级简单到不行的AI模拟
首先
所有AI都拥有一样的 "身体"
但每个AI都有自己的移动方式
这个方法最一开始是随机设定的
所以会有很多根本不知道在干三小的AI 很正常
再来是这种AI的关键
演化的条件
要设定甚麽条件才能演化出更"好"的AI
在这个模拟中
要的是能够尽可能的快速吃到 "食物"(红点) 的AI
当一个AI能够吃到食物就能产生基於自己的 "後代"
一直吃不到/抢不赢的...就是死亡/淘汰
"後代" 虽然大部分的移动方式和 "前代" 一样
但会有一些小部分可以产生随机的变化
(想成DNA复制错误产生的突变就懂了)
这个变化可能有好有坏
能更快的吃到食物→ 这个AI就能产生更多的"後代"
反而动作变慢→ 这不好的演化结果会慢慢被前者淘汰
最後
你会得到一群抢食物快得吓人的AI
这跟大自然的物竞天择有87%像
"自然演化" 就是一个非常强大的演算法
可以想成类似暴力破解
尝试近乎无数的可能性後找出好的解法
但
"演化" 和 "暴力破解" 最大的不同在於
演化并不需要每一次尝试都 "从0开始"
而是建立在"前代"的成功之上逐渐改进
最後的结果可能不是真正最好的解决方法
但至少非常非常非常接近
这种AI的特性是
里面到底发生了啥
就算是设计的人都得研究一下才能知道
而且也只是"当下"的情况
多跑几次模拟後可能又不一样了
对外界来说就是个 "黑箱"
就像电脑自己教会自己一样 (基本上 真的是)
https://www.youtube.com/watch?v=op0bhZNUJFE
这个内部运作的程式
应该也是模拟出来的AI
四只脚=同时协调大量元件运作
受到外力能自行恢复平衡
加上负载後重心变化後要怎麽应对
人写的出来你敢信?
随便一个动作就要花很多时间
而且87%无法动的和AI一样完美
AI模拟连实机都不需要
直接在电脑上一次模拟数十数百个
不需要人介入(其实还是要 调整各种条件等等)
就能自己演化出来
参数设的好 → AlphaGo
参数设的不好 → 垃圾/改参数重来
只会4D的AI
很可能是因为天梯环境
天梯在干嘛?
不就是以最高胜率的战术获得最多胜场?
当AI发现4D胜率很高然後只以这个战术为基准的时候
整个训练方向就错了
如果训练AI时用的是职业选手
那结果应该会很不一样
https://www.youtube.com/watch?v=hx_bgoTF7bs
这个也是
初期看起来真的很好笑 (有如这次表演的AI)
但理论上演化够多次後
AI会比 "你" 还懂得如何 "正确的" 走路...
纯粹分享一些业余的知识
如有错误欢迎讨论
--
We live in a society exquisitely dependent on science and technology,
in which hardly anyone knows anything about science and technology.
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.35.143.39
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/StarCraft/M.1509753780.A.2A5.html
1F:推 capssan: 这算是类神经的概念吗 好奇问一下而已 11/04 08:24
2F:→ jayfrog: 演化计算是ai的一种没错,但是不是每种ai都是演化计算吧 11/04 08:26
3F:推 jackfantasy: 1楼是的 现在大部分AI都有类神经网路在里面 也就是常 11/04 08:29
4F:→ jackfantasy: 听到的neural network 11/04 08:29
5F:→ jackfantasy: 其实对AI来说 所谓的学习 是去逼近 11/04 08:30
6F:→ jackfantasy: 如果你愿意相信 则其实世界上所有的事物都可以转化对 11/04 08:31
7F:→ jackfantasy: 应成一个数学函数 可能很复杂 可能很简单y=ax+b 11/04 08:31
8F:→ jackfantasy: AI的概念就是我不知道a,b但是我从一堆资料里面去逼近 11/04 08:33
9F:→ jackfantasy: 出a,b是什麽 学到这个f(x) 11/04 08:33
10F:→ jackfantasy: 然後接下来你给我x我一定可以预测出y 11/04 08:33
11F:→ jackfantasy: 所以才说训练资料很重要 如果你的训练资料有偏颇 或 11/04 08:35
12F:→ jackfantasy: 是太少 他根本无法逼近出真正的那个f(x) 就会变成预 11/04 08:35
13F:→ jackfantasy: 测很烂 很不准 或是打很烂 但这就是他从资料中学到的 11/04 08:35
14F:→ jackfantasy: 类神经也就是neural network 做的就是我用一堆神经元 11/04 08:37
15F:→ jackfantasy: 来让AI可以逼近超复杂 不只是a b两个参数 而是上万 11/04 08:37
16F:→ jackfantasy: 个参数的函数 11/04 08:37
17F:推 sartan: Festo这是什麽公司阿?也太可怕,默默开放出这些可怕玩意 11/04 08:40
18F:推 capssan: 如果是这样 围棋跟星海对他们来说资料量差太大了吧 11/04 09:02
19F:→ capssan: 几乎多个参数就多好几倍的变化 11/04 09:03
20F:推 jackfantasy: 星海跟AlphaGo用的呢是neural mdtwork的一个分支 叫 11/04 09:10
21F:→ jackfantasy: 做reinforcement learning 强化学习 11/04 09:10
22F:推 jackfantasy: 一样是逼近找出数学函数 但是这个数学函数表示的是一 11/04 09:16
23F:→ jackfantasy: 个叫做「决策」的条件机率 也就是AI「观察」到现在这 11/04 09:16
24F:→ jackfantasy: 个「状态」 然後决定要做什麽「动作」 11/04 09:16
25F:→ jackfantasy: 每一个「动作」会得到「奖励」 目标是使得整局比赛奖 11/04 09:17
26F:→ jackfantasy: 励最大 11/04 09:17
27F:→ jackfantasy: 对啊 这参数量真的很大 因此要在学习过程懂得删减掉 11/04 09:19
28F:→ jackfantasy: 机率太小的决策以减少计算 而且训练过程需要的电脑数 11/04 09:19
29F:→ jackfantasy: 量至少几千几万台 时间也要四、五个月 11/04 09:19
30F:推 Timba: 学习能力啦~ 还有逻辑判断 能不能用现有的资讯预测其他状况 11/04 10:17
31F:推 kirimaru73: 参数量超超超超大 所以之前的年代这不是主流作法 11/04 10:33
32F:→ kirimaru73: 现在因为GPU强到翻 大家发现它足以撑起这麽夸张的计算 11/04 10:34
33F:→ kirimaru73: 量所以才一窝蜂开始发展 11/04 10:34
34F:推 kirimaru73: 现在的这种作法 是真的相当於在开发一颗大脑出来 11/04 10:38
35F:→ kirimaru73: 但这颗大脑确实只会做一种事情(然而也可以干爆人类) 11/04 10:38
36F:→ kirimaru73: 所以要说这是弱人工智慧并非真的智慧 也是有其道理 11/04 10:39
37F:推 kirimaru73: 推文提到的ax+b就是类神经网路的 但十几年前的技术 11/04 10:41
38F:→ kirimaru73: 大概只会使用1024/2048这种量级的ax+b所以被当成玩具 11/04 10:42
39F:→ kirimaru73: 现在则是约100x100x1000+4096+4096这种程度的数量 11/04 10:43
40F:推 kirimaru73: 另外如果考虑AI竞赛或人机大战 没人规定你不能用脚本 11/04 10:47
41F:→ kirimaru73: 你有本事就用 只是现在用了会被业余玩家干爆而已 11/04 10:47
42F:→ kirimaru73: (游戏内脚本强是因为他作弊) 11/04 10:48
43F:推 sampp1213205: 然而 依然一堆原始人在小看Ai 11/04 18:55
44F:→ x61s: 楼上最好说清楚点,Sen应该不算原始人,AI行为搞笑自然会被 11/04 19:54
45F:→ x61s: 放大检视甚至轻视,现在轻视也不代表会一直轻视 11/04 19:55
46F:推 win4104: 现在明明就还有很多问题待克服 11/04 20:33
47F:→ win4104: 我不觉得把将来的可能性拿到现在来反对其他人对当前成果 11/04 20:34
48F:→ win4104: 的批判 是什麽有意义的事 11/04 20:34
49F:推 kirimaru73: 这一版AI被笑是完全合情合理的 4D+2这种战术以玩家的 11/04 20:44
50F:→ kirimaru73: 角度来看本来就该笑 当然会长成这种战术确实有研究上 11/04 20:45
51F:→ kirimaru73: 的原因和讨论价值 不过SEN他播报是播给游戏玩家看的 11/04 20:45
52F:→ kirimaru73: 那当然要站在玩家的立场来解说 没什麽好批评的 11/04 20:46
53F:→ sampp1213205: 白痴 在讲的是小看ai的可能性跟强大好爆zzz 11/04 20:48
54F:推 kirimaru73: 哗 不服气就炮白痴 这点真的比AI强太多了 11/04 20:49
55F:推 x61s: 我们已经进入网路时代,资讯交流是以秒为单位传递 11/04 20:54
56F:→ x61s: 今天嘲笑AI的人 在AI蜕变後 往往也是最早赞扬AI的人 11/04 20:55
57F:推 win4104: 再说 虽然在很多篇已经说过了 11/04 20:57
58F:→ win4104: DeepMind最近发表的研究状况是他们卡关了 11/04 20:57
59F:→ win4104: 为什麽还是看到很多人讲的好像 演算法问题都已经解决 11/04 20:57
60F:→ win4104: 只需要给AI时间学习一样 11/04 20:58
61F:推 x61s: 无需以先知者的态度来讽刺,这个时代没有先知,人人都是先知 11/04 20:58
62F:推 Butcherdon: 好像以前摸过的基因演算法 11/04 21:01
63F:→ Butcherdon: 不过那时候休课只是入门 没接触复杂度 设定好进化条件 11/04 21:03
64F:→ Butcherdon: 和突变种类之类的东西 让程式演化n代自动找出某种棋盘 11/04 21:04
65F:→ Butcherdon: 排列 人很难排出的东西 电脑只要两三秒 11/04 21:05
66F:推 jackfantasy: 其实笑是正常的 如果身为懂AI的人更该高兴 因为你正 11/04 23:13
67F:→ jackfantasy: 在目睹市场被教育 11/04 23:13
68F:→ jackfantasy: Google DeepMind比起征服围棋有另一个更大的重点跟使 11/04 23:15
69F:→ jackfantasy: 命-教育市场 为未来的AI产业开拓市场 越多人了解AI本 11/04 23:15
70F:→ jackfantasy: 质 就越能接受他 使用他 为他付费 11/04 23:15
71F:→ jackfantasy: Google更是在大家都不懂AI是什麽时 透过征服围棋 让 11/04 23:16
72F:→ jackfantasy: 大家有了Google是AI产业领导品牌的形象 11/04 23:16
73F:→ jackfantasy: 比起下围棋 这是更大的一步棋 11/04 23:16
74F:→ jackfantasy: 所以何必笑或是生气外人看不懂AI 当你是第一个教育市 11/04 23:17
75F:→ jackfantasy: 场的人 你就赚钱了 这也许是台湾产业和专家、工程师 11/04 23:17
76F:→ jackfantasy: 该学的 11/04 23:17
77F:→ x61s: 很简单 因为说的人往往非产业中人 酸民很少是深度涉入者 11/05 00:13
78F:→ x61s: ai是否被接受 这些酸民都只能旁观 选择当先知酸人相对实际 11/05 00:15
79F:推 APM99: 不小看这次AI的 叫做对AI有太多幻想 11/05 06:12
80F:→ APM99: 好久没看到白痴这两个字了 好猛 11/05 06:12
81F:推 APM99: 3b1b 这几天把AI的视频也都给丢上youtube了 有兴趣了解的 11/05 06:15
82F:→ APM99: 这些AI天梯胜率有达到70%吗 天梯有前十吗 没有嘛 11/05 06:25
83F:→ APM99: 还有连单位都不用圈选的 根本作弊 就搞笑来的 11/05 06:26
84F:→ APM99: 还请到司令出征wwwww 11/05 06:26
85F:推 ernova831: 连新手都打不赢的采矿AI到底能干嘛zzz 11/05 11:29
86F:嘘 jackace: 我觉得先弄懂MDP和POMDP的limit在哪里再说吧 11/05 12:32
87F:嘘 iamten: 这ai打一人般胜率很高 4d战术很强 一般人不会对应 11/05 15:59
88F:→ iamten: 打职业就吃屎吧 11/05 15:59
89F:→ iamten: 靠硬操作赢的那种也不叫AI 11/05 16:00
90F:→ iamten: 还有AI演算法很早就有了 这几年强是硬体进步了 11/05 16:01
91F:→ iamten: 但是星海是动态 跟围旗是静态完全不一样 11/05 16:02