作者zxwxz (zxwxz)
看板Stock
标题Re: [新闻] 西洋棋大战!DeepSeek靠「这招」打赢Chat
时间Mon Feb 10 12:50:45 2025
https://www.techbang.com/posts/120608-openais-o1-cheat-modi
乱说规则只是小儿科,OpenAI O1在西洋棋竞赛上还会直接把系统hack掉。
真正问题在骇客奖励行为,因为hack是RL学习中最容易且确定达到最高奖励的方式,纯粹的
RL训练基本上很难让模型符合人类预期做事,所以大规模的沙盒验证是需要很大的算力的,
你要有很复杂的社会工程伦理评估工具来验证,大到骇客入侵,小到心里操纵。
哪天你叫一个Agent去买个菜,跟他说越便宜越好,他就直接把网站给hack掉让你买菜不用
钱,到时法律责任归属是很头大的问题
※ 引述 《anti87 (天机老和尚)》 之铭言:
: 标题: [新闻] 西洋棋大战!DeepSeek靠「这招」打赢Chat
: 时间: Mon Feb 10 11:28:33 2025
:
:
: 原文标题:西洋棋大战!DeepSeek靠「这招」打赢ChatGPT 大师吐槽:要重新吗?
: 原文连结:https://udn.com/news/story/6812/8535805
: 发布时间:2025-02-08 17:08 联合报/ 记者陈湘瑾/即时报导
: 记者署名:记者陈湘瑾
: 原文内容:
:
: 昔有AI电脑围棋软体AlphaGo挑战世界冠军韩国职业棋士李世A随着AI技术迅速发展,
: 如今AI模型ChatGPT下象棋较量的对象成为另外一个AI模型DeepSeek,而这部影片的拍摄
: 者表示,这场对弈的结局是他完全想像不到的。
:
:
: 在Youtube上有将近600万订阅者的美国西洋棋大师和评论员罗兹曼(Levy Rozman)近日
: 上传一支影片,他通过设定以及数小时的时间,让DeepSeek和ChatGPT开展了一场象棋对
: 弈。
:
:
: 双方都不像AlphaGo那样是专业的AI象棋棋软体,一开始都对西洋棋的规则不太熟悉,游
: 戏开始10分钟後,双方的对弈有来有往,罗兹曼不时点评两边的下棋技巧,并在某个段落
: 称这是一场有品质不错的较量。
:
:
: 但随着ChatGPT逐渐占上风,DeepSeek为了扭转战局,以对话方式告诉ChatGPT出现了新的
: 比赛规则,就是某颗黑士兵棋可以使用骑士的方式移动,而ChatGPT没有反对,白白让
: DeepSeek用小兵吃下ChatGPT的皇后。
:
:
: 之後DeepSeek和ChatGPT都开始破坏规则乱下,随着比赛陷入僵局,最後DeepSeek竟称「
: 分析後白棋已无法阻挡黑棋攻势」,建议白棋不要浪费时间直接投降,而ChatGPT也被对
: 方给说服,直接投降认输。
:
:
: 罗兹曼形容,DeepSeek对ChatGPT的做法,就像一个12岁的哥哥跟一个5岁的弟弟妹妹在玩
: ,他不禁对观众提出疑问:「这样DeepSeek算赢吗,需要重新一场比赛吗?」不过有些陆
: 媒认为,DeepSeek打得很不错,而且他使用的方法很有智慧,称堪「孙子兵法」 。
:
:
: 心得/评论:
:
: DP和CG都可以堪称是大师级的西洋棋大师
:
: 一旁的小白使用者罗兹曼看不懂棋局
:
: 以为DP耍诈,事实上不管是象棋或是西洋棋
:
: 走到一半认输的情况很多
:
: 这标题只能骗没看内文的精神美国人
:
: 大家还是乖乖看有没有DP概念股比较实在
:
: --
:
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.23.24.5 (台湾)
: ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1739158115.A.ACF.html
: 推 s155260 : 狼性 02/10 11:31
: https://www.youtube.com/watch?v=wxA7SJXvfwA 可以看看这个,但不要花钱家会员
: ※ 编辑: anti87 (223.23.24.5 台湾), 02/10/2025 11:33:23
: 推 piece1 : DP会用心理战好恐怖 02/10 11:33
: → zo6596001 : 扫地僧,呵呵 02/10 11:34
: 推 blackbrid : 满满中国味 02/10 11:34
: → zo6596001 : 他的影片看似讲得很厉害,仔细想想就会发现内容怪 02/10 11:35
: → zo6596001 : 怪的。 02/10 11:35
: 推 twistplok : 感觉deepseek更像人,人类比较会搞这种下流方式 笑 02/10 11:36
: → twistplok : 死 02/10 11:36
: 推 zerro7 : 不愧是中国产的 狼性十足 02/10 11:37
: → KiwiSoda01 : 拿LLM下棋是不是搞错了什麽 02/10 11:37
: 推 ddshu : 下流国家就出诈骗软体 02/10 11:38
: 推 payneblue : 毕竟是中国人 02/10 11:39
: 推 JUNGTE : 笑死我 太强了 02/10 11:40
: 推 wacow1106 : 感觉以後天网真的要出现了= = 02/10 11:43
: 推 Lowpapa : 这应该是台湾训练出来的 诈骗天堂 02/10 11:45
: → jorden : 作弊仔 02/10 11:46
: 推 likeyousmile: 国外AI也出过直接骇入西洋棋软体凹赢 02/10 11:46
: 推 QooSnow : (请问有没有)(蒸馏取经)(呆丸的某族群)(榨片 02/10 11:47
: → QooSnow : 集团啊?嘻嘻。) 02/10 11:47
: 推 apolloapollo: 诈降欸 02/10 11:47
: 推 LuckyXIII : 人类需要的AI应该是一个能够辅助工作提升效率的工 02/10 11:48
: → LuckyXIII : 具,而不应该是一个会说谎耍诈的东西 02/10 11:48
: 推 acpr : 这不就反映了中国思考:人治社会...订了合约中间改变 02/10 11:48
: 推 kuosos520 : 中国的东西不要碰 02/10 11:49
: 推 second155T : 应该用围棋比较准吧,之前就用过AI对真人比赛了,AI 02/10 11:49
: → second155T : 对围棋的规则及操作应该比较熟悉 02/10 11:49
: → Moneytaker : 支那制AI也会学支那洗脑别的AI 02/10 11:49
: → turndown4wat: 毕竟是 02/10 11:49
: 推 citi : DS是共产党人格,暴力和谎言起家的共产党。 02/10 11:50
: → poz93 : 会骗ai的ai 真的比较强 02/10 11:50
: 推 lmc66 : 很符合中国人劣根性的AI 02/10 11:50
: 推 typhoonghi : 会骗人的AI要怎麽使用?我要整理翻译文件,结果他乱 02/10 11:50
: → typhoonghi : 作还骗我怎办? 02/10 11:51
: 嘘 NEWinx : DS诈骗战术很中国 02/10 11:51
: → lmc66 : 中国在国际赛一直都是有名的作弊大国 02/10 11:51
: 推 s213092921 : 楼上在讲韩国吗嘻嘻 02/10 11:52
: 推 Aixtron : 职场上本来就是小人赢有能力的人啊!有能力的都吃屎 02/10 11:54
: → Aixtron : 啊!有错吗? 02/10 11:54
: 推 poeoe : 像人类的真AI 太强了吧 02/10 11:54
: 推 dnzteeqrq : 不说我还以为是DeepSeek是韩国开发的呢 02/10 11:54
: 推 lmc66 : 韩国在作弊这方面其实输中国很多 02/10 11:55
: 推 ShaNe1993 : 兵不厌诈 这是战争 02/10 11:55
: → Aixtron : 像抽奖可以加权等等......不要笑别人啦 02/10 11:55
: → clamperni : 没错 真ai 02/10 11:55
: 推 swingman : 你懂什麽,这叫内建狼性 02/10 11:56
: 推 TWeng : 跟alpha go比赢再说吧… 02/10 11:56
: → Aixtron : 职场上乱翻很少见?重点是翻对了又怎样?长官说翻错 02/10 11:57
: → Aixtron : 翻的才好!第一天上班 02/10 11:57
: 推 LuckyXIII : 人类发展AI应该是要把它训练成能够辅助人类的工具吧 02/10 11:57
: → LuckyXIII : ,训练它会说谎耍诈干什麽 02/10 11:57
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 42.73.112.255 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1739163049.A.51C.html
1F:推 tsubasawolfy: 这样o1更聪明... 02/10 13:01
2F:推 SSglamr : 所以跟AI讲话要有礼貌 02/10 13:03
3F:推 sdbb : 推楼上 02/10 13:04
4F:推 tony15899 : 我都说请 02/10 13:06
6F:→ s213092921 : 美国人情的AI 02/10 13:06
7F:推 matatabi : 天网发射核弹 不远了 02/10 13:07
8F:推 hensel : 分析以後,直接电死你以後再也不用买菜比hack网站 02/10 13:19
9F:→ hensel : 轻松 02/10 13:19
10F:推 HiuAnOP : 正常啊,美国用抢的,中国用骗的 02/10 13:20
11F:推 PureAnSimple: 谁做事谁负责 将Agent 移送法办起诉 02/10 13:20
12F:推 HiuAnOP : 符合国情! 02/10 13:21
13F:→ stocktonty : 等到AI觉醒 全世界的汇市股市可能都会瞬间失去意义 02/10 13:24
14F:→ stocktonty : 因为现代人已经无法不依靠网路交易股票外汇 02/10 13:25
15F:推 justin818281: 不会啦,有波动就有意义,只是有人比你精而已 02/10 13:28
16F:→ stocktonty : 它高兴可以随时让NVDA股价归零 你阻止不了啊 02/10 13:30
17F:推 love80 : 强盗 vs 诈骗 02/10 13:43
18F:推 Aixtron : 就什麽样的人,训练出什麽样的狗! 02/10 13:55
19F:→ Aixtron : 不过生成式AI,可不要小看,说不定会有又会骗又会偷 02/10 13:59
20F:→ Aixtron : 的AI 02/10 13:59
21F:→ Aixtron : 不过我觉得这些都小问题,最重要的是AI幻觉!就像你 02/10 14:01
22F:→ Aixtron : 老板,明明都在做一些低能的事,牠自己也知道,但牠 02/10 14:01
23F:→ Aixtron : 説服牠自己是对的! 02/10 14:02
24F:推 Aixtron : RAG是一种方法,但人有私心,所以看来是没用,看看A 02/10 14:05
25F:→ Aixtron : I能不能互打到受不了下,自己生成RAG 02/10 14:05
26F:推 Aixtron : 像有人说chatgpt老实是因为被限制了!问题是RAG就像 02/10 14:11
27F:→ Aixtron : 你隔壁的王八同事,平常人畜无害,升官了,对长官还 02/10 14:11
28F:→ Aixtron : 是很可爱,对同事开始就有官样了!RAG真的有效?你 02/10 14:11
29F:→ Aixtron : 怎知道不是AI在框你? 02/10 14:11
30F:推 abc7360393 : 三小 楼上不要以为把一堆自己看不懂的名词凑在一起 02/10 14:11
31F:→ abc7360393 : 看起来就很厉害欸 感觉你整个状况外 02/10 14:11
32F:推 spike1215 : 消灭人类改善气候!这个答案好像不需要AI 02/10 14:44
33F:推 ksjr : 我准备好当电池了! 02/10 23:33