Re: [新闻] OpenAI：已掌握DeepSeek盗用模型证据

时间Wed Jan 29 23:20:33 2025

争，将违反OpenAI服务条款，因此产生疑虑。习，他也承认他不只从chatgpt训练也参照不少，deep seek 也认为自己是chatgpt /a> 2FM.1738164035.A.04B.html' data-width='280' data-layout='standard' data-action='like' data-size='small' data-show-faces='true' data-share='true'>

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.169.68.61 (台湾) rel="noreferrer noopener nofollow">https://webptt.com/cn.aspx?n=bbs/Stock/M.1738164035.A.04B.html : 你先让美吹上车完再焊死车门好吗 01/29 23:23 : 支那粉蛆说好的重击美股呢?? 怎又开始自卑了??????? 01/29 23:25 : deepseek已经不重要 openai原本商法已经没用市场 01/29 23:25 : 投资都要重新估值 01/29 23:25 : 接下来怎麽圈钱才是问题 01/29 23:26 : 学生只要念会考试的范围就好了 01/29 23:27 : 题库就在那里了 01/29 23:27 : openAI不是说有两个可疑帐号大量使用API 01/29 23:31 : 你ban我算力我直接偷抄答案很符合对岸的逻辑 01/29 23:31 : LLM没办法只抄答案 LLM必须具备推理能力才能应付 01/29 23:32 : https://substack.com/@cloudedjudgement/p-1557935 01/29 23:32 : 18 01/29 23:32 : 所有问题只能说有头有尾要生出推理比较容易 01/29 23:33 : 所以蒸馏可以让学生得到比老师还口语化的结果? 01/29 23:33 : 就像计算题已经知道答案要写算式总是比较容易 01/29 23:33 : 学生比老师厉害不是很正常吗人类社会不就这样@@a 01/29 23:34 : 蒸馏通常没办法比老师厉害 01/29 23:34 : 蒸馏就是让学生模仿老师逼近老师 01/29 23:35 : 如果ai模型没办法做到学生比老师强那不就废了@@? 01/29 23:35 : 目前用的蒸馏法没办法 01/29 23:35 : 目前的蒸馏法会劣化 01/29 23:35 : chatgpt 全名generative pre-trained transformer 01/29 23:35 : 等等…….股点勒现在也要把股版蒸馏成栅栏版喔？ 01/29 23:35 : 一直蒸下去会越来越笨 01/29 23:35 : 越练越笨那就不叫ai好吗 =.=a 01/29 23:36 : 我好奇 deepseek也是transformer architecture吗? 01/29 23:36 : deekseek的呈现方式没理由不是transformer 01/29 23:38 : transformer指的是理解输入资讯->推理->转成输出 01/29 23:39 : 蒸的丸子 01/29 23:40 : 应该这样输入资讯->理解+推理->转成输出 01/29 23:40 : openai里面有中国的内鬼外泄机密给中国公司 01/29 23:41 : 中间的理解跟推理是用数学模型利用大量文本训练 01/29 23:41 : deepseek 的 weights 也是公开的阿 01/29 23:41 : 找出自然语言每个片段意义之间的关联性 01/29 23:42 : 估狗到有针对一般蒸馏法做改良的，可以用更少的资料 01/29 23:42 : 达到旧有的蒸馏效果，像google有开发个Distilling 01/29 23:43 : Step-by-Step技术 01/29 23:43 : https://imgur.com/YXsUSJL 01/29 23:43 : google上面那个"较少资料"是80%耶 01/29 23:44 : transformer 其实就是复杂一点的attention model 01/29 23:45 : 你用的是基於事实的分析来进行推理，这边的人是用主 01/29 23:46 : 观意识形态扣帽子来反驳双方没有交集点 01/29 23:46 : 那所谓80%，照我的阅读理解，应该不是指相较传统蒸 01/29 23:51 : 馏可以减少的工作量，只能看有无专业的能解释一下吧 01/29 23:52 : 我之所以提transformer 是因为它可以做transfer 01/29 23:52 : learning (迁移学习) 01/29 23:53 : 等於openai把95% transformer架构做好後别人用此 01/29 23:53 : 架构做迁移学习去训练调教很类似的LLM 01/29 23:55 : transfer learning是直接提取模型的特徵到另一个 01/29 23:57 : 模型用你没办法把openai拿出来用 01/29 23:58 dro0202: r1奠基在v3上，v3是ds自己train的不是？只是站在巨 01/29 23:59 dro0202: 人的肩膀上，以及工程的精进使得成本较低 01/29 23:59 : 每一个模型都是啊 01/30 00:00 : 如果是特定任务的小语言模型要骗骗补助/投资用上面 01/30 00:01 : 那套确实可行，但像DS这种大的这样搞可能还更贵 01/30 00:01 : 推科普 01/30 00:01 : o1 站在4的肩膀上据说还是花了相当於2亿的gpu时间 01/30 00:02 : 这个不是R1成本较低的原因 01/30 00:02 : 这问题直接问R1啊，他自己都说有可能了... 01/30 00:03 : https://i.imgur.com/JGz4wJ8.jpeg 01/30 00:03 : v3蛮难用的大概就跟others差不多 01/30 00:05 : r1套上去才有点看头 01/30 00:05 : https://i.imgur.com/DE9E1Ro.png 01/30 00:05 : 这个是我直接问R1, deepseek R1是否有可能从chat 01/30 00:06 : gpt o1蒸馏而来, R1的答覆 01/30 00:06 : 其实他的第二段就是我讲的 01/30 00:07 : 你无法部署chatGPT o1, 所以你只能用API做蒸馏 01/30 00:07 : I大图好像坏掉了? 01/30 00:07 : 是不是有可能? 可能性不是零 01/30 00:08 : 我贴的图好像只能手机看 01/30 00:08 : 是不是有可能?用API做蒸馏可能性不是零 01/30 00:08 : 但几千万上亿次的调用... 01/30 00:08 : 问o1-mini也说可能。专有名词叫黑盒蒸馏 01/30 00:11 : https://i.imgur.com/ykW4LOG.jpeg 01/30 00:11 : 遇到一个不讲武德的，用暴力式创新 01/30 00:11 : 股价说明一切XD 01/30 00:11 : 可能性不为零只能这麽说 01/30 00:12 : 我这边也是告诉你可能性不为零但这个规模的调用 01/30 00:12 : 难度极高 01/30 00:13 : 而且说实在 R1一点也不像模仿o1 01/30 00:13 : 对话过就知道了 01/30 00:13 : 现在最好奇的是，如果真的大外宣为什麽不叫R1写 01/30 00:14 : 大外宣我是觉得不像啦之前听都没听过 @@a 01/30 00:15 : 一直没呼叫过o1，o1的chain of thought也是会条列吗 01/30 00:17 : OpenAI 指的是R1吗我怎麽觉得指的是v3 01/30 00:17 : 还是跟o1-mini一样直接生结果？ 01/30 00:17 : v3跟4o回答是有点像。但v3真的不强 01/30 00:18 : 难道OpenAI不是基於事实指控? 01/30 00:19 : B站搜了一下 ds去年6-7月就有了没啥影片@@a 01/30 00:19 : v3就便宜而已 https://i.imgur.com/RAjyN65.jpeg 01/30 00:19 : 爆红也是这几天的事说大外宣其实蛮怪的 @@a 01/30 00:19 : 爆红的是R1 上周1/22才公布R1论文 DS去年就不强 01/30 00:22 : 说盗用，也不是指百分百都靠蒸馏，关键部分调整方向 01/30 00:23 : 蛮有可能的 01/30 00:23 : o1会条列但是没DS详细 01/30 00:27 : DS思考步骤说得很细 O1只会大概说一点 01/30 00:28 : 我呼叫o1-preview没条列...o1有锁api key不给中介 01/30 00:29 : 价值3块台币的o1-preview 回答如下 01/30 00:29 : DS某些方面来说解决部分AI黑箱思考的问题 01/30 00:29 : https://i.imgur.com/Xxfekfz.jpeg 01/30 00:29 : 学生学习老师当然要更厉害啊 01/30 00:30 : 所以你就知道很多人完全没用过完全是在瞎讨论 01/30 00:30 : 它们不知道左下角R1没点下去就只是在用v3 01/30 00:31 : 甚至不知道v3 r1 o1 o3 在说什麽 01/30 00:31 : 如果不知道R1跟v3的差别那讨论什麽蒸馏? 01/30 00:32 : 照这样理解以後中国一直抄(蒸馏)就好啦除非美国锁国 01/30 00:33 : 阿所以要限制啊别人花了大钱训练的模型给你吃豆腐 01/30 00:36 : 以後谁还要花钱训练 01/30 00:36 : 是有这样的意见没错昨天就有人说通用型的会非常卷 01/30 00:37 : 类似当年搜寻引擎大战近乎永远免费给你用这样 01/30 00:37 : 专用型的ASIC与相关软体可能会更快实现获利 01/30 00:38 : openAI现在是要收钱的阿你要叫它们也课个关税吗 01/30 00:39 : 有一说一，openai自己也是搜刮网路上别人的智财当 01/30 00:39 : 基底训练的，他好意思说吃豆腐? 第二，训练花钱也是 01/30 00:40 : 各个巨头把毛利扩张到50%以上以近垄断方式堆出来的 01/30 00:41 : ，拿证实体公司，毛利给你15-25%，训练成本会高到哪 01/30 00:41 : 01/30 00:42 : 可以蒸芝麻包ㄇ？芝麻包豪好粗 01/30 00:55 : 拿别人的蒸馏酒来提炼自己的酒，大概是这概念吧 01/30 01:02 : 人真好解释给一堆笨蛋听 01/30 01:04 : 刚刚OpenAI说去年下半有超大量API请求啊, 01/30 01:05 : 他以此推论的 01/30 01:05 : 想也知道怎麽可能靠call api 很贵的 01/30 01:07 : 也不需要解释这麽多，投资就是靠认知的落差赚钱， 01/30 01:16 : 看好看衰选一台车上，让时间来决定胜者就是了 01/30 01:16 : 所以openai说有call api就知道人家有抄袭？这只有 01/30 01:27 : 智障青鸟会信 01/30 01:27 : 以AI 模型来说，公开推理计算方式不是什麽新闻。大 01/30 01:38 : 部分AI “系统” 比得是前处理功力，要先生出够有意 01/30 01:38 : 义的边境资料，後段训练才有意义。而训练资料的清理 01/30 01:38 : /筛选的成本，则不一定会被算进所谓的“训练成本” 01/30 01:38 : 。至於针对特定，处理过的资料来源，以另一套系统 01/30 01:38 : 的推演结果，直接当第二套的来源，在实务上不算罕见 01/30 01:38 : ，实作上很多跨领域系统都这样搞。但，学术上一般是 01/30 01:38 : 不认可这种应用方式就是。 01/30 01:38 : 一般是把第一套系统当成前处理，第二套系统的范围比 01/30 01:52 : 前套小但针对特定领域更细分的预测系统。整体训练成 01/30 01:52 : 本会更低，特定小范围的结果品质会比的第一套系统好 01/30 01:52 : 。这种算是特化架构，缺点是：扩张困难。处理的问题 01/30 01:52 : ，领域数目增加到一个程度，整体效能（结果的品质） 01/30 01:52 : 会比原系统差... 01/30 01:52 : 思考步骤可以用prompt，看回答不能判断 01/30 03:13 : 赞耶拿openAI来开源叫蒸馏简直是改包装加12道功 01/30 03:53 : 法 01/30 03:53 : 不会去科技版讨论? 01/30 05:11 : 模型是程式码？？18124你可以不要LLM问几个问题就出 01/30 07:32 : 来造谣了吗？我建议你先去了解pytorch跟transformer 01/30 07:32 : 不然一知半解出来发文真的让人不忍直视… 01/30 07:32 : 科技版当年嘲笑Chatgpt的现在质疑DeepSeek 水准低 01/30 09:06 : 推文是不是有文盲，哪个字看到模型是程式码 01/30 16:11 : 模型的程式码跟模型是程式码天差地远好不好 01/30 16:13 offset-sig=0c46c1478726afb0675f9ed9a4e663523d654164" data-longpollurl="/v1/longpoll?id=919c00a5347b77fc1442d01db835eb52dd62927e" data-offset="18114">

id='HotBoard'>

TOP 1：Gossiping - 八卦板

TOP 2：LoL - LoL 板

TOP 3：NBA - ＮＢＡ

TOP 4：WomenTalk - [女孩板]

TOP 5：ToS - [神魔]

TOP 6：movie - [电影]

TOP 7：PuzzleDragon - 龙族拼图

TOP 8：C_Chat - [希洽]

TOP 9：joke - [笑话] 就可板

TOP 10：Baseball - [棒球]

TOP 11：Tech_Job - [科技板]

TOP 12：MobileComm - 行动通讯板

TOP 13：BuyTogether - [合购板]

TOP 14：Stock - 股市板

TOP 15：Boy-Girl - [男女板]

TOP 16：e-shopping - [ＥＳ] 线上购物

TOP 17：NBA_Film - [影片]NBA FILM

TOP 18：KR_Entertain - [韩综板]

TOP 19：StupidClown - 笨板

TOP 20：Japan_Travel - 日本旅游板

TOP 21：BabyMother - 妈宝板

TOP 22：BabyProducts - 宝宝用品板

TOP 23：CarShop - 买车板

TOP 24：Sex - 西斯板

TOP 25：Beauty - 表特墙

	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Stock 板

热门看板

Re: [新闻] OpenAI：已掌握DeepSeek盗用模型证据

赞助商连结