Stock 板


LINE

※ 引述《mangle (mangle123)》之铭言: : 比较好奇这段: : 尽管蒸馏是AI业界常见做法,但DeepSeek若利用蒸馏技术来打造自家模型,并与OpenAI竞 争,将违反OpenAI服务条款,因此产生疑虑。 : OpenAI的服务,或是「利用输出结果,来开发与OpenAI竞争的模型」。 : 各个ai 大语言模型不是都会互相参照比较和训练吗? 我以为这是业界常识… : 不过要怎麽定义「与openai 竞争的模型」? 因为deepseek 也没盈利而且也开源学习,他也承认他不只从chatgpt训练也参照不少,deep seek 也认为自己是chatgpt : 所以是真有盗窃疑虑,还是业界常识的互相学习使用? 如何定义这部分 各家互相参考, 指的是训练方法还有训练的文本挑选, 蒸馏不太一样 AI = 模型的程式码+训练 能开源的部分只有程式码, 训练是看各自调教 模型的能力够, 差不多的调教方式就会得到差不多的结果 训练方法更好, 或是文本品质越高、越多样、量越多, 模型就越强 自从OpenAI爆红以来, 大公司的LLM模型都是遵循OpenAI的训练方法 预先训练: 拿大量文本让AI模型学习基本语言能力、基本知识 监督微调: 有了基本能力之後, 模型开始有推理能力 这时候由人类介入, 告诉模型怎麽想是对的, 怎麽想是错的 之前所谓的贴标签, 就是这个阶段 奖励建模: 把对错的判断建立模型, AI想对了, 这个模型就奖励他 强化学习: AI自己跟自己练习 不管是meta还是google, 之前都是照OpenAI这个成功模式做 所以这些公司能做的就是拚算力, 透过更大量的训练, 希望最终可以暴力超车 但蒸馏就不同, 蒸馏是直接拿另一个模型的推理结果, 让另一个模型照着得到同样结果 譬如我要我刚刚问ChatGPT, 要他给举例说明什麽是拟人法 他的回答是这样 https://i.imgur.com/ey5mX61.png ChatGPT要回答这个问题, 中间要经过很多推理, 譬如他要先理解我的问题 这里面就牵涉到, 他要理解我讲的拟人法是修辞当中的拟人法 然後再从这一个理解, 去思考拟人法的意思是甚麽, 最後再想出一个符合范例 蒸馏的话, 就是学生模型已经预先知道这个问题的答案是甚麽 有头有尾, 要生出中间的推理就会比较容易 但这里有个问题 你要用蒸馏让一个模型得到另一个模型类似的能力 通常就是需要老师模型产生极大量的练习後结果 才能传授毕生功力给学生模型 如果ChatGPT是开源模型, 可以自己部署在自己平台上 要做这样大规模训练是有可能 但ChatGPT无法部署在自己平台 (刚刚有人说ChatGPT 2可以, 但蒸馏顶多只能逼近老师, 用ChatGPT 2只能蒸出垃圾) 所以要做蒸馏只能透过API, 而要透过API做几千万甚至几亿规模的蒸馏训练 这难度极高啊.... (ChatGPT刚刚教我另一个方法 就是拿一个原本就有ChatGPT4能力的模型 这样只要少量训练, 就能超越ChatGPT 4 但原本就有ChatGPT 4能力的新模型难道自己会生出来吗XD 你还是得先得到这个模型啊...就是V3 那V3怎麽来?) --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 1.169.68.61 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1738164035.A.04B.html
1F:→ s213092921 : 你先让美吹上车完再焊死车门好吗 01/29 23:23
2F:推 tangolosss : 支那粉蛆说好的重击美股呢?? 怎又开始自卑了??????? 01/29 23:25
3F:→ uv5566 : deepseek已经不重要 openai原本商法已经没用 市场 01/29 23:25
4F:→ uv5566 : 投资都要重新估值 01/29 23:25
5F:→ uv5566 : 接下来怎麽圈钱才是问题 01/29 23:26
6F:推 etset : 学生只要念会考试的范围就好了 01/29 23:27
大规模使用的LLM平台, 会考的范围就是全部了
7F:→ etset : 题库就在那里了 01/29 23:27
大规模LLM平台的题库, 差不多就是全世界所有问题了..
8F:→ good5755 : openAI不是说有两个可疑帐号大量使用API 01/29 23:31
9F:→ good5755 : 你ban我算力我直接偷抄答案 很符合对岸的逻辑 01/29 23:31
10F:→ IBIZA : LLM没办法只抄答案 LLM必须具备推理能力才能应付 01/29 23:32
11F:→ Windtears : https://substack.com/@cloudedjudgement/p-1557935 01/29 23:32
12F:→ Windtears : 18 01/29 23:32
13F:→ IBIZA : 所有问题 只能说 有头有尾 要生出推理比较容易 01/29 23:33
14F:推 sickshadow : 所以蒸馏可以让学生得到比老师还口语化的结果? 01/29 23:33
15F:→ IBIZA : 就像计算题已经知道答案要写算式 总是比较容易 01/29 23:33
16F:→ saisai34 : 学生比老师厉害不是很正常吗 人类社会不就这样@@a 01/29 23:34
17F:→ IBIZA : 蒸馏通常没办法比老师厉害 01/29 23:34
18F:→ IBIZA : 蒸馏就是让学生模仿老师 逼近老师 01/29 23:35
19F:→ saisai34 : 如果ai模型 没办法做到学生比老师强 那不就废了@@? 01/29 23:35
20F:→ IBIZA : 目前用的蒸馏法没办法 01/29 23:35
21F:→ IBIZA : 目前的蒸馏法会劣化 01/29 23:35
22F:推 lovepork : chatgpt 全名generative pre-trained transformer 01/29 23:35
23F:嘘 liscp : 等等…….股点勒 现在也要把股版蒸馏成栅栏版喔? 01/29 23:35
24F:→ IBIZA : 一直蒸下去 会越来越笨 01/29 23:35
25F:→ saisai34 : 越练越笨 那就不叫ai好吗 =.=a 01/29 23:36
26F:→ lovepork : 我好奇 deepseek也是transformer architecture吗? 01/29 23:36
27F:→ IBIZA : deekseek的呈现方式 没理由不是transformer 01/29 23:38
28F:→ IBIZA : transformer指的是 理解输入资讯->推理->转成输出 01/29 23:39
29F:推 ohlong : 蒸的丸子 01/29 23:40
30F:→ IBIZA : 应该这样 输入资讯->理解+推理->转成输出 01/29 23:40
31F:推 Aliensoul : openai里面有中国的内鬼 外泄机密给中国公司 01/29 23:41
32F:→ IBIZA : 中间的理解跟推理 是用数学模型 利用大量文本训练 01/29 23:41
33F:推 Yahweh : deepseek 的 weights 也是公开的阿 01/29 23:41
34F:→ IBIZA : 找出自然语言每个片段意义之间的关联性 01/29 23:42
35F:→ linzero : 估狗到有针对一般蒸馏法做改良的,可以用更少的资料 01/29 23:42
36F:→ linzero : 达到旧有的蒸馏效果,像google有开发个Distilling 01/29 23:43
37F:→ linzero : Step-by-Step技术 01/29 23:43
38F:→ wangrg : https://imgur.com/YXsUSJL 01/29 23:43
39F:→ IBIZA : google上面那个"较少资料"是80%耶 01/29 23:44
40F:推 lovepork : transformer 其实就是复杂一点的attention model 01/29 23:45
41F:推 gn02118620 : 你用的是基於事实的分析来进行推理,这边的人是用主 01/29 23:46
42F:→ gn02118620 : 观意识形态扣帽子来反驳 双方没有交集点 01/29 23:46
※ 编辑: IBIZA (1.169.68.61 台湾), 01/29/2025 23:48:30
43F:→ linzero : 那所谓80%,照我的阅读理解,应该不是指相较传统蒸 01/29 23:51
44F:→ linzero : 馏可以减少的工作量,只能看有无专业的能解释一下吧 01/29 23:52
45F:推 lovepork : 我之所以提transformer 是因为它可以做transfer 01/29 23:52
46F:→ lovepork : learning (迁移学习) 01/29 23:53
47F:→ lovepork : 等於openai把95% transformer架构做好後 别人用此 01/29 23:53
48F:→ lovepork : 架构做迁移学习去训练调教很类似的LLM 01/29 23:55
49F:→ IBIZA : transfer learning是直接提取模型的特徵到另一个 01/29 23:57
50F:→ IBIZA : 模型用 你没办法把openai拿出来用 01/29 23:58
51F:→ sunpedro0202: r1奠基在v3上,v3是ds自己train的不是?只是站在巨 01/29 23:59
52F:→ sunpedro0202: 人的肩膀上,以及工程的精进使得成本较低 01/29 23:59
53F:→ IBIZA : 每一个模型都是啊 01/30 00:00
54F:推 DA3921999 : 如果是特定任务的小语言模型要骗骗补助/投资用上面 01/30 00:01
55F:→ DA3921999 : 那套确实可行,但像DS这种大的这样搞可能还更贵 01/30 00:01
56F:推 KrisNYC : 推科普 01/30 00:01
57F:→ IBIZA : o1 站在4的肩膀上 据说还是花了相当於2亿的gpu时间 01/30 00:02
58F:→ IBIZA : 这个不是R1成本较低的原因 01/30 00:02
59F:推 kinda : 这问题直接问R1啊,他自己都说有可能了... 01/30 00:03
60F:→ kinda : https://i.imgur.com/JGz4wJ8.jpeg 01/30 00:03
61F:推 KrisNYC : v3蛮难用的 大概就跟others差不多 01/30 00:05
62F:→ KrisNYC : r1套上去才有点看头 01/30 00:05
63F:→ IBIZA : https://i.imgur.com/DE9E1Ro.png 01/30 00:05
64F:→ IBIZA : 这个是我直接问R1, deepseek R1是否有可能从chat 01/30 00:06
65F:→ IBIZA : gpt o1蒸馏而来, R1的答覆 01/30 00:06
66F:→ IBIZA : 其实他的第二段就是我讲的 01/30 00:07
67F:→ IBIZA : 你无法部署chatGPT o1, 所以你只能用API做蒸馏 01/30 00:07
68F:推 ksjr : I大图好像坏掉了? 01/30 00:07
69F:→ IBIZA : 是不是有可能? 可能性不是零 01/30 00:08
70F:→ IBIZA : 我贴的图好像只能手机看 01/30 00:08
71F:→ IBIZA : 是不是有可能?用API做蒸馏 可能性不是零 01/30 00:08
72F:→ IBIZA : 但几千万上亿次的调用... 01/30 00:08
73F:→ kinda : 问o1-mini也说可能。专有名词叫黑盒蒸馏 01/30 00:11
74F:→ kinda : https://i.imgur.com/ykW4LOG.jpeg 01/30 00:11
75F:→ jen1121 : 遇到一个不讲武德的,用暴力式创新 01/30 00:11
76F:→ BoyceChu : 股价说明一切XD 01/30 00:11
77F:→ IBIZA : 可能性不为零 只能这麽说 01/30 00:12
78F:→ IBIZA : 我这边也是告诉你可能性不为零 但这个规模的调用 01/30 00:12
79F:→ IBIZA : 难度极高 01/30 00:13
80F:→ IBIZA : 而且说实在 R1一点也不像模仿o1 01/30 00:13
81F:→ IBIZA : 对话过就知道了 01/30 00:13
82F:→ kinda : 现在最好奇的是,如果真的大外宣为什麽不叫R1写 01/30 00:14
83F:→ saisai34 : 大外宣我是觉得不像啦 之前听都没听过 @@a 01/30 00:15
84F:→ kinda : 一直没呼叫过o1,o1的chain of thought也是会条列吗 01/30 00:17
85F:→ newwu : OpenAI 指的是R1吗 我怎麽觉得指的是v3 01/30 00:17
86F:→ kinda : 还是跟o1-mini一样直接生结果? 01/30 00:17
87F:→ kinda : v3跟4o回答是有点像。但v3真的不强 01/30 00:18
88F:嘘 phoenixtwo : 难道OpenAI不是基於事实指控? 01/30 00:19
89F:→ saisai34 : B站搜了一下 ds去年6-7月就有了 没啥影片@@a 01/30 00:19
90F:→ kinda : v3就便宜而已 https://i.imgur.com/RAjyN65.jpeg 01/30 00:19
91F:→ saisai34 : 爆红也是这几天的事 说大外宣其实蛮怪的 @@a 01/30 00:19
92F:→ kinda : 爆红的是R1 上周1/22才公布R1论文 DS去年就不强 01/30 00:22
93F:→ newwu : 说盗用,也不是指百分百都靠蒸馏,关键部分调整方向 01/30 00:23
94F:→ newwu : 蛮有可能的 01/30 00:23
95F:推 Flyingheart : o1会条列 但是没DS详细 01/30 00:27
96F:→ Flyingheart : DS思考步骤说得很细 O1只会大概说一点 01/30 00:28
97F:→ kinda : 我呼叫o1-preview没条列...o1有锁api key不给中介 01/30 00:29
98F:→ kinda : 价值3块台币的o1-preview 回答如下 01/30 00:29
99F:→ Flyingheart : DS某些方面来说 解决部分AI黑箱思考的问题 01/30 00:29
100F:→ kinda : https://i.imgur.com/Xxfekfz.jpeg 01/30 00:29
101F:推 kotorichan : 学生学习老师 当然要更厉害啊 01/30 00:30
102F:推 KrisNYC : 所以你就知道很多人完全没用过完全是在瞎讨论 01/30 00:30
103F:→ KrisNYC : 它们不知道左下角R1没点下去 就只是在用v3 01/30 00:31
104F:→ KrisNYC : 甚至不知道v3 r1 o1 o3 在说什麽 01/30 00:31
105F:→ KrisNYC : 如果不知道R1跟v3的差别 那讨论什麽蒸馏? 01/30 00:32
106F:推 ksjr : 照这样理解以後中国一直抄(蒸馏)就好啦除非美国锁国 01/30 00:33
107F:→ Sianan : 阿所以要限制啊 别人花了大钱训练的模型给你吃豆腐 01/30 00:36
108F:→ Sianan : 以後谁还要花钱训练 01/30 00:36
109F:推 KrisNYC : 是有这样的意见没错 昨天就有人说通用型的会非常卷 01/30 00:37
110F:→ KrisNYC : 类似当年搜寻引擎大战 近乎永远免费给你用这样 01/30 00:37
111F:→ KrisNYC : 专用型的ASIC与相关软体可能会更快实现获利 01/30 00:38
112F:→ ksjr : openAI现在是要收钱的阿 你要叫它们也课个关税吗 01/30 00:39
113F:推 gowet : 有一说一,openai自己也是搜刮网路上别人的智财当 01/30 00:39
114F:→ gowet : 基底训练的,他好意思说吃豆腐? 第二,训练花钱也是 01/30 00:40
115F:→ gowet : 各个巨头把毛利扩张到50%以上以近垄断方式堆出来的 01/30 00:41
116F:→ gowet : ,拿证实体公司,毛利给你15-25%,训练成本会高到哪 01/30 00:41
117F:嘘 MoonCode : 01/30 00:42
118F:推 fakelie : 可以蒸芝麻包ㄇ?芝麻包豪好粗 01/30 00:55
119F:嘘 sanos168 : 拿别人的蒸馏酒来提炼自己的酒,大概是这概念吧 01/30 01:02
120F:推 watashino : 人真好 解释给一堆笨蛋听 01/30 01:04
121F:推 wahaha99 : 刚刚OpenAI说去年下半有超大量API请求啊, 01/30 01:05
122F:→ wahaha99 : 他以此推论的 01/30 01:05
123F:推 vi000246 : 想也知道怎麽可能靠call api 很贵的 01/30 01:07
124F:推 blueballer : 也不需要解释这麽多,投资就是靠认知的落差赚钱, 01/30 01:16
125F:→ blueballer : 看好看衰选一台车上,让时间来决定胜者就是了 01/30 01:16
126F:推 davis5566 : 所以openai说有call api就知道人家有抄袭?这只有 01/30 01:27
127F:→ davis5566 : 智障青鸟会信 01/30 01:27
128F:→ esheep : 以AI 模型来说,公开推理计算方式不是什麽新闻。大 01/30 01:38
129F:→ esheep : 部分AI “系统” 比得是前处理功力,要先生出够有意 01/30 01:38
130F:→ esheep : 义的边境资料,後段训练才有意义。而训练资料的清理 01/30 01:38
131F:→ esheep : /筛选的成本,则不一定会被算进所谓的“训练成本” 01/30 01:38
132F:→ esheep : 。至於 针对特定,处理过的资料来源,以另一套系统 01/30 01:38
133F:→ esheep : 的推演结果,直接当第二套的来源,在实务上不算罕见 01/30 01:38
134F:→ esheep : ,实作上很多跨领域系统都这样搞。但,学术上一般是 01/30 01:38
135F:→ esheep : 不认可这种应用方式就是。 01/30 01:38
136F:→ esheep : 一般是把第一套系统当成前处理,第二套系统的范围比 01/30 01:52
137F:→ esheep : 前套小但针对特定领域更细分的预测系统。整体训练成 01/30 01:52
138F:→ esheep : 本会更低,特定小范围的结果品质会比的第一套系统好 01/30 01:52
139F:→ esheep : 。这种算是特化架构,缺点是:扩张困难。处理的问题 01/30 01:52
140F:→ esheep : ,领域数目增加到一个程度,整体效能(结果的品质) 01/30 01:52
141F:→ esheep : 会比原系统差... 01/30 01:52
142F:推 AudiA4Avant : 思考步骤可以用prompt,看回答不能判断 01/30 03:13
143F:→ dingading : 赞耶 拿openAI来开源 叫蒸馏 简直是改包装加12道功 01/30 03:53
144F:→ dingading : 法 01/30 03:53
145F:嘘 ketter : 不会去科技版讨论? 01/30 05:11
146F:嘘 mdkn35 : 模型是程式码??18124你可以不要LLM问几个问题就出 01/30 07:32
147F:→ mdkn35 : 来造谣了吗?我建议你先去了解pytorch跟transformer 01/30 07:32
148F:→ mdkn35 : 不然一知半解出来发文真的让人不忍直视… 01/30 07:32
149F:推 straggler7 : 科技版当年嘲笑Chatgpt的现在质疑DeepSeek 水准低 01/30 09:06
150F:→ IBIZA : 推文是不是有文盲,哪个字看到模型是程式码 01/30 16:11
151F:→ IBIZA : 模型的程式码跟模型是程式码天差地远好不好 01/30 16:13







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:iOS站内搜寻

TOP