Re: [情报] 50美元训练出媲美DeepSeek R1

时间Fri Feb 7 13:01:48 2025

我的信息源说是1000个样本是通过gemini得到，但是又以通义千问为基底模型进行监督微调而来的神奇表现包括全球很多类似路綫都是藉鉴通义千问才能达到这样的惊人效果，非李飞飞一家做到这才是最奇怪的。今日鼓点：大A乘风直上，就像哪吒2的票房 ※ 引述《DrTech (竹科管理处网军研发人员)》之铭言： : ※ 引述《LimYoHwan (gosu mage)》之铭言： : 也是只看 fine-tune 1000题，一次的成本。 : 而且，试了不知道几次， : 终於找到一次， : 可以在部分考卷上赢一个很烂的模型。 : 媒体文章中，忽略不计的成本，至少包含： : base模型训练的成本(至少占成本99%) : 研究人员不断试错找1000题的成本。 : 多组1000题，再用 Gemini 模型，产生fine-tune资料的成本。 : 其他错误资讯，媒体的内文写： : 研究人员表示，s1是通过蒸馏法由谷歌推理模型Gemini 2.0。 : 完全错误。原始论文写： : 先准备 59000笔训练资料，在不断的用各种方式，选1000笔资料，再将1000笔 Gemini 2.0 Flash Thinking 改写训练资料。 : 最後再用这些资料fine-tune Qwen2.5-32B-Instruct模型。 ~~~~~~~~~~~~~~~~~~~~~~~~~ yes，u r right : 真的要乱写，也要写成蒸馏 Qwen2.5-32B的能力，而不是蒸馏 Gemini。 : 而且这种做法严格来说不叫蒸馏，叫fine-tune微调 : 结论： : 研究没问题，找到了一种成本较低的流程，可产生可思考模型。但效果很一般。 : 一堆外行人，连论文都不看，在造假新闻。 : 媲美OpenAI-o1，deepseek-r1，连论文都没这样写，纯媒体造假。 -- 英国医学网站：台湾丁丁长度，世界86国（地区）排第85，和东南亚一个水平，比东北亚短2cm --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 171.14.63.200 (中国) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1738904509.A.C3D.html ※ 编辑: icrose (171.14.63.200 中国), 02/07/2025 13:06:09

1^F：→ dansy : 对岸有种说法：中文字在单位资讯量上比英文字有优势 02/07 13:05

※ 编辑: icrose (171.14.63.200 中国), 02/07/2025 13:06:55

2^F：→ dansy : 所以运算同样的token数量下中文模型表现会较佳 02/07 13:07

3^F：推 herculus6502: 有道理 02/07 13:20

4^F：推 yitniya : 中文就算错字或乱序也不影响你理解 02/07 13:22

5^F：→ TsmcEE : 那个备注... world data不是这样说的喔 02/07 13:27

6^F：→ TsmcEE : 日本、韩国和中国分别以平均长度13.56公分、13.16公 02/07 13:28

7^F：→ TsmcEE : 分、13.07公分，分别为第61名、66名和69名，至於台 02/07 13:28

8^F：→ TsmcEE : 湾男性，平均12.6公分，排行第75名 02/07 13:28

9^F：推 alphish : 台湾男性如果细分祖籍，应该会有明显差异吧 02/07 13:29

10^F：推 saiiys : https://youtu.be/Run03PWXGBc?si=jCgEgs9YM6ZRDB-0 02/07 13:54

11^F：嘘 PureAnSimple: 不重要。废文不如推文。 02/07 15:15

12^F：嘘 phoenixtwo : 什麽烂股点 02/08 00:44

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Stock 板

Re: [情报] 50美元训练出媲美DeepSeek R1

热门看板

赞助商连结