[新闻] 字节跳动旗下「豆包」新模型架构推理成

时间Wed Feb 12 23:49:32 2025

原文标题：字节跳动旗下「豆包」新模型架构推理成本最多降83% ※请勿删减原文标题原文连结： https://udn.com/news/story/7333/8543703 ※网址超过一行过长请用缩网址工具发布时间： 2025-02-12 15:17 ※请以原文网页/报纸之发布时间为准记者署名：林宸谊 ※原文无记载者得留空原文内容：字节跳动旗下「豆包大模型」Foundation团队，近期提出一种全新的稀疏模型架构「UltraM em」，该架构在保证模型效果的前提下，推理速度较传统的MoE（专家混合模型）架构提升2 到6倍，推理成本最高可降低83%。陆媒财联社报导，这项创新成果已被机器学习和AI领域的顶级会议ICLR 2025接收，为解决大模型推理效率和扩展能力问题提供了全新思路。大模型的推理能力，对应的是端侧AI应用/工具的回应能力和速度。随着模型规模的扩大，推理成本和访存效率已成为限制大模型规模应用的关键瓶颈。在Transformer架构下，模型的性能与参数数量和计算复杂度呈对数关系。随着LLM规模不断增大，推理成本会急剧增加，速度变慢。为了解决计算问题，先前的研究者提出MoE和PKM（Product Key Memory）方案，但都有各自局限性。包括MoE架构牺牲了效率、PKM架构牺牲了效果，这些局限性使得MoE和PKM在推理效率、模型效果和扩展能力等方面的优化空间仍需进一步探索，UltraMem正是为了解决上述缺点。 UltraMem参考了PKM的设计，但针对PKM的缺陷予以补充，优势主要在於降低推理成本、提升推理速度、保持模型效果。豆包研究团队在151M、680M、1.6B三个不同规模的模型上进行了广泛的实验。实验结果显示，UltraMem在模型效果和推理速度方面均优於MoE和PKM架构，且在680M、1.6B上具有显着的效果优势。报导提到，无论是训练端还是推理端，当大模型厂商「卷」起成本，代表AI应用将在未来更加高效易用；当推理成本大幅降低，将助推AI技术在更多领域的应用成为可能，尤其是对於资源受限的场景，如边缘计算和移动设备等，能让更多企业和开发者有能力使用和部署AI模型。心得/评论：美国矽谷科技公司在卷谁能拿到更多晶片中国科技公司则是在卷谁能把AI成本降得更低 ※必需填写满30正体中文字，无意义者板规处分 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 125.224.143.192 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1739375374.A.361.html

1^F：推 ksjr : 台湾在卷一次能够点几碗面线 02/12 23:51

2^F：推 holysong : 感觉快回到亩产万斤的年代了 02/12 23:52

3^F：推 kuosos520 : 最先进的晶片已经不会进中国了，自己慢慢卷吧 02/12 23:53

4^F：推 Roger5566 : 崩 02/12 23:54

5^F：推 cityport : 软体写得跟屎一样..硬体堆料很快就会出现瓶颈 02/13 00:00

6^F：→ cityport : 软硬体要同时进化..缺一边都会变成拖油瓶 02/13 00:00

7^F：→ cityport : 靠高效率软体挑战OpenAI的只会越来越多 02/13 00:03

8^F：→ cityport : 当OpenAI把一堆职缺搬到印度..就注定只会是一代拳王 02/13 00:05

9^F：推 a2006003 : 可以当豆沙包吃吗 02/13 00:13

10^F：推 dennis2030 : 单看新闻内文看起来实验只有做在 1B 这个量级的小 02/13 00:19

11^F：→ dennis2030 : model 上，也要看能不能 scale up 才算真的爆炸性突 02/13 00:19

12^F：→ dennis2030 : 破吧 02/13 00:19

13^F：→ coffeedemon : 觉得算力大力出奇蹟的机会比较大可是预算有限 02/13 00:19

14^F：→ cityport : 有钱狂扫铲子的也只有少数几家..还不如从软体下手 02/13 00:38

15^F：→ leopika : 字节跳动不是去年被实习生恶搞，导致模型被破坏吗 02/13 00:52

16^F：推 stlinman : 难怪东方武艺会没落! 西方铲子进步到挖土机，东方还 02/13 01:02

17^F：→ stlinman : 在钻研怎麽铲最省力。要不要顺便练内功运个气? 02/13 01:03

18^F：→ stlinman : 软体再快，也不可能快过硬体。一个是加法一个是减法 02/13 01:05

19^F：推 sean667cd : 吃面线错了吗。 perplexity 好用啦赞 02/13 02:10

20^F：推 dmx6 : 演算法写的好比堆硬体效率高啊 02/13 02:12

21^F：→ DPP48 : 大家一起吹 02/13 02:37

22^F：推 Grothendieck: 干片加速生成 02/13 02:50

23^F：→ yunf : 你们大概还没想到他们为什麽要花钱砸在这里 02/13 05:59

24^F：→ cityport : 好的软体是事半功倍..烂的软体是事倍功半 02/13 06:12

25^F：→ cityport : 就像iPhone即使硬体落後..效能一样屌虐安卓 02/13 06:14

26^F：推 asirk124 : 软体再怎样强化都有极限 02/13 06:29

27^F：→ Feting : 卷软体降低硬体需求本来就是必定发生的项目，现在 02/13 07:01

28^F：→ Feting : 只是新闻聚焦中国夺版面，实际上全世界都会想做这 02/13 07:01

29^F：→ Feting : 件事。但也不代表堆硬体是错误的，两件事本来就不 02/13 07:01

30^F：→ Feting : 冲突 02/13 07:01

31^F：→ afflic : 软体怎麽没差 02/13 07:02

32^F：→ afflic : 你用加法跟乘法能一样吗 02/13 07:02

33^F：推 MacBookAir12: API 多少钱先说吧 02/13 07:25

34^F：→ Lowpapa : 超级鬼故事 02/13 07:48

35^F：推 kshssoar : 觉得软体没差的，怎麽不用14700+5090在win95上 02/13 08:09

36^F：→ kshssoar : 看跑不跑得动爱尔登法环 02/13 08:09

37^F：推 ohsho62 : 都说是豆包了 02/13 09:12

38^F：嘘 Wolverin5566: 盗版0成本啊 02/13 09:25

39^F：推 Noberman : 台湾：点线面 02/13 09:29

40^F：推 LAURANCE : 炸豆包好吃 02/13 09:38

41^F：→ ich51 : 讲的好像美国人都不会写软体一样了 02/13 09:54

42^F：→ fenix220 : 脑包 02/13 09:58

43^F：→ Casper50 : 台湾推出的会叫草包吗 02/13 11:09

44^F：推 phoenixtwo : 中国科技在比谁比较会吹牛吧 02/13 17:53

45^F：嘘 cityhunter04: 设备成本、人工成本、用电成本、一堆成本都不算… 02/13 21:48

46^F：→ cityhunter04: 超便宜！ 02/13 21:48

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Stock 板

[新闻] 字节跳动旗下「豆包」新模型架构推理成

热门看板

赞助商连结