Re: [心得] AI需求是供应商精心设计好的套路

时间Sun Mar 22 08:59:21 2026

最近在想一个跟原po类似的问题刚好也跟 AI 讨论了一阵子，整理成一些自己的观察先抛结论：这不太像什麽已经被设计好的套路，比较像是「科技树还没点到那里」目前 AI 发展其实有两条很明显的趋势在同时发生：一个是大模型持续变强，但边际效益开始下降模型变大还是会变强，但提升的幅度，跟投入的算力、成本相比，没有以前那麽划算另一个是小模型越来越强透过 distillation、quantization，还有针对特定任务优化小模型其实已经可以 cover 很多实用场景所以就出现一个有趣的可能性：未来「训练大模型」这件事，可能还是只会集中在少数几间大公司手上但「推理」这件事，不一定需要一直依赖超大模型有没有可能变成把任务拆开，交给多个小模型，在不同装置上协作完成？这个概念其实有点像公司运作：公司不会全部都请通才，而是不同领域的专才组成不同 team，一起把事情完成对应到模型也是一样：现在的大模型，其实有点像把各种能力（语言、逻辑、知识）全部塞在一起但理论上，这些能力是可以被拆分、模组化的问题就出在一个关键点：latency（延迟）如果是一个大模型，你问问题，它可以一次 forward 就给答案但如果是多个小模型协作，就会变成：模型 A → 模型 B → 模型 C 中间需要传递资讯、同步状态，甚至「讨论」这个过程的延迟，如果太高，就完全不可行所以我现在的理解是：未来架构会不会改变，关键不在模型大小，而在 latency 能不能压下来如果有一天： - 装置间通讯延迟大幅下降（硬体 / network） - 模型之间的协作机制变成熟（software / protocol）那多小模型协作，才有可能真的落地到那个时候，整个生态可能会有一些变化： - GPU / memory 还是很重要，但需求不一定是「无限膨胀」 - 能源问题也可能被部分缓解（因为计算被分散） - 边缘装置（手机、桌机、笔电、车机、甚至穿戴装置）的算力不再闲置现在其实是：我们在用云端 server 跑 AI，但身边一堆装置的算力都是闲置的未来有没有可能变成：这些装置一起参与推理，变成一种分散式 AI？当然，这条路现在还卡在 latency、稳定性、还有系统复杂度，但我相信已经有人在研究了所以短期内，大模型 + 云端还是主流但如果这些问题被解掉，现在这种「集中式算力 + 超大模型」的模式，未必是唯一解大概就是这样，算是一点还没成熟的想法，抛出来看看大家怎麽想 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.168.146.181 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1774141163.A.E2A.html

1^F：推 Shiang1225 : 这篇正解我们看太短了明明就是要10年20年的东西 03/22 09:06

2^F：推 sceleton : 历史上来说就是这样。Mainframe => PC => server => 03/22 09:09

3^F：→ sceleton : smartphone 03/22 09:09

4^F：推 CKRO : 这个想法很有意思 03/22 09:25

5^F：推 masala : 终端产品的算力被架空了，沦为一个收发器而已 03/22 09:29

6^F：→ bnn : 你这个就Edge想干的迟早的事但现在没必要 03/22 09:38

7^F：→ bnn : 因为现在架Edge你付出的就你说的额外成本不如扩大dc 03/22 09:39

8^F：→ bnn : 因为现在能回收的反而是小利基型特化先证明能回收 03/22 09:40

9^F：→ bnn : Edge是要到普及人手一支能回收的通用p2p-like串接 03/22 09:41

10^F：→ bnn : 而目前对资料传输的需求连短距离都不能忍铜线要CPO 03/22 09:42

11^F：→ bnn : 你要进步到无线能传低功耗大资料量科技树还没点到 03/22 09:43

12^F：→ bnn : 就跟现在你可以几张显卡自架local(一台Edge主机) 03/22 09:44

13^F：→ bnn : 但显然这是上面的PC阶段距离smartphone还很远 03/22 09:44

14^F：→ bnn : 要解决完缩小能耗散热传输一堆问题 03/22 09:45

15^F：→ layer0930 : 这个目前困难性太高了，还有成本问题 03/22 09:46

16^F：→ Kayusumi : 目前一些手机上的ai运用就算是轻量化模型吧 03/22 09:54

17^F：推 cphe : 一定会这样吧只能说AI才刚起步，硬体无法满足 03/22 10:29

18^F：→ cphe : 需求，未来一定会有需求缓和下来回归正常的时候 03/22 10:29

19^F：→ cphe : 至於Edge AI目前完全不够力 03/22 10:29

20^F：→ potionx : 两者会并行依照需求决定你使用什麽装置 03/22 10:43

21^F：推 CGDGAD : 现在不是有混合专家模型吗？专门的问题会导向专门 03/22 11:16

22^F：→ CGDGAD : 的推理路径增加运算效率 03/22 11:16

23^F：→ paimin : 结果你的小模型比大模型还废成本还高继续用大的 03/22 13:05

24^F：→ stocktonty : 你是跟什麽等级的AI讨论要先厘清 03/22 13:08

25^F：推 japan428 : 你讲的就是边缘ai吧，其实Apple这些行动装置厂商都 03/22 15:24

26^F：→ japan428 : 着手布局了啊 03/22 15:24

27^F：→ japan428 : 但这跟CSP会有巨大需求不冲突，因为现在光看openc 03/22 15:28

28^F：→ japan428 : law吃token 的量就很惊人 03/22 15:28

29^F：推 mdkn35 : 个人觉得gemini已经是这样了要画图才切banana 03/23 06:54

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Stock 板

Re: [心得] AI需求是供应商精心设计好的套路

热门看板

赞助商连结