Stock 板


LINE

Nested Learning 的工程实例是 HOPE ,HOPE有分快系统跟慢系统两部分 快系统应用Titan model 慢系统应用了CMS(连续体记忆系统) 现成硬体来说,最适合跑整个HOPE的是GPU,虽然也很勉强,NL流行後, GPU会针对这个改版 不过单独CMS的部分,跟现有的LLM是相容的,model架构不变,可以拿训练好 的权重接套用CMS 即使如此,谷歌应该也没很大的动机现在就把CMS套用到Gemini3上 ※ 引述《curiserosi ()》之铭言: : 小弟不才,关於技术的部份看不懂 : 但还是想请教 : 1.现有transfomer架构因为需要死背硬记,所以需要超大规模记忆体 : 来对应长文本、图像,甚至影片,到长影片所需的记忆体规模已经 : 不具备实际可行性或是没有经济价值 : 这部分Nested Learning具备绝对优势,面对长文本、图像,甚至长影片 : 对记忆体的需求成长可控 : 2.Nested Learning具备持续学习的能力,这点是transformer不具备的 : 基於以上两点,即使现在还有很多缺点,未来也绝对有Nested Learning : 的一席之地(因为transformer在这些地方的劣势是结构性的,无法改变) : 请问我这理解有没有哪边有问题? : 如果未来Nested Learning大规模布署,在产业面上的影响 : 1.SRAM的需求会大幅增加,Nested Learning需要的不是大量的HBM来记忆 : 而是需要能快速响应的SRAM来对应CMS 照原PO的说法应该是如此,不过我不认为是这样 我觉得用量增加最多的应该是DRAM,甚至是其他更慢的记忆体 你可以想,如果每个人的输入都让model更新参数,那云端要保留多少个model? 这些model的参数都用最贵的SRAM?这太不现实了 而且如果更新参数只要针对个别用户,多速记忆体的响应速度都够快了,到时需 求的容量才会是关键,毕竟要服务太多用户了 如果只是把CMS套用在现有的LLM上 HBM的需求基本应该维持跟现在差不多 : 2.算力的需求暴增,相比现在的transformer是卡在记忆体数量与频宽 : Nested Learning因为需要Backward Pass,需要的是数倍的算力 是的,NL 比较适合用GPU跑,但要跑得好,GPU也得针对性的重新设计 : 3.由上面两点推测,封装需求也会改变,HBM+GPU的封装需求成长减缓 : 如CoWoS,相对的interposer、载板也不需要那麽大,所以这些产业 : 成长会放缓 : 我脑容量不够,这是我想像力的极限了 : 什麽双曲空间已经超出我认知范围 : 不过还是想问一下我这样理解有没有什麽问题 : 感谢 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.150.246.41 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1765651058.A.74F.html
1F:推 avans : 推说明 12/14 02:50
2F:推 minazukimaya: 我原文是说边缘端最快的那两层用SRAM 云端当然不可 12/14 03:08
3F:→ minazukimaya: 能是SRAM 云端的慢层参数量都很高 SRAM塞不下的 12/14 03:08
4F:推 kuku951 : SRAM台厂好像只有华邦电有做 12/14 04:09
5F:推 curiserosi : 感谢回覆 12/14 07:18
6F:→ curiserosi : 请问mina,NL的记忆模糊、平行运算差的问题 12/14 07:22
7F:→ curiserosi : 目前有解吗? 12/14 07:22
8F:推 curiserosi : edge端,机器人似乎就更适合NL而不是transformer 12/14 07:28
9F:→ bnn : 就...有些人的脑袋记忆力比较强(SRAM)有些人金鱼脑 12/14 09:35
10F:→ bnn : (DRAM)有些人没脑(transformer) 得加钱! 12/14 09:35







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Soft_Job站内搜寻

TOP