Re: [讨论] 中研院繁中LLM被爆直接拿对岸的来套

时间Sat Oct 14 15:46:23 2023

※ 引述《DrTech (竹科管理处网军研发人员)》之铭言： : 2. 训练模型会先卡什麽？ : 目前，台湾任何一个单位，根本没能力研发LLM模型架构。台智云，中研院，或其他任何单位。 : 都是基於LLaMA2上去 fine-tune的。 : 所以模型都是 7B 13B 70B大小。 : 而是大概都是用QLORA或相关技术去 fine-tune的。这些都是open source直接去套而已， : 完全没有任何技术门槛。 : (只有谁愿意采购几千万硬体的门槛而已) 身为LLM猴子，大多同意DrTech的看法，只是台智云这块有点不一样。其实台智云有几乎一半台湾杉2号的机器可以用，也克服很多开源软体无法解决的问题；例如硬体是V100不是A100，又要能够做3D model parallelism，又要同时能跑LoRA，RLHF，在100Gbps网路中维持GPU使用率满载等等。在meta llama出来之前，我们还是跑BLOOM-176B，硬体需求更高。我想说的是，在LLM训练阶段，许多硬体门槛已经被台智云推倒了，台湾杉2号还能够做很多事！我觉得可惜的是政府，学界，企业的整合部份，因为不同单位考量的利益是不同的，企业只做特定任务finetune是因为客人就需要这种东西，至於基础模型的训练无法在短时间内看到好处，比较适合政府和学研单位主导。LLM猴子什麽咖都不算，在公司内拍桌说要开源也没人听（还好没有被开除XD）例如TAIDE是很有潜力当个统合协调的角色，看起来官学合作已经成型，只剩业界无法进去？纵使业界在台湾杉2号上已经有许多突破，但我们没办法有机会透过某种合作的形式让学界也使用我们的技术，然後公司又不像学界那样以论文产出为目标，所以很难说服老板去做些"开源"的工作，自然也不会做些纯研究的项目。台湾杉2号绝对能够做到清理commoncrawl、FP16精度训练不用QLoRA、训练超过176B参数的大模型。希望大人物们（产官学）能够多多思考和沟通，看怎麽促成更多人的合作罗。 --

※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 182.234.135.79 (台湾) ※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1697269585.A.56F.html

1^F：→ ToastBen: 说个笑话：产官学 10/14 23:27

2^F：→ DrTech: 很好的讨论，让大家看到更多想法 10/15 00:12

3^F：推 zanyking: 推，希望看到更多通用的合作与尝试 10/15 00:29

4^F：→ alex780312: 补充一下，台智云像是官+产的合作，目的在充分发挥台 10/15 10:24

5^F：→ alex780312: 湾杉二号使用率，但缺乏学研角色。现况是台湾杉的资 10/15 10:24

6^F：→ alex780312: 源被切成两半各做各的，台智云考量time to market ， 10/15 10:24

7^F：→ alex780312: 而TAIDE 可以慢慢打磨，路线不同 10/15 10:24

8^F：推 Csongs: 推一个 10/16 15:44

9^F：推 sbL: 推 10/17 02:09

10^F：推 adamlin120: https://twllm.com 10/23 01:49

	[问题/行为] 猫晚上进房间会不会有憋尿问题
	Re: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
	[正妹] 瑞典一张
	[心得] EMS高领长版毛衣.墨小楼MC1002
	[分享] 丹龙隔热纸GE55+33+22
	[问题] 清洗洗衣机
	[寻物] 窗台下的空间
	[闲聊] 双极の女神1 木魔爵
	[售车] 新竹 1997 march 1297cc 白色四门
	[讨论] 能从照片感受到摄影者心情吗
	[狂贺] 贺贺贺贺贺！岛村卯月！总选举NO.1
	[难过] 羡慕白皮肤的女生
	阅读文章
	[黑特]
	[问题] SBK S1安装於安全帽位置
	[分享] 旧woo100绝版开箱!!
	Re: [无言] 关於小包卫生纸
	[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
	[心得] 苍の海贼龙地狱执行者16PT
	[售车] 1999年Virage iO 1.8EXi
	[心得] 挑战33 LV10 狮子座pt solo
	[闲聊] 手把手教你不被桶之新手主购教学
	[分享] Civic Type R 量产版官方照无预警流出
	[售车] Golf 4 2.0 银色自排
	[出售] Graco提篮汽座（有底座）2000元诚可议
	[问题] 请问补牙材质掉了还能再补吗?(台中半年内
	[问题] 44th 单曲生写竟然都给重复的啊啊！
	[心得] 华南红卡/icash 核卡
	[问题] 拔牙矫正这样正常吗
	[赠送] 老莫高业初业 102年版
	[情报] 三大行动支付本季掀战火
	[宝宝] 博客来Amos水蜡笔5/1特价五折
	Re: [心得] 新鲜人一些面试分享
	[心得] 苍の海贼龙地狱麒麟25PT
	Re: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
	Re: [闲聊] OGN中场影片：失踪人口局 (英文字幕)
	[问题] 台湾大哥大4G讯号差
	[出售] [全国]全新千寻侘草LED灯, 水草

WEB批踢踢(PTT)

Soft_Job 板

Re: [讨论] 中研院繁中LLM被爆直接拿对岸的来套

热门看板

赞助商连结