作者neo5277 (I am an agent of chaos)
看板Stock
标题Re: [请益] AI到底是遇到什麽问题?
时间Sat Aug 3 04:07:53 2024
虽然这版是投资版,但是我觉得技术问题,还是先跟投资切开来比较好一点。
昨天还是前天也在八卦回了一篇,内容应该差不多。
这篇可尽可能精准一点。
首先呢,AI这个领域的底层,就是计算大家都已经知道了。
这几年分析师说烂的LLM,全名是大型语言模型,基本上最基本款是利用
机器学习演算法,一个单元一个单元组成神经网络的变形决策树。
LLM,只是他的一小部分应用,根据问题的不同,去设计不同演算法,整理不同资料
做ETL,又对於transfermer 这个特殊模型模式来去做预先训练来产出,基本上撇除掉
MOE多专家模型,还有多模态的版本,他真的就是一个很强的计算机器然後拿来做
文字接龙跟翻译,如果没有其他喂养的"知识",他回答的就有局限性,可以自己去拉
其他台湾几间的模型玩玩,而文字这块,因为透过字词嵌入转向量的技术让电脑可以计算
理解,跟去求余弦,让模型对於聚类,有更好的效果。
一样的过程,你可以,将任何连续的异质资料,根据这个路径,喂养给这後面的演算法
神经网路,经过大量的时间,大量的资料,大量的能源消耗会有一个初步结果。
你再去微调,他的确可以解决很多问题,取代很多人力,但他需要烧钱,烧时间。
接下来的东西就跟本版有关系了,我可以直接拿我八卦的文来剪贴。
"理想很丰满,现实很骨感,infra贵,订阅现金流没有多少长进。
都还在吹,还在想拉货,当董事会跟股东看不到钱,CEO能挺住做决策多久?
"LLM"目前真实应用场景薄弱,你要享受AI模型优点,需要针对你的应用情境
特制,特殊资料ETL,特殊训练,训练成效跟时间,资料量,成本成正比。
除了to B 没多少人可以享受到这种边际效应,再来换一种需求你要重新设计模型
验证,训练,SLM的模型,可以多元集群,一般人可用,只是就像丢一个低配版贾维斯
给你,不是每个人都需要,大部分最终只会变成,聪明一点的SIRI,跟生成软体。
这点现在openai就做得不错了,也不是一定要绑在阿婆手机上。
这个世界情势看下去,这些新出来的AI模型最後的发展跟落地最有办法回本的领域。
就是战争武器,很多已经开始做了,数位孪生,除了可以模拟工厂还可以用来模拟跟训练
啥,又是高收益的其实很明显。
顺跑单独一个7B模型,大概一张4070ti 12g .64g ram 13700k可以很顺了
但你要跑70b 大概要四张以上,你要跑MOE 多专家版本又要更高,你要多模态
还要再更高,toB的商务需求,短期有,长期效应没有出来的话,比较难会有单。
成本效益有多少,真的很难说,我只能说最近很多时候是RD被逼着去生更多应用出来
但是仅靠LLM,是做不了多应用的,LLM只是一个这世代AI很好的广告而已。
AI这局要延续,只能靠机器人,机器人不可能大台装一堆显卡,散热又不好,能源也
不够。这边唯一方法就是走边际运算,所以通讯跟边际运算,还有制造机器人的能力
,再来就是仿生,生物界是最好学习的对象,如此高效低耗能,你写code跟ai互动做的
很多事情在台湾,请工读生或是美编,或是贵一点的美编跟外包就完成了。
现实就是这样,如果,再没有新东西出来,美国选举效应完大家就一起面对真实世界。"
注意,上面说的应用场景薄弱,是LLM的部分,因应其他需求去设计开发的模型都不
在此列,上面几篇回文,也有几位点到问题,这资本开支,还有获益周期,目前不成
正比,也没有办法雨露均沾,你看到皮衣刀客马上推数位孪生,机器人就知道了。
以目前来说,最有可能的,不那麽暴力的领域,就是文内提到的
边际运算,以後可能是小模型取代各种,本来的韧体演算法,烧上去
这边第一个遇见就是,记忆体容量问题,还有算力问题,模型领域针对这种问题
有几种解法,知识蒸馏,模型合并,还有量化(将本来大量浮点数计算转成整数计算)
会有能力耗损但是,对算力可以不太要求,这样用晶片来集群的整个丛集装置。
体积尚可,会出现专门NPU来做矩阵计算,散热也比较好处理,能源消耗更低。
也跟上文提到的一样,在这种client server 体制,或是边际运算体制。
通讯,就是一件很重要的事情,我对AI是很看好,但是在商言商,没人想做赔钱生意。
也没有几间,特别是股东制的公司会一直对看不到现金流的投资say yes 。
八卦底下有一个推文我觉得满有sense 的我也是抱持这个想法。
AI 包含软体的模型,其实就跟当年的网路一样,他是一个infrastructure
基本上是长期投资,适合大厂跟国家去布建的东西, .com 到我们离不开网路
过了8~10年左右,他的价值才真正凸显出来,後续的效应跟市场才起来。
现在不过是又重现一次而已,但是人生有几个8~10年呢?,这三四年的热钱
就是跟各种泡沫一样摧枯拉朽,AI有问题吗? 看你从哪个角度来看
其实,模型要训练到可商业运用,难在配合解决的问题去反覆设计跟训练微调,还有
做训练资料整理,这真的要大量的时间跟金钱,还有脑力。但偏偏这是现实世界上最缺
的,然後真正有意义的模型,中小型参数,就玩具,做成丛集,要靠财力。
70b 开始一般人基本玩不起,llama405b 这种几千万的机器是基本,然後训练想要
达成的应用,除非是研究型,不然真得就是不如请人类做来的省钱。
我想版上应该也有很多理工生科研究型的,以前应该都会有要种仪器只有几台
实验室只有两间,你要做你的研究,就是排队吧,等申请。
目前可花钱投入的大厂,跟研究型的尚且如此,一般商业除非有经验证,可行的利基模式
不然我想没几个会花钱真正洗下去做。
你说云端御三家没有开放给企业订制吗? 有阿 N家自己也下来做啊 卖不好啊
你没有确定方向,跟做法还有利基之前,这个研发成本可是用烧的,一旦弄下去
花钱反正可以列成研发经费,资本开支,但是最後有没有东西端出来才是问题。
你说要做自然语言,管理後台,查询,什麽的,这个现在都做得出来。
我自己工作也在做这种,应用开发。 但是我们自己觉得满鸡肋的。
你要做aml 也很可以啊,但是很抱歉,用llm为主的模型效果一定不会太好
要从根开始重新挖开设计,跟定义资料集下去重新训练,有新样态,在继续累积然後
微调,微调也是一个坑,你资料量不够大,就像一颗石头,丢进太平洋。没啥用
但也不要这麽灰心,各位在AI上花的$都位我们後代子孙建立起更好的社会。
大概就是这样,总结一下,前期资本投资太多,短期看不到成效,消费市场不确定。
本来应该是基建的被炒成很高,真的跟思科很像,不能说一模一样,但是真的很像。
但你要说他不好吗? 现在哪间公司机房没有思科?
--
WHY SO SERIOUS???
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.243.100.32 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1722629277.A.6EA.html
※ 编辑: neo5277 (111.243.100.32 台湾), 08/03/2024 04:13:12
1F:推 cuteSquirrel: push 08/03 04:11
2F:推 abc12812 : 唬烂机器人 除了诈骗以外就没啥实际公用08/03 04:11
※ 编辑: neo5277 (111.243.100.32 台湾), 08/03/2024 04:16:02
3F:→ adidas52088 : 还敢提13700k08/03 04:17
4F:→ adidas52088 : 所以特斯拉拿来训练FSD跟人形机器人的想法不是很好08/03 04:18
5F:→ adidas52088 : 吗 08/03 04:18
没有不好啊,看台湾有没有办法吃到後续产业链生意阿
※ 编辑: neo5277 (1.162.163.74 台湾), 08/03/2024 04:20:37
6F:→ Arodz : AI没什麽问题 有问题的是投资人☺ 08/03 04:39
7F:推 st9061204 : 我有个问题,既然进入AI开发的门槛很高08/03 04:54
8F:→ st9061204 : 实际上能玩得起的大公司在竞争上的紧迫性没有很高吧 08/03 04:55
研发是个变数,因为你不知道他会不会单点突破,openai跟google就是好例子,逼得人家
觉得成本效益不符人家就会放弃,除非你是google,烧不完,对内要说服元老院跟股东继
续投资支持股价都要有东西出来,CEO很重要
啊,他是属於管理型,还是进取型,还有是不是公司吉祥物,这些都是参数,当然也有玩
脱的,贾伯斯就是。
9F:推 noddle : 推分享08/03 04:55
10F:推 David312 : 抱歉我有点疑问,想问电动车自动驾驶的部分是否有可08/03 04:56
11F:→ David312 : 能因为ai而加速成真,自动驾驶L5是我比较看好未来08/03 04:56
12F:→ David312 : 都市的一部分08/03 04:56
这个有点大哉问,对自动驾驶有没有帮助
一定有,但是台湾会不会有?
可能只有重划区吧,要普及应该是因地而异
※ 编辑: neo5277 (1.162.163.74 台湾), 08/03/2024 05:08:40
※ 编辑: neo5277 (1.162.163.74 台湾), 08/03/2024 05:10:17
13F:推 apl02 : 感谢分享 08/03 05:10
14F:推 David312 : 这...我的疑问确实有点让人不知所以然,那我问比较 08/03 05:20
15F:→ David312 : 细一点好了,以前有听说过特斯拉要拼自动驾驶L5, 08/03 05:20
16F:→ David312 : 但是卡在感应周边环境能力以及运算可能发生的危险08/03 05:21
17F:→ David312 : 等等因素所以很难突破,而现在的ai则是在算力跟模08/03 05:21
18F:→ David312 : 型还是啥能力部分进步很多(抱歉这块我真的不太懂) 08/03 05:21
19F:→ David312 : ,如果以目前的ai能力找一个城市专门训练电动车自 08/03 05:21
20F:→ David312 : 动驾驶,结合城市内多个摄影机等等提供环境变数参 08/03 05:21
21F:→ David312 : 考来训练并完成全城内的自动驾驶L5,不要一开始就挑 08/03 05:21
22F:→ David312 : 战完美L5而是只要某个城市内能自动驾驶L5这样,以上 08/03 05:21
23F:→ David312 : 想法我觉得有可能,但是也许只有对岸敢作,刚开始08/03 05:21
24F:→ David312 : 应该很多事故,只有对岸能直接压下吧... 08/03 05:21
训练侦测是一件事,反应速度整合是一件事情,大陆那个也是有人在监督的
自己体验是现在特斯拉的车,侦测已经是会把周遭的东西很形象的辨识进去,但是操作就
不知道台湾也没办法试,之前加州实验似乎小意外被叫停下了。
※ 编辑: neo5277 (1.162.163.74 台湾), 08/03/2024 05:25:04
25F:推 David312 : 然後城市内自动驾驶成功後,我认为最可能发展出来 08/03 05:25
26F:→ David312 : 的会是自动送货,甚至搭配自动化大楼或机器人帮忙煮08/03 05:25
27F:→ David312 : 熟等等,上网点个餐或买个东西,30分钟後就到手里这08/03 05:25
28F:→ David312 : 样,超适合不出门的阿宅不是吗08/03 05:25
这中国有类似的,还不完美
※ 编辑: neo5277 (1.162.163.74 台湾), 08/03/2024 05:26:20
29F:推 David312 : 原来对岸有在搞了喔...看来我知道的东西太少了 08/03 05:28
30F:→ mom213 : 5年前硕论做自驾视觉相关 L5目前演算法达不到 中国 08/03 05:29
31F:→ mom213 : 那套远端工人智慧还比较实际 08/03 05:29
32F:→ afflic : 你看得太短浅了…… 08/03 05:31
33F:→ afflic : 就像你说的,现在就是基础建设的军备竞赛 08/03 05:31
34F:→ afflic : 你烧钱烧不过人家,以後就是被人家占领山头 08/03 05:31
一人公司或是家天下可以,在国外就看CEO
罗
※ 编辑: neo5277 (1.162.163.74 台湾), 08/03/2024 05:34:56
35F:→ afflic : 这麽多公司总有一家可以,然後他就独占了 08/03 05:36
36F:推 newbrain : 真的就是初期的思科独占网路基建模式重走 08/03 05:43
37F:推 MangoKai : Push 08/03 05:49
38F:推 bluesix4722 : 推 08/03 05:50
39F:推 ohyaehchu : 大家都在赌啊 你不赌市场就没你的份额,想追上很难 08/03 05:59
40F:→ ohyaehchu : 了 08/03 05:59
41F:→ WenliYang : 总之不赚钱 跟一般人也没啥关系 尽吹 08/03 06:34
42F:→ WenliYang : 自以为是山头 实际上难说 08/03 06:35
43F:推 A80211ab : 一定会获利, 大数据整合与学习需要时间的 08/03 06:41
44F:推 dodobaho : 这篇可以 08/03 06:51
45F:嘘 pig789 : 自从陈龙看好台积电之後 AI就崩了 08/03 06:52
46F:推 zzahoward : 你的演绎很清楚耶 08/03 07:01
47F:→ zzahoward : 所以为什麽大家这麽怕中国搞AI 因为自由资本主义市 08/03 07:02
48F:→ zzahoward : 场经不起无底洞的现金流 但中国可以饿肚子下去玩 08/03 07:02
49F:推 huchain : 普及应用方法有限无法突破 08/03 07:05
50F:→ WenliYang : 人型机器人……科幻片看看可以 实际上太难了 还早 08/03 07:06
51F:→ WenliYang : 得很 08/03 07:06
52F:推 afflic : 很难吗 以前也无法想像会自己回答问题的电脑吧 08/03 07:10
53F:→ afflic : 科幻片的情节正在一一被实现 08/03 07:11
54F:推 eejovi : 建议可先考虑在高速公路上发展自动驾驶,场景较为 08/03 07:11
55F:→ eejovi : 单纯,相较城市。甚至若能透过自驾改善驾驶行为, 08/03 07:11
56F:→ eejovi : 也许能有效提升高速公路的运输状况。 08/03 07:11
57F:→ afflic : 不知道什麽时候轮到时光机 08/03 07:11
58F:推 modhairs : 推一个 08/03 07:17
59F:→ guteres : 同意长期投资 08/03 07:27
60F:推 Samurai : 现在大家等的就是电影钢铁人中的贾维斯管家那种AI 08/03 07:34
61F:→ Samurai : ,要看openAI chatgpt5有没有大突破 08/03 07:34
62F:→ Samurai : LLM在chatgpt出来後已经往前跨了一大步 08/03 07:36
63F:推 drajan : Knowledge distillation, mixture of experts, edge 08/03 07:47
64F:→ drajan : computing, quantization. 大哥你这些东西写成中文 08/03 07:47
65F:→ drajan : 看得懂的没几个吧 写英文还比较有可比性 08/03 07:47
66F:推 Cactusman : 还在算capex就没意义了、问题是你不烧钱做未来连入 08/03 08:40
67F:→ Cactusman : 场机会都没 08/03 08:40
68F:推 poeoe : 这篇是股版里讲得很不错的了 好文 08/03 08:40
69F:推 a942195 : 高速公路EAP早就接近自动驾驶了 要lag多久 08/03 09:03
70F:推 junior020486: 中国搞这个没用吧,被晶片禁令ban了 08/03 09:04
71F:→ democrat : 台湾纯软业烂的跟屎一样 自己判断AI有没有未来有失 08/03 09:34
72F:→ democrat : 偏颇噢 08/03 09:34
73F:推 clairehao : 推 08/03 10:13
74F:推 rivual : 推这篇 08/03 10:28
75F:推 qrose666 : 推! 08/03 10:37
76F:推 mdkn35 : 我猜这版有多数人认为AI=LLM=自驾=各种神奇应用 08/03 10:48
77F:→ newwu : Quantization 真的翻量化吗 这样翻蛮怪的 08/03 11:00
78F:推 tmot : 推 08/03 11:01
79F:推 skylite789 : 推一个专业!这才是懂AI的人讲出来的 08/03 11:14
80F:推 huabandd : 所以我才会看好高速网路跟云端运算,苹果做的事就 08/03 11:23
81F:→ huabandd : 是这样,自己不投资硬体用别人的云端来训练模型, 08/03 11:23
82F:→ huabandd : 硬体淘汰的很快,你不换新的有别人换新的,用别人 08/03 11:23
83F:→ huabandd : 提供的云端运算完透过高速网路回传到自己的系统, 08/03 11:23
84F:→ huabandd : 未来甚至是传到个人装置上,才是省钱省装置算力的 08/03 11:23
85F:→ huabandd : 办法,不然硬体的极限就在那边,再怎麽想突破都很 08/03 11:23
86F:→ huabandd : 困难,手机怎麽算都算不赢云端,还不如直接收资料 08/03 11:23
87F:推 ProTrader : LLM当然有用 只是目前成本还是太高 08/03 11:38
88F:→ ProTrader : 在教主那篇我就说了未来要拼的是AI的演算法 08/03 11:38
89F:→ ProTrader : 用简单有效的模型在便宜机台上算出有用结果 08/03 11:39
90F:→ ProTrader : 也就是AI工程师要对各种专业知识有高度了解 08/03 11:40
91F:→ ProTrader : 才可能在AI演算法突破 这是人类工程师的价值 08/03 11:41
92F:→ ProTrader : 当然短期内抢铲子的风潮会持续 08/03 11:42
93F:→ ProTrader : 主因是现阶段那些模型都是类神经网路 08/03 11:43
94F:→ ProTrader : 类神经网路要降到够便宜 至少要小模型甚至迷你模型 08/03 11:44
95F:推 strlen : 还在担心钱的事喔?我就问Uber烧了多久才损益平衡 08/03 12:51
96F:→ strlen : ?YouTube呢?还有那个图奇烧九年还是亏 电动车烧 08/03 12:51
97F:→ strlen : 几年?低轨卫星呢?就连智慧手机题材也是搞了3 5年 08/03 12:51
98F:→ strlen : 才大爆发 厂商有收手吗?只有看到後悔没早点进场最 08/03 12:51
99F:→ strlen : 後被洗出去的 怎麽会去担心钱的问题?啊不然巨头赚 08/03 12:51
100F:→ strlen : 那麽多 你讲一个比ai更有前途的投资嘛 08/03 12:51
想要左侧的话,我都觉得很好啊
每个人接受的价位不同以我目前来说,这里做左侧,我觉得太高了。
※ 编辑: neo5277 (1.162.163.74 台湾), 08/03/2024 13:02:52
101F:推 DarkerDuck : 优质分享推 08/03 15:33