作者Lushen (pttlushen)
看板Stock
标题[新闻] Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预
时间Fri Jan 24 19:13:02 2025
原文标题:
Meta陷入恐慌?内部爆料:在疯狂分析复制DeepSeek,高预算难以解释
原文连结:
https://www.jiqizhixin.com/articles/2025-01-24-2
发布时间:2025/01/24
记者署名:机器之心
原文内容:
「工程师正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。」
DeepSeek 开源大模型的阳谋,切切实实震撼着美国 AI 公司。
最先陷入恐慌的,似乎是同样推崇开源的 Meta。
最近,有 Meta 员工在美国匿名职场社群 teamblind 上面发布了一个贴文。贴文提到,国内 AI 新创公司 DeepSeek 最近的一系列动作让 Meta 的生成式 AI 团队陷入了恐慌,因为在前者的低成本高歌猛进下,後者无法解释自己的超高预算的合理性。
原文如下:
这一切始於 DeepSeek-V3,它在基准测试中就已经让 Llama 4 落後。更糟的是那个「拥有 550 万训练预算的不知名中国公司」。
工程师们正在疯狂地分析 DeepSeek,试图从中复制任何可能的东西。这一点都不夸张。
管理阶层担心如何证明庞大的生成式 AI 组织的成本是合理的。当生成式 AI 组织中的每个「领导」的薪资都比训练整个 DeepSeek-V3 的成本还要高,而我们有好几十个这样的「领导」时,他们要如何面对高层?
DeepSeek-R1 让情况变得更加可怕。虽然我不能透露机密信息,但这些很快就会公开。
这本来应该是一个以工程为重点的小型组织,但是因为很多人想要参与进来分一杯羹,人为地膨胀了组织的招聘规模,结果每个人都成了输家。
https://i.imgur.com/hKZ6h5W.png
贴文中提到的 DeepSeek-V3 和 DeepSeek-R1 分别发布於 2024 年 12 月 26 日和 2025 年 1 月 20 日。
其中,DeepSeek-V3 在发布时提到,该模型在多项评测成绩超越了Qwen2.5-72B 和Llama-3.1-405B 等其他开源模型,并在性能和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet 不分伯仲。
不过,更引人注目的是,这个参数量高达 671B 的大型语言模型训练成本仅 558 万美元。具体来说,它的预训练过程竟然只用了 266.4 万 H800 GPU Hours,再加上上下文扩展与後训练的训练,总共也只有 278.8 H800 GPU Hours。相比之下,Meta 的 Llama 3 系列模型的计算预算则多达 3930 万 H100 GPU Hours—— 如此计算量足可训练 DeepSeek-V3 至少 15 次。
https://i.imgur.com/mJn5POl.png
而最近发布的 DeepSeek-R1 效能更猛 —— 在数学、程式码、自然语言推理等任务上,它的效能比肩 OpenAI o1 正式版。而且模型在发布的同时,权重同步开源。很多人惊呼,原来 DeepSeek 才是真正的 OpenAI。 UC Berkeley 教授 Alex Dimakis 则认为, DeepSeek 现在已经处於领先位置,美国公司可能需要迎头赶上了。
https://i.imgur.com/NLhp4Nj.png
看到这里,我们不难理解为何 Meta 的团队会陷入恐慌。如果今年推出的 Llama 4 没有点硬本事,他们「开源之光」的地位岌岌可危。
有人指出,其实该慌的不只 Meta,OpenAI、Google、Anthropic 又何尝没有受到挑战。 「这是一件好事,我们可以即时看到公开竞争对创新的影响。」
https://i.imgur.com/gQ5fHDH.png
还有人担心起了英伟达的股价,表示「如果 DeeSeek 的创新是真的,那麽 AI 公司是否真的需要那麽多显示卡?」
https://i.imgur.com/HIFcTx6.png
不过,也有人质疑,DeepSeek 究竟是靠创新还是靠蒸馏 OpenAI 的模型取胜?有人回覆说,这可以从他们的发布的技术报告中找到答案。
https://i.imgur.com/HIFcTx6.png
目前,我们还无法确定贴文的真实性。
不知道 Meta 後续会如何回应,即将到来的 Llama 4 又会达到怎样的表现。
心得/评论:
Meta工程师在TeamBlind(一个匿名的职涯讨论区,需要经过公司Email验证)爆料中国的DeepSeek对内部影响很大
DeepSeek R1训练成本550万美元 可能比一个Meta大头的年薪还便宜
DeepSeek 这件事情也不光是中国自己在吹嘘
看了一下 Twitter/Reddit 美国AI工业界、学术界反响非常大
DeekSeek 的母公司幻方量化产出 DeepSeek 的故事也在 Twitter 广受讨论
https://i.imgur.com/NLhp4Nj.png
DeepSeek R1 开源+论文公开应该会推进一波AI界的发展
DeepSeek 後续发展值得关注一下
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 36.229.55.152 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1737717185.A.FD4.html
1F:推 pmes9866 : 中又赢 01/24 19:14
DeepSeek 训练成本低+跑起来的成本极低(硬体需求)
自己实际使用体感不觉得他赢 OpenAI
不过以成本场景来说真的是巨大的创新
美国知名的 AI 分析机构 Artificial Analysis
对 DeepSeek 的成本分析
https://i.imgur.com/0GRkj6Q.png
2F:→ agassi001 : 股价该跌了吧 01/24 19:15
3F:推 wts4832 : too good to be true 01/24 19:15
4F:→ moom50302 : 赢了赢了都赢了 01/24 19:15
5F:推 Plumpy : 赢麻了 01/24 19:16
6F:嘘 s1612316 : 花大钱还输别人 是设备的问题还是人的问题 01/24 19:16
7F:推 kenbbc12321 : ai本来就可以减少运算,达到一样的效果 01/24 19:18
8F:推 lpmybig : 真实性先打问号 01/24 19:18
DeepSeek R1 程式码、论文都开源+公开了
https://github.com/deepseek-ai/DeepSeek-R1
https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
9F:→ appledick : 美国484真的满废的 01/24 19:18
10F:→ appledick : 难怪只能靠制裁来赢人了 01/24 19:19
11F:推 lc85301 : 美国的时代早就过去了 01/24 19:19
12F:推 zhi5566 : 输了就在砍人啊 01/24 19:19
13F:推 kuosos520 : deepseek有开源,也有offline,鬼故事来了 01/24 19:20
14F:推 aegis43210 : 因为西台湾为了管制,一堆问题不能回答,自然也不算 01/24 19:20
15F:→ aegis43210 : 错误 01/24 19:20
※ 编辑: Lushen (36.229.55.152 台湾), 01/24/2025 19:25:15
16F:推 KrisNYC : DS就开源的 输了就算了 裁部门 丢模型 01/24 19:22
17F:→ furbyyeh : 硬体需求果然是吹的 01/24 19:22
18F:→ KrisNYC : 拿DS去从头开始而已 01/24 19:22
19F:推 stlinman : 降本增效 遥遥领先 中国人可以赢两次 01/24 19:22
20F:推 rrazer : 中又赢 ,遥遥领先 01/24 19:22
21F:推 momochacha : 没空 阿祖现在忙着舔川普 01/24 19:22
22F:→ KrisNYC : 你就当作花钱盖了个蚊子馆又拆掉 GDP增加了 就这样 01/24 19:22
23F:→ KrisNYC : 写一大篇不知道想干嘛 01/24 19:22
24F:推 Lowpapa : 美国早就输惨了 01/24 19:23
25F:推 godog : 看到某族群崩溃狂酸的样子 就觉的好笑 哈哈哈 01/24 19:23
26F:推 aegis43210 : 只要庆丰帝仍在位,美国就不会输 01/24 19:24
27F:推 iamsosmart : 中国赢了,台积电吓哭了,辉达没有用了,美国七大 01/24 19:24
28F:→ iamsosmart : 科技股都泪奔了 01/24 19:24
29F:推 huabandd : 整理重点好吗 01/24 19:25
网景公司创始人(美国公司;世界第一个广泛使用的浏览器)
Facebbok、eBay、HP 董事会成员
风投
Marc Andreessen
帮你整理了重点
https://i.imgur.com/SmUbN8M.png
Deepseek R1 is one of the most amazing and impressive breakthroughs I’ve ever seen — and as open source, a profound gift to the world.
DeepSeek 翻译:
https://i.imgur.com/5zX1uf2.png
30F:推 ImHoluCan : 亚洲专门搞诈骗的 01/24 19:26
31F:推 poeoe : 中国本来在软体就算强的 还能加班加到爆 01/24 19:26
32F:推 strlen : 不就魔改技术很猛?不然当年GPT3怎麽不是中国开发 01/24 19:27
33F:推 winsonpz : 看智障耸动标题就知道是中吹假新闻 01/24 19:27
34F:推 zpeople0116 : 欧美日常,干输人翻桌 01/24 19:28
35F:→ winsonpz : 然後又一堆壮世代在那瞎讲胡吹 01/24 19:29
36F:推 ImHoluCan : 美国人很天真,很容易被诈骗,看看小米保时捷,那 01/24 19:29
37F:→ ImHoluCan : 真的是保时捷吗 01/24 19:29
38F:推 spa41260 : 算力过剩,丸子 01/24 19:29
39F:嘘 pagenotfound: 上次在那边吹中国突破5奈米的公司 已经屍骨无存了 01/24 19:29
40F:推 matlab1106 : 又要像电车一样输了就翻桌吗? 01/24 19:29
41F:嘘 ck326 : 中吹日常,吹了半天强国还在通缩 01/24 19:30
42F:→ ImHoluCan : 对岸要是真的,早就大吹特吹 01/24 19:30
43F:→ asjh612 : 没有外媒新闻? 怎麽只有中国跟twitter来源 01/24 19:30
44F:→ mic73528 : 遥遥领先 双赢就是中国赢两次 01/24 19:31
45F:推 Blastodern : 弯道超车吹了三十年还在超,这个弯道到底有多长啦 01/24 19:31
46F:→ Blastodern : ,笑烂 01/24 19:31
48F:→ ImHoluCan : 小米苏7=美国老逻辑=保时捷怕拉没拉,但真的摆上台 01/24 19:32
49F:→ ImHoluCan : 面真的是保时捷吗 01/24 19:32
50F:推 Dix123 : 已经都开源了 怎麽还有人反智阿... 01/24 19:33
51F:推 jacktypetlan: 完蛋 算力过剩 overbooking 台G NV拦腰斩都不够 01/24 19:33
52F:→ jacktypetlan: NV至少1/4膝盖斩 欧印放空 台股一万二见 01/24 19:33
53F:推 kotorichan : 美国再挖角或制裁 就好 01/24 19:34
54F:推 bella1815 : 看到某族群自嗨的样子就觉得好笑 01/24 19:34
55F:推 INIKS : 美国创意,中国实作,中美如果真正合作,早就登陆火 01/24 19:34
56F:→ INIKS : 星了,可惜国家这个没用的概念依然存在,地球村遥遥 01/24 19:34
57F:→ INIKS : 无期 01/24 19:34
※ 编辑: Lushen (36.229.55.152 台湾), 01/24/2025 19:39:47
58F:→ ImHoluCan : 当初嘴台积电,也大力挖台积电的大将,对啊晶圆厂 01/24 19:34
59F:→ ImHoluCan : 可以生产啊,但真的能ㄧ直突破? 01/24 19:34
60F:推 ck326 : 开源又怎样?笑死 01/24 19:35
61F:推 poeoe : 开源就是全世界的人都能直接验证 这也不是中国自己 01/24 19:35
62F:→ poeoe : 在吹啦 01/24 19:35
63F:推 z23061542 : OK收到 以放空美台股 大力ALL IN鹿谷 01/24 19:35
64F:→ asjh612 : 开源又怎样 原po也没觉得他赢openai啊 01/24 19:35
65F:→ ImHoluCan : 诈骗集团,当然不能犯低接错误,你能看到的当然要 01/24 19:36
66F:→ ImHoluCan : 给你看你想看的 01/24 19:36
67F:推 kotorichan : 没三小路用 中国直接武统是最有用的 01/24 19:36
68F:→ asjh612 : 自爽又赢 跟 开源 哪门子关系? 01/24 19:37
69F:→ ImHoluCan : 笑死中国要是真的能搞出来,当初中芯肯定能搞出来 01/24 19:37
70F:→ asjh612 : 每个llm都在吹自己很强 实际体验就是那死样子 01/24 19:37
71F:→ a12838910 : 中国软体很强啊 抖音 小红书 台湾? 01/24 19:38
72F:推 andy810306 : 台湾给那狗屎薪资想要找谁写软体?笑死 01/24 19:38
73F:→ aloness : 这本来就是 在等待程式架构进化,缩减算力 01/24 19:39
74F:推 jasonfun44 : 老早都去AWSGCP租就好,做LLM跟本不会赚钱 01/24 19:39
75F:→ aloness : 旧的程式架构自然需要突破天际的算力 01/24 19:39
76F:推 ImHoluCan : 对岸是小米苏7保时捷,然後吹说你开保时捷吗? 01/24 19:39
77F:推 ck326 : 台湾软体很烂啊,应该说台湾没有软体,所以呢? 01/24 19:40
78F:推 Dix123 : 简单来说 AI的这个崭新的领域配上开源 本来就很容易 01/24 19:40
79F:→ Dix123 : 做出超强的突破了 不一定是中国 美国随时也会赶上 01/24 19:40
80F:→ jasonfun44 : 马斯克也是吹 01/24 19:40
81F:推 poeoe : 这其实也是好事 如果能让需要的算力降低 那能省很多 01/24 19:40
82F:→ poeoe : 电 01/24 19:40
83F:→ Dix123 : 你遥想个人电脑和网路刚开始的时候 骇客横行的时候 01/24 19:40
84F:推 bj45566 : 股板无脑中黑:不管啦,中国只会抄袭而已而已啦,一 01/24 19:40
85F:→ bj45566 : 定是偷美国的!原始码都公开在网上了?不可能!看得 01/24 19:40
86F:→ bj45566 : 到的人一定是眼睛孽障太重,我什麽都看不到!(嘶喊) 01/24 19:40
87F:→ aloness : 中国软体工程师战力本来就不差 01/24 19:40
88F:→ Dix123 : 当你还在用数据机玩天堂的时候 可能想过几年後马上 01/24 19:41
※ 编辑: Lushen (36.229.55.152 台湾), 01/24/2025 19:45:10
89F:→ ImHoluCan : 对岸很多都是抄美国,卡卡西董吗? 小米苏7吹成保 01/24 19:41
90F:→ ImHoluCan : 时捷 01/24 19:41
91F:→ Dix123 : 变月租吃到饱? 01/24 19:41
92F:推 ixiuxiudan : 别急 01/24 19:41
93F:→ asjh612 : 怎会热血亲中的人在高潮啊 01/24 19:42
94F:→ ImHoluCan : 对岸只会卡卡西,但真的有那个创意与技术? 接下来 01/24 19:42
95F:→ ImHoluCan : 真的能持续? 01/24 19:42
96F:推 s90002442 : 完蛋 今天股价砍烂 01/24 19:42
97F:→ kevinmeng2 : 拿meta这垃圾比较就好像拿intel跟台积电比 01/24 19:42
98F:→ peter98 : META再裁个15%工程师吧 01/24 19:44
99F:推 jinx5566 : 突破AI临界点了? 01/24 19:44
100F:嘘 raymonde : ai 是不是关门放狗 01/24 19:45
101F:→ aaa95308 : 楼上把软体跟半导体制造放在一起比较的...好喔 01/24 19:48
102F:推 bj45566 : 说 Meta 是废物的好像完全不知道 Meta 在 AI 开源码 01/24 19:48
103F:→ bj45566 : 界是抗霸子 wwww 而且 DS 赢的也不只是 Meta Llama 01/24 19:48
104F:推 t0314796 : 报告 所以会影响到什麽?想抄答案! 01/24 19:48
105F:推 jiansu : 这个成果是中国其他公司都震惊吧 开源很好 科技不 01/24 19:49
106F:→ jiansu : 应该分国界 竞争也不分你我 生死看淡 不服就干 01/24 19:49
107F:嘘 ken123321987: 美国狗下棋输人就翻桌 等中国强起来一定算帐 01/24 19:49
108F:推 BIGETC : 一个专案五千万能弄 五百万常常也可以 科科 01/24 19:50
109F:→ asjh612 : 不过仔细想想 这篇股点是什麽? meta利空? 01/24 19:50
110F:→ BIGETC : 不过五千万弄大家都会很舒服 何必真的编五百 01/24 19:50
111F:推 djbell : 继续裁员 01/24 19:51
112F:推 boy1031 : 钢铁家电手机电车都能卷翻,美欧日,凭什麽AI不能 01/24 19:51
113F:→ boy1031 : 卷,至少也要分走3成市场 01/24 19:51
114F:推 amethystboy : 便宜治百病 01/24 19:54
115F:→ asjh612 : 还是这篇是台积nv利空 大家不需要那麽多运算资源? 01/24 19:55
116F:推 super0949 : Meta股价毫无反应 01/24 19:55
117F:→ keyneslan : 这样如何对股东与投资机构交代 01/24 19:55
118F:→ CYL009 : 用低阶显卡AI性能就能和用高阶的比了 反正美国钱很 01/24 19:55
119F:→ CYL009 : 多 嘻嘻 01/24 19:55
120F:→ pieceioriX : 为何高低成本的方案不能共存? 01/24 19:56
121F:推 oldEn15 : 产能过剩要来了 啾咪 01/24 19:56
122F:推 s1612316 : 五千亿镁 有多少会进口袋 01/24 19:56
123F:推 bj45566 : DeepSeek 最大的影响就是证明中国能用不到 1/10 的 01/24 19:56
124F:→ bj45566 : 预算和更少、更便宜低阶的 AI 晶片达成甚至超越美 01/24 19:56
125F:→ bj45566 : 国顶尖 AI 公司(s)狂开资源做出的大语言模型效能 01/24 19:56
126F:推 ggbi4zzz : 中国黑开始胡言乱语 01/24 19:56
127F:→ CYL009 : 现在深度探索全部开源给你 谁还要用高价装备操作AI 01/24 19:57
128F:→ CYL009 : 嘻嘻 01/24 19:57
129F:→ CYL009 : 最近这几天美国科技业真的疯了 一直再找出为什麽可 01/24 19:58
130F:→ CYL009 : 以这麽便宜成本弄出来ww 01/24 19:58
131F:推 eriker : 我怎麽看起来再说deepseek造假 01/24 19:58
132F:推 uller : 中国黑科技 猛了 01/24 19:58
133F:→ eriker : meta试着用h100训练了15个开源的deepseek结果数据都 01/24 19:59
134F:→ eriker : 不如paper宣称的 01/24 19:59
135F:→ shorty5566 : 既然都开源了接下来就看能不能照刻出来啊 现在吹这 01/24 20:01
136F:→ shorty5566 : 麽早都不怕跟之前超导体一样翻车吗? 01/24 20:01
137F:→ eriker : 这根本就是没办法reproduce吧 meta工程师拿你程式码 01/24 20:01
138F:→ eriker : 训练这麽多次都拿不到你的结果 01/24 20:01
139F:嘘 qazwsx0128 : 笑死,就算成本降低需求只会更多,直到人手一个客 01/24 20:01
140F:→ qazwsx0128 : 制ai 01/24 20:01
141F:推 dongdong0405: 哈哈哈中国进来卷 01/24 20:02
142F:→ eriker : 那正常人用更烂的gpu或是deepseek宣称的h800不是也 01/24 20:03
143F:→ eriker : 不办法训练出来吗 01/24 20:03
144F:推 bj45566 : 拿 AI 比高阶晶圆制造的真的笑死!中国在 AI 领域一 01/24 20:03
145F:→ bj45566 : 直都能和美国争霸,中国在 AI 顶尖会议的论文发表和 01/24 20:03
146F:推 ck326 : 看起来是 nvda ,tsm 股价准备崩溃,什麽你说市场没 01/24 20:03
147F:→ ck326 : 反应?怎麽会? 01/24 20:03
148F:→ bj45566 : 美国一直都是互有领先(之前中国 AI 强在 CV, PR, 01/24 20:03
149F:→ bj45566 : 美国强在 LLM, NLP -- 但现在看起来美国的强项不太 01/24 20:03
150F:→ bj45566 : 妙) 01/24 20:03
151F:→ eriker : 中国不意外 只能骗骗外行人 01/24 20:03
152F:推 kingofsdtw : 果然演算法是最重要的 01/24 20:04
153F:推 shorty5566 : 而且看不懂为啥对nv是利空 如果是真的那那些csp用 01/24 20:04
154F:→ shorty5566 : 现在已有的算力不是更猛 需求只会更多吧 发展越快 01/24 20:04
155F:→ shorty5566 : 越好 01/24 20:04
156F:→ eriker : 之前就懒得认真看deepseek 结果一看根本在骗白痴 01/24 20:05
157F:→ appledick : 这让我想到智慧型手机android平台 一开始的硬体不 01/24 20:06
158F:→ appledick : 够强 真的是要靠各家用软体调效来拼顺畅度 01/24 20:06
159F:嘘 squeakywheel: 就是美国抄袭中国啦 某族群最爱嘴的 01/24 20:06
160F:→ appledick : 後来硬体强到靠北 软体就不用调效了 硬体随便淦都爆 01/24 20:06
161F:→ appledick : 淦顺 01/24 20:06
162F:推 bj45566 : 无脑中黑已经进入催眠自己的最高境界了 wwww wwww 01/24 20:06
163F:推 eriker : 中国人应该没想到这次翻船 meta真的拿他的h100检查d 01/24 20:08
164F:→ eriker : eepseek造假 01/24 20:08
165F:推 ilGroundhog : 搜寻一了一下DS在写作编码不如GPT但是推理媲美 01/24 20:08
166F:→ asjh612 : 超越美国制造的llm言之过早吧 每个新的出来都说赢 01/24 20:09
167F:推 bj45566 : 最近 AI 界最大的丑闻反而是 OpenAI o3 涉嫌在数学 01/24 20:09
168F:→ bj45566 : 能力测验上作弊喔,嘻嘻 01/24 20:09
169F:→ ilGroundhog : 重点是训练便宜如果大规模训练确实可能会颠覆AI市场 01/24 20:09
170F:→ eriker : 通常中国人ai论文喜欢造假说超越sota 但毕竟没人会 01/24 20:10
171F:→ eriker : 这样会浪费一堆算力证明造假 01/24 20:10
172F:→ ilGroundhog : 如果可以便宜泛用的话对NV就不是好消息 01/24 20:10
173F:→ asjh612 : 然後讲中国ai paper 之前就听过中国的有些是吹的 01/24 20:10
174F:推 joygo : 正在用 只能说 好用 01/24 20:11
175F:推 koll : 那麽厉害何必害怕晶片制裁狂拉货?用烂晶片就好 01/24 20:11
176F:→ asjh612 : 讲别人无脑黑中 自己才无脑亲中 笑死 01/24 20:11
177F:推 mcgrady12336: 未来AI就中美有量能切入啊 01/24 20:11
178F:→ eriker : 但这次被meta抓到deepseek造假 好惨 01/24 20:12
179F:→ joygo : 最近刚好在玩google 的和这只 互相 01/24 20:12
180F:推 andy810306 : 某楼是不是在酸所有IC设计啊,应该用7奈米就好啊, 01/24 20:12
181F:→ andy810306 : 一直想推先进制程干嘛XDDD 01/24 20:12
182F:→ JoeyChen : 归结是成本的问题对吧? 01/24 20:13
183F:→ andy810306 : 是不是废到只能靠制程来掩盖废物设计能力啊 01/24 20:13
184F:→ eriker : 不过我猜之後这种文会继续洗 反正普通人也不懂ai 01/24 20:13
185F:→ b9513227 : 你们慢慢吵 哥买tsm nv等看戏 01/24 20:13
186F:推 bj45566 : 科技界名人包括 UC Berkeley 的 AI 教授都帮 DeepSe 01/24 20:13
187F:→ bj45566 : ek 背书说它是 AI 的 "breakthrough" 了,股板键盘 01/24 20:13
188F:→ bj45566 : 侠觉得自己比那些专家还懂 wwww wwww 01/24 20:13
189F:推 s213092921 : Deepseek用阉割版H800就能做到, 01/24 20:13
190F:推 shiowshay : 真的超强,只是不知道为什麽他无法回答我1989年6月4 01/24 20:14
191F:→ shiowshay : 日有什麽历史事件 01/24 20:14
192F:→ asjh612 : nlp更好吹sota 反正自制dataset 别人乱做 自己认真 01/24 20:14
193F:推 asdf70114 : 终於要遥遥领先了 01/24 20:14
194F:→ appledick : 中黑病发作 01/24 20:14
195F:推 SunRoy : 英伟达的股价下跌 我就信 01/24 20:14
196F:推 joygo : 谷歌的很烂 问股票问题不敢回答 chatgpt比较大胆 01/24 20:14
197F:→ appledick : 哥布林不要只会网上酸 拿出东西比较有意义 01/24 20:15
198F:→ eriker : 怎麽不敢回答meta训练15次 开源的deepseek结果数据 01/24 20:15
199F:→ eriker : 不如paper宣称的? 01/24 20:15
200F:推 sid3 : 有竞争是好事 今年韩媒也有新闻 01/24 20:15
201F:→ asjh612 : 教授也会被骗啊 笑死 以为教授多懂 早就没在做实验 01/24 20:16
202F:→ b9513227 : 我快笑死 问中国最新jdk版本是啥 跟我说17 01/24 20:16
203F:→ eriker : 这不是造假不然是什麽 01/24 20:16
204F:→ asjh612 : 是不是没读过研究所阿 还吹教授 01/24 20:17
205F:推 Gipmydanger : 中国赢麻了,只好加大禁令了 01/24 20:17
207F:推 ilGroundhog : 对台积应该没很大的影响就算少了辉达的订单还有其他 01/24 20:18
208F:推 bj45566 : 是啦,中国发表在 AI 论文都是吹的、假的!要随论 01/24 20:18
209F:→ bj45566 : 文附上的原始码也都是假的!那些全世界 AI 专家组 01/24 20:18
210F:→ bj45566 : 成的审稿 TPC 都是一群白痴废物,怎麽可能比股板键 01/24 20:18
211F:→ bj45566 : 盘侠更懂 AI 是吧? wwww 01/24 20:18
212F:→ eriker : 还是meta工程师都废物 有一堆h100 还训练不好deepse 01/24 20:18
213F:→ eriker : ek 01/24 20:18
214F:推 andy810306 : 某楼自己能力差读水货研究所找废物教授,以为美国 01/24 20:19
215F:→ andy810306 : 教授跟你教授一样废,●●比鸡腿,真的笑死 01/24 20:19
216F:推 tomatobus : 教授审论文不会去尝试reproduce吧,除非他叫底下的 01/24 20:20
217F:→ tomatobus : 博士生去试 01/24 20:20
218F:推 sa87a16 : 12亿人口免费的运算怎麽输 01/24 20:20
219F:推 ilGroundhog : DS的初始模型是META的模型只是变得更有效率 01/24 20:20
220F:推 bj45566 : 反正股板的无脑中黑觉得自己比所有业界、学界的知名 01/24 20:21
221F:→ bj45566 : 专家都还要懂 AI wwww wwww 01/24 20:21
222F:推 eriker : 更好笑的是pytorch就meta的 开源还要比三小 01/24 20:21
223F:→ tomatobus : 如果meta工程师无法reproduce,那可能真的有什麽猫 01/24 20:21
224F:→ tomatobus : 腻。企业一定是最紧张的 01/24 20:21
225F:→ asjh612 : 笑死 开始嘴别人教授喔 实际上就是这样啦 国外也是 01/24 20:21
226F:→ asjh612 : AI paper一堆 真的没人有空一篇一篇跟你对 01/24 20:22
228F:→ s213092921 : 预言了 01/24 20:23
229F:推 bj45566 : 顶尖会议那些学界业界最知名的专家的审稿委员当然会 01/24 20:24
230F:→ bj45566 : 试跑随论文附上的原始码啊 -- 万一原始码有错只有你 01/24 20:24
231F:→ bj45566 : 抓不出来,你直接名声扫地好吗 01/24 20:24
232F:推 ilGroundhog : 如果成功还是需要训练模型 只是算力降低很多 01/24 20:24
233F:→ s213092921 : 2千多块阉割版的H800只要训练两个月就超越Meta chat 01/24 20:24
234F:→ s213092921 : GPT,美国可怜啊 01/24 20:24
235F:推 eriker : 中国在paper也喜欢造假硬体 明明用h100还说自己用h8 01/24 20:25
236F:→ eriker : 00或是3080 01/24 20:25
哥
我没有看到任何所谓Meta工程师没办法reproduce的资料来源@@
可以请你提供一下吗
237F:推 bj45566 : 美国一流大学教授就算是五六十岁都还在自己做研究、 01/24 20:26
238F:→ bj45566 : 写程式,井底之蛙觉得自己比 UC Berkeley 教授还厉 01/24 20:26
239F:→ bj45566 : 害,哈哈哈哈 01/24 20:26
240F:推 lepidoptera : 便宜很好啊 大家股价修正一下 重新开始 01/24 20:27
241F:推 ntr203 : nv有什麽好怕的,越强的晶片不就代表可能做出越强 01/24 20:27
242F:→ ntr203 : 的ai 01/24 20:27
243F:→ appledick : 反观台湾在AI运算这一块484完全没了 01/24 20:28
AI制造供应链台湾应该还是掌握得牢牢的
AI模型目前看起来是真的没料
几乎都是拿别人的成果fine-tune、扶不上墙
244F:→ appledick : NV没啥好怕啊 软体写的好跟硬体强又不抵触 01/24 20:28
245F:→ shorty5566 : 真的 看不太懂对nv利空在哪 用现在最强的nv去算不 01/24 20:29
246F:→ shorty5566 : 是更好更令人兴奋吗 而且入门门槛降低对整个ai发展 01/24 20:29
247F:→ shorty5566 : 都是好事 集中在几个大型csp才不好 01/24 20:29
249F:→ s213092921 : 版的H800显卡,中黑赶快面对现实吧 01/24 20:29
这红媒吧?
251F:推 lon0623 : 台湾人力有限,与其发展AI运算,倒不如找应用端 01/24 20:30
252F:推 bj45566 : 无脑中黑已经无所不用其极在催眠自己一切都是假的 w 01/24 20:30
253F:→ bj45566 : www pathetic SORE losers !!! 01/24 20:30
254F:→ appledick : 中国一堆都是去拿Mac mini来跑meta的模型 便宜又可 01/24 20:31
255F:→ appledick : 以玩 01/24 20:31
※ 编辑: Lushen (36.229.55.152 台湾), 01/24/2025 20:32:09
256F:推 h0103661 : 这完全开源,是假的早就被抓了吧 01/24 20:31
257F:→ s213092921 : 中国用2048张阉割版H800显卡训练两个月就能超车Meta 01/24 20:31
258F:→ s213092921 : 及GPT,谁要花大钱买一堆NV最新显卡? 01/24 20:31
259F:→ lon0623 : 不觉得台湾的做法有什麽错误,又不是有上亿人口 01/24 20:31
260F:→ h0103661 : 还是要先跟研究生解释什麽叫开源 01/24 20:31
261F:推 eriker : 你这篇的Lisan al …他说的就是这个意思 01/24 20:32
262F:→ shorty5566 : 反过来说你用nv最强的显卡去跑不是能进步得更快吗 01/24 20:32
263F:→ shorty5566 : ?还是你觉得ai的发展已经到尽头了? 01/24 20:32
264F:→ eriker : 他不是说meta训练了15次deepseek v3结果还是比他们 01/24 20:33
https://i.imgur.com/mJn5POl.png
尴尬
他在说Meta用LLAMA 3的训练成本可以训练DeepSeek-V3 15次
much better model
这大概国中英文
要不是你语言能力有缺陷
就是真的很纯的中黑
265F:→ eriker : 宣称的差吗 01/24 20:33
266F:嘘 ggian123 : Don’t look up 大陆人还生活在水深火热 01/24 20:33
267F:→ shorty5566 : 挫勒蛋的绝对是那些开发模型的公司吧 01/24 20:33
268F:推 lon0623 : 你觉得你想得到的NV想不到吗? 01/24 20:33
269F:→ lon0623 : NV有他厉害的地方,不是只有算力 01/24 20:34
270F:推 chanceiam : 连繁体中文都不能回答的模型 01/24 20:34
271F:→ eriker : 所以meta验证了deepseek放出来的程式码跟模型 发现 01/24 20:34
272F:→ eriker : 他们造假 01/24 20:34
273F:→ eriker : …. 建议你看英文 01/24 20:34
是你的英文能力有缺陷。
我建议你别搞笑了
这真的在扯中黑的腿
274F:→ jjjj222 : 高铁, 六代机, 核融合, LLM, 每天吹, 吹完就没了 01/24 20:35
275F:推 scitamehtam : deepseek我有用,真的蛮好用的 01/24 20:35
276F:→ shorty5566 : 开发模型的公司即将进入红海 倒是nv只怕大家都改用 01/24 20:35
277F:→ shorty5566 : asic,但是门槛降低以後小型玩家可以进场,那些小 01/24 20:35
278F:→ shorty5566 : 型玩家也没能力调教asic 还是要跟nv买通用gpu 01/24 20:35
279F:→ jjjj222 : 功能也就是骗骗白痴.. 特别是中国白痴 01/24 20:36
280F:推 ilw4e : 就跟当初阿法狗一样啊,deepmind搞出来後面一堆围 01/24 20:36
281F:→ ilw4e : 棋AI小模型一下全出来了。纯软体你只是靠暴力解算力 01/24 20:36
282F:→ ilw4e : 堆,人家自然有优化後的更好解法,没看openai也在回 01/24 20:36
283F:→ ilw4e : 头做优化跟即时的深度运算 01/24 20:36
284F:→ scitamehtam : 我两种都下载,都有用,後来都用deepseek 01/24 20:36
285F:推 eriker : 开始抹中黑了? 01/24 20:38
连国中英文都不会
还想在这边大谈
还呛我去读英文原文
中黑搞不好都不承认你是队友
如果你是中黑这会显得除了无脑黑中国没有什麽思辨能力=.=
286F:推 kotorichan : 他能改用中芯晶片训练更好 01/24 20:38
287F:推 tsubasawolfy: 不然老黄干嘛卖那台掌中型的AI机 01/24 20:39
288F:→ CLinna : 国人卷出来的AI要打倒喝下午茶的工程师了吗 01/24 20:39
289F:推 poeoe : 那个英文很明显在说15倍啦…… 01/24 20:39
290F:推 s0920151048 : 这不能说中国好话 01/24 20:39
292F:推 eriker : 造假就造假还在那护航 01/24 20:40
293F:推 ilw4e : 好像很多人误以为AI是哪家先搞出AGI就赢了,现实是 01/24 20:40
294F:→ ilw4e : 就算搞出以後所有人知道该怎麽做很快就会用自己的 01/24 20:40
295F:→ ilw4e : 方法一样能跟上,效率更好成本更低 01/24 20:40
296F:→ tsubasawolfy: 另外推特翻译那个GOOGLE翻得没错 01/24 20:40
297F:→ shorty5566 : 他训练还是要基於nv的gpu 用中芯的怎麽训练 01/24 20:40
298F:推 tomatobus : 笑了,原来尼的出处是那,还以为尼有什麽meta内部的 01/24 20:40
299F:→ tomatobus : 消息 01/24 20:40
300F:→ tsubasawolfy: 我觉得这比较像吹很久的edge AI踏出第一步 01/24 20:41
302F:→ eriker : 那你抹中黑是怎麽回事? 01/24 20:41
303F:→ appledick : 好啦 假的啦 造假啦 中黑赢了 可以吧 01/24 20:41
那个英文能力在这边大谈
强烈建议看看eriker的推文真的超好笑
304F:→ eriker : 这样是ok的 我都在讲deepseek 01/24 20:42
305F:推 bj45566 : 无脑中黑在众人面前证实了自己连简单的英文都看不 01/24 20:42
306F:→ bj45566 : 懂胡扯乱翻译,嘻嘻 wwww wwww 01/24 20:42
307F:推 poeoe : Meta训练的预算拿来训练Deepseek 都至少能训练15次 01/24 20:42
308F:→ poeoe : 了 01/24 20:42
309F:→ tonyshan : 简体的可以SKIP了 01/24 20:42
310F:推 good5755 : 关键字:开源程式码 01/24 20:42
311F:→ appledick : meta 484太多冗员了啊 01/24 20:43
312F:推 Fegnzi : 那些反智的人看不懂开源是什麽没办法,逢中就反真的 01/24 20:43
313F:→ Fegnzi : 没救 01/24 20:43
314F:→ eriker : 所以质疑deepseek造假就是中黑? 01/24 20:43
可以质疑的
不过哥你的行为真的相当反智
跟中国人民说祖国疫苗No1差不多 只是颜色不一样而已
都是避着眼睛只相信自己相信的
315F:嘘 distantblc : 急了 01/24 20:44
316F:→ eriker : 只会做人身攻击 01/24 20:44
317F:推 scitamehtam : 质疑? 不是不行吧,要合逻辑… 01/24 20:44
318F:→ eriker : 你在继续 01/24 20:44
319F:→ scitamehtam : 不然不就变成抹屎? 01/24 20:45
320F:推 littenVenus : 这次中国真的会赢2次喔 01/24 20:45
321F:→ appledick : deepseek如果不是中国研究我觉得你应该就不会质疑了 01/24 20:45
322F:→ VicLien : 中国的天赋点在红海化 厉害了 01/24 20:45
323F:推 bj45566 : 胡扯乱翻译人家公开的英文说明(而且是用很简单的英 01/24 20:46
324F:→ bj45566 : 文)说是无脑都还太客气了好吗? wwww wwww 01/24 20:46
325F:→ appledick : 中国某些地方真的就是强啊 当然某些地方是不敢恭维 01/24 20:46
326F:→ scitamehtam : 先玩过再说..,我两套都玩过,deepseek真的不错 01/24 20:46
327F:→ eriker : 如果deepseek不是中国的还会这样骂人吗? 01/24 20:46
328F:→ scitamehtam : 小心钓鱼,看他自己表演就好,建议啦 01/24 20:47
329F:→ scitamehtam : 没逻辑的讲话最大声 01/24 20:47
330F:→ eriker : 我没差 反正我不会骂人 我只评论deepseek 01/24 20:48
331F:→ scitamehtam : 最近这版卫兵执勤很认真,桶了几波了,自己小心 01/24 20:48
332F:推 epephanylo : (看戏 01/24 20:48
333F:→ eriker : 反倒是某些人小心 01/24 20:48
※ 编辑: Lushen (36.229.55.152 台湾), 01/24/2025 20:49:43
334F:推 bj45566 : 评论?胡乱翻译人家的英文也敢叫做评论?笑死人有 01/24 20:49
335F:→ bj45566 : 够好笑 wwwww 01/24 20:49
336F:嘘 Kazetachinu : 一堆ai大老都中国人 哪天超车都不意外 软体这种东西 01/24 20:50
337F:→ Kazetachinu : 限制没有硬体这麽多 01/24 20:50
338F:→ asjh612 : 不过这篇推文这麽火热 没半个人贴实例对话XDD 01/24 20:50
339F:→ brella : 垃圾新闻 01/24 20:50
340F:→ asjh612 : 之前gpt在红的时候 还有gpt帮忙回应的截图 01/24 20:50
341F:→ asjh612 : 觉得好的 可不可以务实点 去玩几个例子贴来看看 01/24 20:51
342F:推 yueayase : 大惊小怪,这种前沿的技术,本来就是湖乡合作,及互 01/24 20:51
343F:→ yueayase : 相竞争的 01/24 20:51
344F:→ asjh612 : 让我见识见识哪些是你们觉得好 哪些是回应差的 01/24 20:51
346F:推 duriamon : deepseek有手机app啊!自己下载来用用看不就知道了 01/24 20:52
347F:→ duriamon : ?用email就可以注册了。 01/24 20:52
348F:→ yueayase : 湖乡=>互相 01/24 20:52
349F:→ scitamehtam : 刚好今天才在用.. 01/24 20:52
350F:→ scitamehtam : 反倒是批评的?…. 01/24 20:52
351F:→ holebro : 中国软体强度上下限差很大 遇过一堆中国客户连用AI 01/24 20:53
352F:→ holebro : 帮忙写sql写shell script写yaml都不会= = 01/24 20:53
353F:→ scitamehtam : 我两套都常用啦,我自己112csie,也有研究ai主题 01/24 20:53
354F:推 kakiandkaka : 笑翻,被反向 01/24 20:53
355F:→ duriamon : 楼上可以要他用正体中文回答。 01/24 20:53
358F:→ scitamehtam : 倒是爬虫後,发现一堆嘴的头头是道,结果背景令人 01/24 20:53
359F:→ scitamehtam : 惊讶XDDD 01/24 20:53
360F:推 ezreal1315 : 这就是第一个开头的和跟班的差距啊 第一个一定要砸 01/24 20:54
361F:→ ezreal1315 : 大钱开发 後面的当然可以降低成本 01/24 20:54
362F:→ asjh612 : 就是不想注册阿... 试想会黑的怎会想用 01/24 20:54
363F:→ scitamehtam : 没用过说的好像很熟一样XDD 实事求是XDD 01/24 20:55
364F:→ ezreal1315 : 哪个行业不是这样 开拓者都是要付出最多的 01/24 20:55
365F:推 s213092921 : 问题是开拓者能否一直保持领先优势,看看Nokia跟Mot 01/24 20:56
366F:→ scitamehtam : 所以我说,爬虫後的心得,就是推文自己小心,最近审 01/24 20:56
367F:→ scitamehtam : 查异己言论很勤劳的 01/24 20:56
368F:→ s213092921 : o萝拉的下场 01/24 20:56
370F:推 NCUking : DeepSeek是猛在CP值超级高 01/24 20:56
371F:推 TIPPK : 台湾软体公司好少 01/24 20:56
372F:推 bj45566 : 连注册都没有就拼命在黑? wwww 人家台大资工亲自 01/24 20:57
373F:→ bj45566 : 试用还截图给你耶 01/24 20:57
374F:→ NCUking : OpenAI 目前还是领头羊没问题 01/24 20:57
375F:嘘 zebra101 : 笑死,人家明明在说META用了15倍的预算,更好的GPU 01/24 20:57
376F:推 guanting886 : 我觉得一般用户蛮鼓励开发团队都跳进瓮被练蛊 01/24 20:57
377F:→ zebra101 : ,却训练出了比DS更差的模型,英文到底怎麽读的,co 01/24 20:57
378F:→ zebra101 : uld have看不懂吗? 01/24 20:57
379F:→ NCUking : 台湾搞LLM只能玩微调套皮 01/24 20:57
380F:推 ezreal1315 : 所以说 买大盘真安心啊 20年前市值前10公司跟现在 01/24 20:57
381F:→ ezreal1315 : 比已经大洗盘 01/24 20:57
382F:→ deangogi : 所以上面eriker说的meta复现准确度 有原文吗? 01/24 20:58
383F:推 scitamehtam : 我平常两个都在玩啊,我没说chatgpt不好吧? 01/24 20:58
384F:推 duriamon : AI领域大陆那边跟美国的差距本来就不大,有在关心AI 01/24 20:58
385F:→ duriamon : 相关研究的大概都知道在说什麽,尤其中文大语言模型 01/24 20:58
386F:→ duriamon : 就唯一只有大陆那边的能打,反观台湾研发的真的很烂 01/24 20:58
387F:→ duriamon : ,呵呵! 01/24 20:58
388F:推 eriker : 没有 嘻嘻 01/24 20:58
389F:推 symeng : 暂时观望 01/24 20:59
390F:→ asjh612 : 你问他llm吹很厉害的 有多少在搞啊 谁有空每个都试 01/24 20:59
391F:推 ezreal1315 : 我觉得不用太紧张啦 人家用H800真的能超越openai 01/24 20:59
392F:→ deangogi : 你说的如果是原po贴的那段翻译 应该是你翻译的问题 01/24 20:59
393F:→ ezreal1315 : 我相信股价早就被灌下来灌烂了 那些大户一定第一 01/24 20:59
394F:→ ezreal1315 : 个跑的 01/24 20:59
395F:嘘 zebra101 : 那个eriker连最基本的英文都读不懂 01/24 20:59
396F:推 aac219oo : 我看有很多人都不知道自己用的网站是用vue3写的 01/24 20:59
397F:推 w300204 : costdown谁的比得过华人 01/24 21:00
398F:推 NCUking : 中国软体实力本来就是天下第二了 01/24 21:00
400F:→ abc21086999 : 中国特色社会主义式的AI 01/24 21:00
401F:→ ezreal1315 : 或者是就算如此 巨头也不会降低支出 怕被同行超越 01/24 21:01
402F:推 Samurai : 先不说是不是真的,但逢中必反那个鸟样,酸别人砸 01/24 21:01
403F:→ Samurai : 钱研发有够莫名其妙 01/24 21:01
404F:→ asjh612 : copilot claude gemini gpt llmam 每个新出的都sota 01/24 21:01
405F:推 duriamon : 还有人以为是costdown啊?不亏是台湾代工老旧代工思 01/24 21:01
406F:→ duriamon : 维,那些发展AI的人才经费花费成本真算下来哪里cost 01/24 21:01
407F:→ duriamon : down了? 01/24 21:01
408F:→ abc21086999 : Gemini thinking 答的就没问题 01/24 21:02
410F:嘘 gstym : 中国晶片都可以去买别人的晶片来磨改名字了== 01/24 21:02
411F:推 scitamehtam : 说真的chatgpt也能回答这题XDD 01/24 21:02
412F:→ asjh612 : 搞不懂别人的问题点 还在以为我在黑中国 01/24 21:03
413F:→ duriamon : 台湾的老问题上次已经讲过了,目前全世界先进的未来 01/24 21:03
414F:→ duriamon : 科技领域除了「我们有台积电」之外每一个能打的。 01/24 21:03
415F:→ scitamehtam : 但好笑的是,拿这题当评断AI的标准XDD 01/24 21:03
416F:→ asjh612 : 问题是 现在每个llm都吹自己最强 当我是llm测试员哦 01/24 21:03
417F:→ scitamehtam : 很显然不是理工人吧XD 01/24 21:03
418F:→ Mytsb2421 : 美国变成copy cat 01/24 21:04
419F:推 iaminnocent : deepseek不采用预标数据集(也就是先由人类标记数 01/24 21:04
420F:→ iaminnocent : 据再给模型训练)而是直接采用强化学习,自己训练 01/24 21:04
421F:→ iaminnocent : 自己,并且透过他们的局部Token启动机制,可以减少 01/24 21:04
422F:→ iaminnocent : 使用量,这也是为什麽Deepseek能够大幅降低训练成 01/24 21:04
423F:→ iaminnocent : 本的原因,不确定OpenAi 或是其他AI模型,为什麽没 01/24 21:04
424F:→ iaminnocent : 有进行强化学习 01/24 21:04
425F:→ scitamehtam : 所以才说,爬虫後,再看一次推文会很有趣啊XD 另, 01/24 21:04
426F:→ scitamehtam : 你知道ptt主机放哪?XD 01/24 21:04
427F:推 Samurai : 意识形态死脑筋没救,拿六四事件当评断AI标准XD 01/24 21:04
429F:推 s213092921 : 因为美国只相信大力出奇蹟那套,砸钱砸算力 01/24 21:05
430F:推 Lenney33 : 成本更低 美国科技巨头情何以堪 01/24 21:05
431F:→ iaminnocent : 但是这确实是对AI界投下震撼弹吧,不过OpenAI改用 01/24 21:05
432F:→ iaminnocent : 自主强化学习,不知道是否可以 01/24 21:05
433F:嘘 abc21086999 : 理工人又在打手枪自慰啊 01/24 21:06
434F:→ abc21086999 : 会审查讯息的AI就算在某方面超越其他人也是不可能 01/24 21:06
435F:→ abc21086999 : 普吉的 01/24 21:06
436F:→ abc21086999 : *普及 01/24 21:06
437F:推 tw77769 : 阿姨的机会来了 01/24 21:06
438F:→ iaminnocent : DEEPSEEK 的数据集也许确实有部份来自ChatGPT,但 01/24 21:07
439F:→ iaminnocent : 这并不影响他确实是一个蛮厉害的模型 01/24 21:07
440F:推 bj45566 : 又有人硬要扯到晶片了。公开的论文告诉你实验环境、 01/24 21:07
441F:→ bj45566 : 算法流程、效能评比;原始码放在大家都可以下载的 G 01/24 21:07
442F:→ bj45566 : itHub 上,这要怎麽作弊??? 01/24 21:07
443F:推 scitamehtam : 就事论事,如果你说会不会普及,那就另外一题了, 01/24 21:07
444F:→ scitamehtam : 请另辟蹊径吧 01/24 21:07
445F:推 a558815 : Deepseek 是真的有些东西啊 01/24 21:07
446F:推 tsubasawolfy: OPENAI的O3就是RL压 圣诞节前的13天倒数也有RL出现 01/24 21:08
447F:→ tsubasawolfy: O3就是O1 RL来的 省去训练成本 01/24 21:08
448F:推 ggbi4zzz : 美国人都害怕被中国ai超越,还有中国黑认为是在吹 01/24 21:09
449F:→ ggbi4zzz : 牛逼而已 01/24 21:09
450F:推 minazukimaya: 还好它开源 同样的演算法创新让资源更多的美国科技 01/24 21:09
451F:→ minazukimaya: 巨头来用 以他们握有的训练资源能产出更惊人的结果 01/24 21:09
453F:→ eett811025 : 码农996用肝跟你拼了 01/24 21:10
454F:推 bread1110 : 这鲸鱼真的邪门 花少少的预算干大事 meta最好撑住啊 01/24 21:11
455F:推 minazukimaya: 但感觉AGI和技术奇点的时间又被提前了....... 01/24 21:11
456F:→ s213092921 : 中国AI公司因为算力受限,只好动脑另辟蹊径,走出一 01/24 21:11
457F:→ s213092921 : 片天,高阶晶片也是一样的道理 01/24 21:11
458F:嘘 qazwsx0128 : 够便宜我就自己训练一个 01/24 21:11
459F:→ minazukimaya: 这才是最恐怖的吧 感觉2030年前就要奇点了 01/24 21:11
460F:推 iaminnocent : 那就对啦O3开始用RL的话,大概又会反超吧 01/24 21:12
461F:→ fywei : 真的好恐慌 zzz 吓死人 只好再睡一下 01/24 21:12
462F:推 nfsong : 开源的 只能导入 01/24 21:12
463F:嘘 ishdtt598 : 跟文组讲那麽多干嘛 笑死 01/24 21:12
464F:→ nfsong : 论文都出了 01/24 21:12
465F:推 eliteark : 继续吹起来 我要看到血流成河 01/24 21:13
466F:推 LBJshit : 傻鸟真的很傻很北七 一直那边说DS造假 我还以为是真 01/24 21:13
467F:→ LBJshit : 的有什麽内幕勒。结果他妈的是英文太烂根本自己完全 01/24 21:13
468F:→ nfsong : 跟股票一样 有钱人不会输 01/24 21:13
469F:→ LBJshit : 搞错 连下面有中文的正确翻译也不看 01/24 21:13
470F:→ nfsong : 导入以後 3000e 的就更猛 01/24 21:13
471F:推 cay86714 : AI究极鬼故事! 01/24 21:14
472F:→ nfsong : 550万就这麽猛 3000e的 6倍猛 01/24 21:14
473F:推 iaminnocent : 那个贴文确实是说Meta的训练费用都可以训练15次Dee 01/24 21:14
474F:→ iaminnocent : pseek了 01/24 21:14
475F:→ shorty5566 : 傻鸟真的北七 前几天还看到黄仁勳去中国就疯狂崩溃 01/24 21:14
476F:→ shorty5566 : 的 01/24 21:14
477F:推 duriamon : OpenAI的问题是核心科学家走了 01/24 21:14
478F:→ gn7722 : 就跟现在的预算一样 01/24 21:15
479F:→ iaminnocent : O3我记得之前altman有贴出他的比较,好像比O1强不 01/24 21:15
480F:→ iaminnocent : 少,但是当然费用很贵,如果OpenAi把这个开源的机 01/24 21:15
481F:→ iaminnocent : 制拿来用不知道行不行 01/24 21:15
482F:→ cay86714 : 如果这是真的那麽那些CSP之後的资本支出根本不用那 01/24 21:16
483F:→ cay86714 : 麽高嘻嘻 01/24 21:16
484F:推 g27834618 : 训练费降低是利多啊 赶紧出杀手级应用才是正轨 01/24 21:16
485F:推 littenVenus : 老黄484蛋雕惹QQ 01/24 21:17
486F:推 duriamon : 训练费代表所需的时间成本、算力跟电费等,自己想想 01/24 21:17
487F:→ duriamon : 看罗! 01/24 21:17
488F:→ littenVenus : 电力需求应该也不用那麽多吧 01/24 21:17
489F:→ cay86714 : 不过这件事没多久前国内投资圈就有一些人知道了, 01/24 21:18
490F:→ cay86714 : 就看市场什麽时候反应了嘻嘻 01/24 21:18
491F:→ iaminnocent : OpenAI比较像是他有很多资讯,当你询问他时,他会 01/24 21:18
492F:→ iaminnocent : 依据他的知识库中去找寻资料,并且给你。DEEPSEEK 01/24 21:18
493F:→ iaminnocent : 则是有很多专门的朋友,会依据问的问题,分配给适 01/24 21:18
494F:→ iaminnocent : 合的专门朋友去找资料回答(也就是不会全部Token调 01/24 21:18
495F:→ iaminnocent : 动,可以减少Token使用量) 01/24 21:18
496F:推 beesee : 训练方式很华人 01/24 21:19
497F:→ littenVenus : 窝是上礼拜看节目听一个物理学博士在分析 01/24 21:20
498F:推 Samurai : 老黄没差吧,算力永远不够,相同算力能做的事情更 01/24 21:20
499F:→ Samurai : 多了,加速科技发展,是软体公司要头痛了,拼肝拼 01/24 21:20
500F:→ Samurai : 软体效率拼不过华人 01/24 21:20
501F:推 s213092921 : 国外有大神用两台M3晶片的苹果电脑搭载运行Deepseek 01/24 21:20
502F:→ s213092921 : 逻辑模型XDD 01/24 21:20
503F:推 usereminem : 一堆人仇中仇到脑子坏掉了 可悲 01/24 21:20
504F:推 yusanhu : 厉害 01/24 21:21
505F:→ littenVenus : DS是分区块 各领域专门训练 01/24 21:21
506F:推 duriamon : 没错,deepseek是MoA架构。 01/24 21:22
507F:推 minazukimaya: 演算法创新会反过来创造出新的算力需求啊 因为对智 01/24 21:22
508F:→ minazukimaya: 能的追求没有上限 更高效的演算法=更快到奇点 01/24 21:23
509F:嘘 tw19930419 : 一堆低能中黑 看了就好笑 01/24 21:23
510F:推 ilw4e : 哈哈黑黑不知道一堆模型都会说他是chatgpt,因为监 01/24 21:24
511F:→ ilw4e : 督学习步骤最多人用的就是拿chatgpt当那个监督模型 01/24 21:24
513F:嘘 cosmite : 刚问了美国地47届总统是谁,连这个都答不出来,资 01/24 21:24
514F:→ cosmite : 料库还停在2023(模型为DeepSeekV3) 01/24 21:24
516F:推 bj45566 : OpenAI o3 是非开源码啊,而且最近被揭露它表现最 01/24 21:24
517F:→ bj45566 : 惊人的 FrontierMath 指标有作弊的嫌疑!相关的英 01/24 21:24
518F:→ bj45566 : 文报导和讨论不少,这里给一个实例! 01/24 21:24
520F:→ cosmite : ChatGPT-4则没有问题 01/24 21:25
522F:推 fattyeddie : 连ai都能卷 了不起我的国 01/24 21:26
523F:→ bj45566 : P.S. 那只看不懂国中等级英文的中黑欢迎继续跳出来 01/24 21:26
524F:→ bj45566 : 呐喊丢人现世 wwww wwww 01/24 21:26
525F:→ duriamon : 因为deepseek不用运转那麽多参数来产生回答,而Open 01/24 21:26
526F:→ duriamon : AI的必须要,所以以电力消耗、算力消耗跟微型化来说 01/24 21:26
527F:→ duriamon : 都不利,但也不是代表这样不好。我是觉得OpenAI自从 01/24 21:26
528F:→ duriamon : 变成Altman的玩物之後,进步幅度有限,反而吹嘘成分 01/24 21:26
529F:→ duriamon : 增加了,呵呵! 01/24 21:26
530F:推 minazukimaya: DeepSeek有价值的地方不是它自身模型有多强.. 01/24 21:26
531F:→ minazukimaya: 而是他提出的创新可以被其他有更大训练集和更多算力 01/24 21:27
532F:推 KOKEY : 差别在喝的茶叶或咖啡比较贵啦 01/24 21:27
533F:→ minazukimaya: 的公司复用 01/24 21:27
534F:→ duriamon : 强的是训练的方式,里面的秘密我相信应该没有开源, 01/24 21:27
535F:→ duriamon : 呵呵! 01/24 21:27
536F:推 bj45566 : 现在面临作弊丑闻的反而是美国 & 世界最强的非开源 01/24 21:28
537F:→ bj45566 : 码 OpenAI o3 01/24 21:28
538F:推 DCapple : 又赢了又赢了,中国赢两次 01/24 21:28
539F:推 tw19930419 : 那叫做他没有使用网路 不是他不会 问这种没监别度的 01/24 21:28
540F:→ tw19930419 : 蠢问题要证明什麽 01/24 21:28
541F:推 Samurai : 不要再搞笑了,他的资料库到2023年根本就不是什麽 01/24 21:29
542F:→ Samurai : 缺陷,只差在有没有网路搜寻最新资讯而已 01/24 21:29
543F:推 minazukimaya: DeepSeek很公开啊 演算法和工程改进都写在论文里 01/24 21:29
544F:推 littenVenus : 那个博士认为 因为成本优势 注定美国以外地区会倾 01/24 21:29
545F:→ littenVenus : 向DS 所以DS将是最後赢家 01/24 21:29
546F:→ minazukimaya: 真的是还好它够公开 01/24 21:30
547F:推 raygod : 加大制裁 01/24 21:30
548F:→ minazukimaya: 不过它也是站在一堆前辈肩上 现在给人站肩膀 这就是 01/24 21:30
549F:推 Samurai : 意外的是DS竟然这麽大方公开研究方法 01/24 21:30
550F:→ minazukimaya: 科学研究啊 01/24 21:30
551F:推 runacat : 论文都出来了 01/24 21:31
552F:推 QuuEgg : 哇啊,削价竞争欸 01/24 21:32
553F:推 bj45566 : DeepSeek 如果在演算流程上没有开创性的突破,美国 01/24 21:33
554F:→ bj45566 : 业界大老绝对不会用 "breakthrough" 来形容啦,这 01/24 21:33
555F:→ bj45566 : 个字义和 "cost down" 或 "内卷" 相差十万八千里 - 01/24 21:33
556F:→ bj45566 : - 而且 " cost down" 是标准的台式英文 01/24 21:33
557F:推 wchang : 好到不可思议的好,就是假的 01/24 21:33
558F:→ wchang : 跟运动员吃禁药一样,不是apple 对apple 01/24 21:33
559F:推 Mosskappa : Buy the rumor 01/24 21:34
560F:推 tpkgo : 让子弹飞一会儿~~~~ 01/24 21:34
561F:推 minazukimaya: 令人恐惧的反而是模型的效率一日千里 对齐的研究牛 01/24 21:35
562F:→ minazukimaya: 步慢行... 01/24 21:35
563F:→ minazukimaya: 根本是直通文明毁灭的最短路线XD 01/24 21:36
564F:→ tonyshan : 看起来就改进一个东西 就吹到天上去 01/24 21:36
565F:→ minazukimaya: DeepSeek把人类文明的毁灭倒数时钟又拨快了一格 01/24 21:36
566F:推 tompi : DS API的费用是 o1 的1/30 01/24 21:37
567F:→ minazukimaya: DeepSeek可不止改进一个东西 论文都有 白话技术文也 01/24 21:37
568F:推 tsubasawolfy: 不用担心OPENAI 那个疯子一心只想要真的AGI 就跟马 01/24 21:37
569F:推 bj45566 : 楼上是在说 OpenAI 的 FrontierMath benchmark 吗? 01/24 21:38
570F:→ bj45566 : 好到不可思议结果... 01/24 21:38
571F:推 duriamon : 没办法,让AI对齐人类的道德没办法赚钱,呵呵! 01/24 21:38
572F:推 mamorui : 这个应该不怎样吧 去年看太多篇宣称更顶 验证一下 01/24 21:38
573F:推 tpkgo : 中国很会利用别人的研究偷鸡 先听听就好 01/24 21:38
574F:→ mamorui : 就没戏了 @@ 01/24 21:38
575F:→ tsubasawolfy: 斯克一心想上火星一样 赛道不同 01/24 21:38
576F:→ minazukimaya: 有 至少在大胆创新+高效工程这两方面是非常优秀的 01/24 21:38
577F:推 wsung : 已经玩了一整天的R1,真的不差 01/24 21:38
578F:→ mamorui : 去年一堆 现在不是很爱看中国出的论文 拿到长官面 01/24 21:38
579F:→ mamorui : 前介绍都容易被骂 01/24 21:38
580F:推 bj45566 : 人家原始码、论文跟效能测试结果都公布了啊,请问 01/24 21:41
581F:→ bj45566 : 楼上举例一下哪个说自己更顶的有公开这些?好酸的 01/24 21:41
582F:→ bj45566 : 葡萄 wwww 01/24 21:41
583F:推 minazukimaya: 中国一堆骗钱公司是事实 但DeepSeek和他们不一样也 01/24 21:41
584F:→ minazukimaya: 是事实 这两个事实又不冲突... 01/24 21:41
585F:推 mamorui : 不是啊 论文就是有新方法 数据更漂亮 但实验效果 01/24 21:42
586F:→ mamorui : 跑了不佳 真的有啊 01/24 21:42
587F:推 NTUCS : 蓝白粪高潮 01/24 21:43
588F:推 bj45566 : 楼上中黑请解释一下人家论文、原始码都公开的情况下 01/24 21:43
589F:→ bj45566 : 要怎麽「利用别人的研究偷鸡」?只会无脑黑吗? 01/24 21:43
590F:嘘 naushtogo : 最近炒作很大,让我们继续看下去 01/24 21:43
591F:→ mamorui : 我找一下 我有标记过 01/24 21:43
592F:推 s800525 : 说减少算力能达到一样效能,那一样算力不是能达到更 01/24 21:43
593F:→ s800525 : 高效能?为何要以减少算力为前提? 01/24 21:43
594F:→ NTUCS : 论文公布了 但能 repro 吗 01/24 21:43
595F:→ bj45566 : 请问有哪个可信消息来源说「实验结果不佳」?又在 01/24 21:44
596F:→ bj45566 : 自己脑补吗? 01/24 21:44
597F:推 tpkgo : 原始码公开又不代表什麽 你是没看过原始码公开喔!! 01/24 21:44
598F:→ NTUCS : 你不是蓝白粪干嘛入座 01/24 21:44
599F:推 mamorui : 啊 像那个LLaMA-omni就是同事报告时直接露馅 01/24 21:45
600F:→ s800525 : 说能事半功倍,那不能事倍功四倍吗? 01/24 21:45
601F:→ mamorui : 开源就可以去repro 01/24 21:45
602F:推 vtgc161 : 论文出来了,所以有人可以说明一下,他到底是不是拿 01/24 21:47
603F:→ vtgc161 : 现有Ai模型为底去训练的吗 01/24 21:47
604F:推 mamorui : 要跑过才知道 01/24 21:47
605F:推 bj45566 : 原始码公开多久了?美国顶级业界学界大老也高度评 01/24 21:48
606F:→ bj45566 : 价赞赏,台大资工板友也早就注册测试觉得表现很好了 01/24 21:48
607F:→ bj45566 : -- 请问中黑还要怎麽样才愿意承认人家做出一个好东 01/24 21:48
608F:→ bj45566 : 西??? 01/24 21:48
609F:→ mamorui : 等哪天这个技术在公司一堆人讲才是真的 我现在没听 01/24 21:48
610F:→ mamorui : 到就是了 01/24 21:48
你公司如果在做AI模型研究/工程的
这几天全公司上下应该都在研究这个
611F:推 duriamon : 简单来说就是最近有一个新的AI能力测验,找了好几位 01/24 21:49
612F:→ duriamon : 费尔兹数学奖得主来出超高难度题目,几乎所有AI模型 01/24 21:49
613F:→ duriamon : 都回答得跟屎一样,只有o3脱颖而出,大家正震惊Open 01/24 21:49
614F:→ duriamon : AI的技术力时,被爆料出来因为这个AI能力测验OpenAI 01/24 21:49
615F:→ duriamon : 有赞助能事先拿到题目作弊,Altaman的作为我是不意 01/24 21:49
616F:→ duriamon : 外啦!呵呵! 01/24 21:49
617F:推 minazukimaya: 你现在没听到要启MoE项目 只是表示你公司不在最前沿 01/24 21:49
618F:→ cclemon1231 : 对岸弱点还是0到1,但改造能力真的很强 01/24 21:49
619F:推 bj45566 : 看来你待的公司比 Meta AI 还强 wwww wwww 01/24 21:49
620F:推 sleepinggod : 成本低,跟使用者收费就可以便宜 01/24 21:50
621F:推 mamorui : 因为老马的之前也拿过高分。就看罗 01/24 21:50
622F:嘘 yunf : 机器之心 是谁? 01/24 21:51
623F:→ minazukimaya: 现在最前沿的美国公司一定会启新项目投入MoE方向了 01/24 21:51
624F:推 good5755 : 分领域导出答案 假如问题是跨领域不就GG了 01/24 21:51
625F:→ mamorui : 没有啊 大家也是会谨慎看结果 OpenAi在很多篇论文 01/24 21:51
626F:→ mamorui : 数据都平均佳 所以谨慎看待每一版表现罗 01/24 21:51
627F:推 davis5566 : 说个事实 某些人就开始蓝白粉壮世代的 这些烂货 01/24 21:52
628F:→ davis5566 : 还是早点被时代淘汰吧 01/24 21:52
629F:→ mokipu : 拉板凳看戏 01/24 21:52
630F:推 dwood123 : 这说明小公司也可作出好的模型,那大家就会跃跃欲 01/24 21:52
631F:→ dwood123 : 试,Al伺服器需求也会增加啊! 01/24 21:52
632F:推 duriamon : 其实MoA架构比较符合人类的思考方式,人类大脑功耗 01/24 21:52
※ 编辑: Lushen (36.229.55.152 台湾), 01/24/2025 21:53:14
633F:→ duriamon : 才30W参数量才4GB,演化的威能不是盖的。 01/24 21:52
634F:推 sleepinggod : 台湾不应该发展中文语言模型,教授都嘛拿国家钱产出 01/24 21:53
635F:→ sleepinggod : 没用的东西。直接全民学英文比较有效率 01/24 21:53
636F:推 bj45566 : duriamon 板友讲的 OpenAI o3 在高难度数学测验的涉 01/24 21:53
637F:→ bj45566 : 弊丑闻我在楼上就贴了一个应为报导短网址了,现在 A 01/24 21:53
638F:→ bj45566 : I 圈内最被怀疑的反而是这个 01/24 21:53
639F:→ good5755 : 而且重点是资料库吧 目前以资料库取得难易程度 01/24 21:53
640F:→ duriamon : 有Altman乱搞,OpenAI迟早会完蛋,我先预言在这边, 01/24 21:54
641F:→ good5755 : 对岸的13亿免费资料库真的比欧美简单多了 01/24 21:54
642F:→ duriamon : 呵呵! 01/24 21:54
643F:推 mamorui : 我记得OpenAI数学不好吧 01/24 21:54
644F:→ bj45566 : *英文报导 01/24 21:54
645F:推 tpkgo : Meta AI不错 但现在使用者标竿是OpenAI 01/24 21:54
646F:推 akwa : 一堆井蛙还是不信 呵呵 01/24 21:54
647F:→ bj45566 : 难怪你待的公司没人在讨论 DeepSeek,都 2025 年了 01/24 21:55
648F:→ bj45566 : 还在讲 OpenAI 数学不好,嘻嘻 wwww wwww 01/24 21:55
649F:推 mamorui : 对 OpenAI是标竿 因为大多比较数据出在别人的论文 01/24 21:55
650F:→ mamorui : 里 GPT都平均拿到最佳 但数学是真的烂 01/24 21:55
651F:→ bj45566 : OpenAI 涉嫌作弊的是普通人一辈子都碰不到边的 Fron 01/24 21:56
652F:→ bj45566 : tierMath benchmark !!! 01/24 21:56
653F:→ duriamon : 现在由於用於训练AI模型所使用的开源资料已经几乎耗 01/24 21:56
654F:→ duriamon : 尽,现在流行的是新型AI架构的研发以及超参数的蒸馏 01/24 21:56
655F:→ duriamon : 和分析,如何从已经有的超参数产生更好的产品才是显 01/24 21:56
656F:→ duriamon : 学。 01/24 21:56
657F:→ mamorui : 我是没有很常使用数学相关的没错。记忆停在数学烂 01/24 21:56
658F:→ mamorui : 没错 01/24 21:56
659F:推 sweetantt : o3应该不久後就会出来了吧 而且免费用户也有o3 mini 01/24 21:56
660F:→ sweetantt : 到时候就知道openAI有没有吹牛了 01/24 21:56
661F:→ duriamon : 看那个整天吹嘘的Sora我是不期待啦!呵呵! 01/24 21:57
662F:→ bj45566 : 还在继续幻想说 OpenAI o3 数学烂 wwww 人家轻松碾 01/24 21:57
663F:→ bj45566 : 压你好吗! 01/24 21:57
664F:嘘 cityhunter04: 叫美国时代过去之前,他科技还是屌打世界2-30年… 01/24 21:58
665F:→ duriamon : 新的架构我觉得会是比较有趣的发展,传统的transfor 01/24 21:59
666F:→ duriamon : mer已经差不多了。 01/24 21:59
667F:→ duriamon : 说是传统不过也才2-3年的事,AI发展就是这麽竞争, 01/24 21:59
668F:→ duriamon : 呵呵! 01/24 21:59
669F:推 mamorui : 等很多paper报告看到比较时DS赢再说吧 最近两个月 01/24 22:00
670F:→ mamorui : 没时间看paper 小组报告都延期了 赶年末案子要GM 01/24 22:00
671F:推 bj45566 : OpenAI o3 的 AIME 2024 benchmark 分数是 96.7% 好 01/24 22:05
672F:→ bj45566 : 吗? 01/24 22:05
673F:推 mamorui : o3不是12月才推出吗 我刚好没用 哈 以前很烂是真 01/24 22:07
674F:→ mamorui : 的 01/24 22:07
675F:推 Tsukasa0320 : 很好啊 有威胁度才有理由打死 01/24 22:07
676F:→ mamorui : 那我就期待一下2025的各大paper罗 01/24 22:07
677F:推 bj45566 : OpenAI o3 现在被质疑的 FrontierMath benchmark 是 01/24 22:07
678F:→ bj45566 : 绝大多数人一辈子都碰不到的高等数学 01/24 22:07
679F:嘘 k798976869 : meta就是故意开源AI不给微软赚的 还在演啥 01/24 22:08
680F:推 bj45566 : 又在讲笑话了,嘻嘻。OpenAI 在 AIME benchmark 早 01/24 22:09
681F:→ bj45566 : 就超过大部分人的数学水准了 wwww 01/24 22:09
682F:推 popo123456 : 丸子,台积和美股7巨头都要暴跌 01/24 22:10
683F:→ bj45566 : 难怪你的公司没听过 DerpSeek,嘻嘻 wwww 01/24 22:10
684F:推 mamorui : 教科书的数学是可以 逻辑陷阱还是会踩 01/24 22:10
685F:→ mamorui : 圣诞节才发布 不要急哇 01/24 22:12
686F:推 DA3921999 : 只要中国的开发者还开源就不可能赢美国啦,美国稳的 01/24 22:12
687F:→ lon0623 : 暴跌就想太多了,尤其台积本益比才二十几 01/24 22:12
688F:推 bj45566 : 开源的远不只 Meta 一家,DeepSeek 是用少得吓人的 01/24 22:12
689F:→ bj45566 : 成本打平、打败台面上所有的开源大语言模型 01/24 22:12
690F:推 shorty5566 : NV盘前大跌-0.5% 蒸的丸子 01/24 22:13
691F:→ abc21086999 : 为什麽有人要为了中国的AI很厉害感到自豪? 01/24 22:13
692F:→ lon0623 : 你问中国用的晶片是不是台积做的 01/24 22:14
693F:推 mamorui : 我也不知道 而且我习惯谨慎多看几版 01/24 22:14
694F:→ lon0623 : 而且AI只是台积的一部分而已 01/24 22:14
695F:推 MumiPyonPyon: Deepseek不是open的吗@@ 01/24 22:15
696F:推 bj45566 : 因为 DS 狠狠打脸股板数不清的无脑中黑啊,嘻嘻 www 01/24 22:16
697F:→ bj45566 : w 01/24 22:16
698F:→ bj45566 : 连 OpenAI 数学早就很强都完全不知道的人说自己「 01/24 22:17
699F:→ bj45566 : 谨慎」 wwww wwww 01/24 22:17
700F:推 bj45566 : 看到无脑的____ 被狠狠打脸就觉得爽快是人之常情吧 01/24 22:18
701F:→ bj45566 : wwww 01/24 22:18
702F:推 loveyou9527 : 兄弟 听我说 这个ds 有料 01/24 22:21
703F:→ yunf : 真的没什麽好争的 就看你能拿它来做什麽 有真的带来 01/24 22:21
704F:→ yunf : 创造性的价值 那就是对你有利的 01/24 22:21
705F:推 lon0623 : 料敌从宽也不是坏事阿,多多想台湾有什麽能介入的 01/24 22:22
706F:→ yunf : 黑猫白猫会抓老鼠的就是好猫 01/24 22:22
707F:→ yunf : 如果他再厉害不能为你所用也是没用 01/24 22:23
708F:嘘 verydolungbe: 支那XDXDXD 听听就好 01/24 22:23
709F:→ yunf : 谢逊拿了屠龙刀双眼失明 顶多拿来砍树 01/24 22:24
710F:推 lon0623 : 中国景气不好有时对科研反而有好处,逼人去研究 01/24 22:24
711F:推 s800525 : 有更好的算法能产生更快投入市场,就会有更多厂商愿 01/24 22:24
712F:→ s800525 : 意堆更多硬体来抢占市场,永远没人在嫌硬体效能过剩 01/24 22:24
713F:→ s800525 : 的 01/24 22:24
714F:嘘 heart9677 : 想想半导体造假,先观望一下好了 01/24 22:24
715F:→ yunf : 没有不好好吗 每天那麽多人张口就是要吃饭 01/24 22:25
716F:→ yunf : 吃的用的没少过 只是没有以前这样乱花 01/24 22:25
717F:推 k91011022 : 资料都被分析完 那就有可能走向预测了 01/24 22:25
718F:推 mamorui : 很快的。论文1、2个月内会有一堆去证明。 01/24 22:26
719F:→ lon0623 : 连他们自己一堆人都在说景气下行了,不用否认 01/24 22:26
720F:推 s800525 : 这个方法好,那当所有人都用这方法,那最後不是还是 01/24 22:26
721F:→ s800525 : 拚谁堆的硬体多? 01/24 22:26
722F:推 knml : 自己去用用看不就得了,免费 01/24 22:26
723F:→ lon0623 : 要推广给更多人用,还是要硬体阿 01/24 22:27
724F:→ lon0623 : 甚至能普及的话,硬体需求更多 01/24 22:28
725F:推 mamorui : 是要看验证数据 不同篇会用不同场景要解决的问题去 01/24 22:28
726F:→ mamorui : 验证 我不可能自己去弄那个资料 01/24 22:28
727F:推 s800525 : 现在反而怕应用普及不了到一般消费者,硬体需求反而 01/24 22:28
728F:→ s800525 : 昙花一现,真能更快达到普及至消费端,硬体需求才真 01/24 22:28
729F:→ s800525 : 的会井喷 01/24 22:28
730F:推 ab4daa : $$$$$$$$$$$$$$$ 01/24 22:29
731F:→ Rickyyy : 裁员滚滚,股价又可以喷喷 01/24 22:29
732F:→ lon0623 : 这就跟省油车出来,汽车反而卖更好的道理依样 01/24 22:29
733F:推 js52666 : 小金库被拆了 01/24 22:30
734F:推 goal56 : 中国人比较卷 赢美国早晚的 01/24 22:30
735F:推 lon0623 : H800 GPU不也是NV的吗? 01/24 22:31
736F:→ yunf : 半年整个指数涨了快¼你说经济很差? 01/24 22:32
737F:推 s800525 : H800效果就很好,那用GB200不就飞天了? 01/24 22:33
738F:推 minazukimaya: 模型是科研 应用是商业 其实这两件事关连不大~~ 01/24 22:33
739F:→ minazukimaya: 商业上 还是拥有直接面对消费者布署能力和通路的巨 01/24 22:34
740F:→ minazukimaya: 头们优势最大 01/24 22:34
741F:→ yunf : 1990年到现在涨了10倍 01/24 22:36
742F:→ thigefe : 左等台积腰斩 01/24 22:36
743F:推 s800525 : 港股一年来涨了26.20%,但5年来跌了28.21%,所以说 01/24 22:37
744F:→ s800525 : 经济不好没问题吧?而且比疫情时期还低就更惨了... 01/24 22:37
745F:→ yunf : 那只是一个相对的概念 01/24 22:38
746F:推 lon0623 : 中国政府都在催促国家队进场买股了,这样叫好? 01/24 22:38
747F:→ yunf : 一个人如果有10亿 然後他现在剩下七亿每天跟你说他 01/24 22:38
748F:→ yunf : 很穷 你要同情他吗? 01/24 22:38
749F:→ lon0623 : 他们本来就不是正常股市了,做空还会被政府抓 01/24 22:39
750F:→ yunf : 你可能没有看过1990的大陆 01/24 22:40
751F:→ lon0623 : 1990的人忍耐力一定比现在高很多好吗 01/24 22:40
752F:推 Paulsic : 百万输出 tokens 16 元,输出 API 价格只有 OpenAI 01/24 22:40
753F:→ Paulsic : o1 的 3%。熟悉的味道 01/24 22:40
754F:→ yunf : 那时候他们就已经过得不错了 只是没有现在好而已 01/24 22:40
755F:→ lon0623 : 1990过得不错是平行时空吗? 01/24 22:41
756F:→ lon0623 : 现在一定比35年前好啦,但人民的需求也会上升 01/24 22:42
757F:推 WD640G : 好啦 中吹先给你高潮 01/24 22:42
758F:→ lon0623 : 之前一直吹的解封行情,现在也没了 01/24 22:43
759F:→ yunf : 有吃有喝 有得住 还要怎样? 就是交通不发达 医疗技 01/24 22:43
760F:推 jamesjklin : 烂爆,deepseek错误百出 01/24 22:43
761F:→ yunf : 术不发达 01/24 22:43
762F:推 mamorui : 中国有些团队paper提供无限量用很佛是真的 尤其gen 01/24 22:45
763F:→ mamorui : 多媒体 同事分享过 觉得挖paper最大好处 01/24 22:45
764F:推 bj45566 : 1. 中国现在经济差景气不好;2. 中国中下层百姓过得 01/24 22:45
765F:→ bj45566 : 比疫情前还苦;这些都没错,但是:3. 中国投入科研 01/24 22:45
766F:→ bj45566 : 的经费持续增加;4. 中国 2024 年在顶尖科学和、工 01/24 22:45
767F:→ bj45566 : 程期刊和顶尖 CS 会议的论文发表数持续突破新高 esp 01/24 22:45
768F:→ bj45566 : . Nature, Science 01/24 22:45
769F:推 xkso : 中国东西 先打3折 01/24 22:46
770F:推 JWJerryyy : 刚刚meta ath 看来不影响? 01/24 22:46
771F:推 lon0623 : 景气不好,会让一些人才宁愿去科研阿 01/24 22:46
772F:推 mamorui : 真得先打3折 QQ 01/24 22:46
773F:→ shorty5566 : 蠢鸟也很笨 这东西明明对台湾也好 01/24 22:48
774F:推 holysong : 中国人很卷终获胜?1990日本也过得不错啊 01/24 22:48
775F:→ yunf : 这都他们自己控制的 01/24 22:48
776F:→ shorty5566 : 要是解法一直是堆GPU 你堆得赢那些CSP大厂吗 01/24 22:48
777F:推 lon0623 : 中国民企要存活,基本上就是要走出海外 01/24 22:49
778F:→ yunf : 过度信用扩张的人才会有问题 01/24 22:49
779F:→ shorty5566 : 有deepseek的发表 至少让台湾还有入场券 01/24 22:50
780F:→ lon0623 : 不然国内越卷就越不敢请人,继续恶性循环 01/24 22:50
781F:推 newyorker54 : 我只说一句如果真的那麽好,中国人完全不可能开源, 01/24 22:50
782F:→ newyorker54 : 对标open AI就只是满足自卑感自己吹吹。完全没有原 01/24 22:50
783F:→ newyorker54 : 创性的产品 01/24 22:50
784F:嘘 jasterlin : 唬烂,没底层光靠蒸馏要赶英超美 01/24 22:50
785F:推 MrCool5566 : 怎麽一堆人看到中国就黑 01/24 22:51
786F:推 lon0623 : 美国最大优势其实还是强大的内需 01/24 22:52
787F:→ lon0623 : 那些中国公司产出在好,不进欧美会被自己人卷死 01/24 22:53
788F:推 narotic : 都是中共同路人啦 01/24 22:54
789F:→ newyorker54 : 大家还不够了解中国人吗?又狠又卷又不要脸,文革大 01/24 22:54
790F:→ newyorker54 : 跃进死的人比二战还多,把错都推给毛泽东,那根本是 01/24 22:54
791F:→ newyorker54 : 一个全体人民劣根性的完全展现结果,只怪一个人?? 01/24 22:54
792F:→ newyorker54 : ? 01/24 22:54
793F:→ yunf : 中国会没有内需吗? 而且四倍的人口 01/24 22:54
794F:推 lon0623 : 问题是他们的对手也是中国公司啊 自己人卷死 01/24 22:55
795F:→ newyorker54 : 有人还抹我是中国同路人,笑死!中国六代战机有开源 01/24 22:57
796F:→ newyorker54 : 吗?但是中国人也不要偷着乐,六代机和老美十几年前 01/24 22:57
797F:→ newyorker54 : 就有的F22也不会有优势,看有没有五五波就偷笑了 01/24 22:57
798F:推 bj45566 : 都被美国业界学界大头称赞是 "breakthrough" 了还在 01/24 22:58
799F:→ bj45566 : 「完全没有原创性」,笑死 wwww 讲这句话的人根本 01/24 22:58
800F:→ bj45566 : 不懂什麽什麽叫作原创性 01/24 22:58
801F:→ yunf : 原本就太肥了 nv的算力可能撑不起他们那种演算法 01/24 22:58
802F:→ yunf : 没差就看谁先算出有用的东西 01/24 22:59
803F:→ newyorker54 : 中国是变强了,是世界第二强国,但是民族劣根性永远 01/24 22:59
804F:→ newyorker54 : 去除不掉 01/24 22:59
805F:→ bj45566 : 而且中国领先的 AI 公司的语言模型几乎都是开源让大 01/24 22:59
806F:→ bj45566 : 家下载,远不只 DS,一点常识都没有 wwww wwww 01/24 22:59
807F:推 Paulsic : 看效能和背後的财务模式不觉得恐怖吗 01/24 23:00
808F:推 iaminnocent : Deepseek的模型有借鉴之处,美国人也不是白痴,学 01/24 23:00
809F:→ iaminnocent : 过来调整一下,马上模型就降本增效了 01/24 23:00
810F:→ bj45566 : 美国、欧洲大部分做 AI 研究的也是开源,OpenAI 反 01/24 23:00
811F:→ bj45566 : 而是世界的少数例外 01/24 23:00
812F:→ iaminnocent : 真的OpenAI 真的反而是例外 01/24 23:01
813F:→ newyorker54 : 老黄还称赞华为手机不可思议,中国人不要那麽自卑好 01/24 23:01
814F:→ newyorker54 : 不好?? 等到学界公认再来说吧 01/24 23:01
815F:推 lon0623 : 说不定是美国人过太爽了,人事费用太高 01/24 23:02
816F:推 lusifa2007 : 如果deepseek可以搞到gb200 不是更强 AI永远需要N 01/24 23:02
817F:→ lusifa2007 : V 01/24 23:02
818F:推 bj45566 : 现在 AI 还是离起跑点不远的阶段,当然最後美中谁 01/24 23:02
819F:→ bj45566 : 赢不知道,更有可能是互有擅场 01/24 23:02
820F:→ yunf : 你看你能不能算出一个 比马斯克更棒的火箭系统 01/24 23:02
821F:→ lon0623 : 看一堆影片还说美国科技业过多爽 01/24 23:03
822F:推 Paulsic : 付费打不过open还有人要付钱 01/24 23:04
823F:推 capser : 推开源 01/24 23:04
824F:推 minazukimaya: 组织文化的问题 DeepSeek作得到但是华为腾讯百度没 01/24 23:04
825F:→ minazukimaya: 作到 就说明了这不是中美差异 而是组织文化差异 01/24 23:04
827F:推 iaminnocent : Deepseek的强化学习模式,也是O3的训练模式,所以 01/24 23:05
828F:→ iaminnocent : 等O3公布以後,大家应该又会来比拼 01/24 23:05
829F:→ newyorker54 : open AI算力爆棚钱又多,穷人用穷人演算法自己自嗨 01/24 23:05
830F:→ newyorker54 : !笑死。大腕花几十万玩明星一次,穷人打手枪打到扁 01/24 23:05
831F:→ newyorker54 : 掉,还很得意说不花钱还射比较爽,哈哈 01/24 23:05
832F:→ minazukimaya: 要论软工高手和996的强度 中国大公司比DeepSeek强多 01/24 23:05
833F:→ yunf : 的确是很爽 但是压力也很大 而且整个人的思路都不一 01/24 23:05
834F:→ yunf : 样了 01/24 23:05
835F:→ minazukimaya: 了 这几年骗钱的中国AI公司也没少过 DeepSeek能成功 01/24 23:06
836F:→ minazukimaya: 自然有其公司文化的独特之处 01/24 23:06
837F:推 epicurious : 重点是没有要比美国好啊,差一点点但便宜5倍,美国c 01/24 23:08
838F:→ epicurious : sp厂capex砍下来供应链就崩了 01/24 23:08
839F:推 bj45566 : 看某位美国一流名校女博士天天拍 YouTube 就知道美 01/24 23:08
840F:→ bj45566 : 国高科技业一堆爽缺闲缺... 01/24 23:08
841F:推 newyorker54 : 真正开源的是meta,DS也是拿人家的来改根据开源条款 01/24 23:10
842F:→ newyorker54 : 本来就要跟着开源,中国人有那麽好死,讲一个自己完 01/24 23:10
843F:→ newyorker54 : 全无到有的原创产品开源的再来说自己人格很崇高,不 01/24 23:10
844F:→ newyorker54 : 然看你中国人德行就是垃圾 01/24 23:10
845F:推 lon0623 : 女博士薪水说不定比台积很多主管高了 01/24 23:10
846F:推 bj45566 : 真的不用拿文革和大跃进来嘴什麽民族性,要不然美 01/24 23:11
847F:→ bj45566 : 国的民族性是不是崇尚内斗和蓄奴(-- 当时全欧洲由英 01/24 23:11
848F:→ bj45566 : 国带头都禁止蓄奴了)?? ? 01/24 23:11
849F:→ shorty5566 : 砍capex干嘛 好的模型算法+算力不是更飞天= = 01/24 23:11
850F:→ shorty5566 : 除非你觉得AI已经发展到尽头了 不然算力永远都不够 01/24 23:12
851F:推 lon0623 : 美国有些人事成本真的太高了,还有搞啥DEI 01/24 23:12
852F:推 minazukimaya: 对啊 算法改进了效率变好 第一直觉当然是再放大模型 01/24 23:12
853F:→ shorty5566 : 好的算法+更强的算力那才是事半功倍 买越多省越多 01/24 23:13
854F:→ minazukimaya: 或是再加训练集吧 对BigTech来说... 01/24 23:13
855F:→ shorty5566 : 更何况新的ai server功耗算力那些都是屌打前带 01/24 23:13
856F:→ lon0623 : 其实美国有对手才是好事,不然DEI一定继续嚣张下去 01/24 23:13
857F:→ shorty5566 : 而且直觉是 DS让入门门槛降低 反而很多小公司能进来 01/24 23:14
858F:→ shorty5566 : 这样整个生态系才能蓬勃发展 01/24 23:14
859F:嘘 jonnysun : 咦,AI本来就只有国人最显发明的 01/24 23:14
860F:→ shorty5566 : 多点开花绝对比集中在那些大CSP好啦 01/24 23:15
861F:→ lon0623 : 小公司进来也是要努力的目标,而且他们更仰赖NV 01/24 23:15
862F:→ shorty5566 : 不然以後只有中美能玩 那对供应链风险才大 01/24 23:15
863F:推 bj45566 : 廿年前的中国和现在的中国就已经是两个世界,那时 01/24 23:16
864F:→ bj45566 : 候中国在顶尖科学、工程期刊的论文发表甚至还输台湾 01/24 23:16
865F:→ bj45566 : (现在赢几百倍),工厂只能做些纺织业、鞋袜雨伞、小 01/24 23:16
866F:→ bj45566 : 灯泡 vs. 2024 年的中国连商用的 MRI, PET-CT 都会 01/24 23:16
867F:→ bj45566 : 做了,成本是欧美产品的 1/10 01/24 23:16
868F:推 minazukimaya: 嗯...但说真的模型只是科研 还是很烧钱的科研 01/24 23:16
869F:→ lon0623 : NV打造的客制化模型是可以让更多小公司入场 01/24 23:17
870F:→ minazukimaya: 说不定笑到最後的还是像Apple这种 掌握了通路的 01/24 23:17
871F:→ yunf : 所以你说他们经济不好吗? 01/24 23:17
872F:→ minazukimaya: 毕竟你科研再强 没有接触消费者的通路还是没钱赚 01/24 23:17
873F:→ lon0623 : 人家都说中国景气不好了 就你在坚持 01/24 23:18
874F:推 bj45566 : 果然无知就是力量 wwww LLM 最先开源的是 Google 好 01/24 23:18
875F:→ bj45566 : 吗 -- 那时候的 Meta 重心还放在元宇宙呢! 01/24 23:18
876F:→ yunf : 很可惜的就是他不是真的掌握通路通路是会变的钱是长 01/24 23:18
877F:→ yunf : 脚的 01/24 23:18
878F:推 geniusw : 中国人牛逼 01/24 23:19
879F:→ yunf : 就跟你说这就是一个话术 看你从哪一个时间点去看这 01/24 23:19
880F:→ yunf : 件事 01/24 23:19
881F:→ lon0623 : 那跟景气是两回事,现在中国经济问题是不敢雇人 01/24 23:20
882F:→ lon0623 : 工作还要花钱去买的 01/24 23:20
883F:→ yunf : 甚至以後用分析人的语言或者是新闻这都是一个关键点 01/24 23:20
884F:→ yunf : 他只要使用的是比较词就可以直接略过 01/24 23:20
885F:→ yunf : 就是一个试图混淆含糊不清的概念 01/24 23:21
886F:→ lon0623 : 你只看生产端,但景气是要看市场的 01/24 23:21
887F:推 bj45566 : 中国现在经济不景气、老百姓日子普遍变差和中国政 01/24 23:22
888F:→ bj45566 : 府持续增加科研经费,中国在科技领域越来越强是可以 01/24 23:22
889F:→ bj45566 : 并存的事实好吗 01/24 23:22
890F:推 lon0623 : 是可以并存没错啊,不过这些产出还是要出口才行 01/24 23:23
891F:→ yunf : 叫他们想想1990年的自己就不会觉得现在有多差 01/24 23:23
892F:→ lon0623 : 世界上很多产出很好的国家,但找不到出海口,结果就 01/24 23:24
893F:→ yunf : 你看他A股指数 1990/12/31 才127.610 01/24 23:24
894F:推 bj45566 : 中国要变成工业大国、科技大国是远从江泽民时代就开 01/24 23:24
895F:→ bj45566 : 始一直持续的规划目标,小学生皇帝虽然在很多地方 01/24 23:24
896F:→ bj45566 : 很蠢,在这个目标上仍然是萧规曹随 01/24 23:24
897F:→ lon0623 : 是动用武力打市场,但现在不可行了 01/24 23:24
898F:→ lon0623 : 所以这是美国的优势,因为美国有大市场 01/24 23:25
899F:→ yunf : 到2025/01/24 3409.010 01/24 23:25
900F:→ lon0623 : 不可能有人想再去过1990的生活啦,那会造反了 01/24 23:26
901F:→ lon0623 : 叫你去我看你会不会闹 01/24 23:26
902F:→ yunf : 打七折而已 01/24 23:26
903F:→ yunf : 那时候也能活 现在的人就是贪婪不知足 01/24 23:27
904F:→ TaiwanUp : github.com/deepseek-ai/DeepSeek-V3/issues/12 01/24 23:27
905F:→ lon0623 : 尤其是中国的1990,那时候返乡探亲的人说根本噩梦 01/24 23:27
906F:→ lon0623 : 你骂不知足 那怎麽不乾脆停止发展就好了 01/24 23:28
907F:→ TaiwanUp : GitHub上的DeepSeek Issue12有提到根本不是开源模型 01/24 23:28
908F:→ yunf : 所以你看中国经济 是不是又有不一样的深度 01/24 23:28
909F:→ lon0623 : 同事有人爸爸是外省老兵,返乡说那是什麽鬼环境 01/24 23:29
910F:→ yunf : 从你一开始说的经济不好是不是又多了一个时空维度 01/24 23:29
912F:→ TaiwanUp : 只是开放使用而已 01/24 23:30
913F:→ yunf : 这就是我说的他使用比较词的时候 让你产生了一个脑 01/24 23:30
914F:→ yunf : 补的概念 01/24 23:30
915F:推 mamorui : DS的测试数据有非数学、逻辑、代码的数据集吗 看到 01/24 23:32
916F:→ mamorui : 几个分享的都只有针对这类 想看点别数据集的实验数 01/24 23:32
917F:→ mamorui : 据 01/24 23:32
919F:推 lponnn : 希望是真的 干趴好美 01/24 23:35
920F:→ yunf : 以後你在看新闻的时候看到他使用比较词这种模糊的概 01/24 23:37
921F:→ yunf : 念的时候就可以立刻有所反应! 多练习几次就知道很 01/24 23:37
922F:→ yunf : 好用甚至你还可以建立词库 什麽%呀都是一个可以被动 01/24 23:37
923F:→ yunf : 手脚的魔术数字 01/24 23:37
924F:→ yunf : 板上不是有一个计算机大师吗 他就很喜欢提出一些他 01/24 23:38
925F:→ yunf : 自己都没有验证过的数据 01/24 23:38
926F:→ yunf : 你只要比他清楚 就不会被他唬烂 或者是你的基础观念 01/24 23:39
927F:→ yunf : 很好 也不容易被唬烂 01/24 23:39
928F:推 greattower : 真正被挑战的是特斯拉,上述这些公司都还不是很接 01/24 23:41
929F:→ greattower : 近 01/24 23:41
930F:→ yunf : 这就是为什麽三岁小孩子好骗 因为他们不具备这些基 01/24 23:42
931F:→ yunf : 础辨识能力 甚至要到监识能力 01/24 23:42
932F:→ TaiwanUp : 其实还是不建议贴这个网站的东西 宣传度比较高 01/24 23:43
933F:→ yunf : 看记者署名就知道 01/24 23:45
934F:→ yunf : 就当笑话看看就好 没有任何机构背书 01/24 23:45
935F:推 ipadpro2 : 很像台湾的迂腐体制 一群大头只会出张嘴领高薪 难怪 01/24 23:46
936F:→ ipadpro2 : 没效率 01/24 23:46
937F:→ EDFR : 遥遥领先 wwwwwwwwwwwwwww 01/24 23:48
938F:推 skyyo : 会不会deepseek里面真的是工人智慧 真人线上选择AI 01/24 23:49
939F:→ skyyo : 生成的几个选项 01/24 23:49
940F:→ yunf : 等你老了就知道什麽叫做心有余而力不足 再也不是那 01/24 23:49
941F:→ yunf : 个可以一天工作17~18小时的超人但那种战斗力所留下 01/24 23:49
942F:→ yunf : 来的成就感你还会记得这个时候你可能会找新鲜的肝来 01/24 23:49
943F:→ yunf : 补足那种感觉可惜你发现你找来了一堆天线宝宝 01/24 23:49
944F:推 a123274 : 中国可以用美国的模型去训练,当然成本低 01/24 23:50
945F:→ yunf : 他就跟你讲说他是deepsick了 01/24 23:50
946F:→ TaiwanUp : Meta本来就该紧张 也不用紧张 本来就没赚魔改又如何 01/24 23:51
947F:→ yunf : 所有的人工智慧到最後都是为了等待救世主的出现而做 01/24 23:52
948F:→ yunf : 的准备 01/24 23:52
949F:推 tchialen : 背後是人体计算机 (误) 01/24 23:54
950F:推 aaronpwyu : 这代表不只元团队是小伦 AI团队也是? 01/24 23:54
952F:嘘 WillTheWise : 重点不是怎麽train的,是用什麽资料train的 01/24 23:58
956F:→ yunf : 脑成长不是机器的大脑成长 01/25 00:07
957F:推 skyyo : 我也不太信deepseek 目前试用观察中 但必须要说连英 01/25 00:09
958F:→ skyyo : 文都看不懂还能坚持骂的一定是中黑 01/25 00:09
959F:推 aria0520 : meta的主力路线本来就不在LLM上 是lecun的世界模型 01/25 00:11
960F:→ aria0520 : deepseek这些都还是LLM LLM就是条死路 01/25 00:12
961F:→ aria0520 : 文字接龙不可能接出AGI 01/25 00:13
962F:推 lponnn : 用了多少印度人 哈哈 01/25 00:13
963F:推 aria0520 : 现在业界都在LLM耗费钜资穷兵黩武 愿意像meta这样 01/25 00:16
964F:推 s1527 : 怎麽一堆人都是用硬体类比软体 错误的类比会让自己 01/25 00:16
965F:→ s1527 : 显得是愚人 01/25 00:16
966F:推 bella1815 : Meta股价又创新高了,还真是恐慌呢 01/25 00:17
967F:→ aria0520 : 分可观资源给全新路线的几乎没有 01/25 00:17
968F:→ aria0520 : lecun一旦成功 那就会像当年OAI在GPT一样拿到先发 01/25 00:18
969F:→ aria0520 : chatgpt出来之前 全都在搞bert 但oai坚持信念才走出 01/25 00:18
970F:→ aria0520 : LLM和scaling law的新路 追随者们现在又历史重演 01/25 00:19
971F:→ aria0520 : oai自身有能力的RD又都跑光 只剩一堆sales和PM 01/25 00:19
972F:→ aria0520 : 整天在X上false hype, 所以我反而很看好meta 01/25 00:20
973F:→ aria0520 : zuck只要肯继续放权放资源让lecun探索world model 01/25 00:21
974F:→ aria0520 : 那可真的会是有AGI潜力的理论模型 01/25 00:21
975F:→ aria0520 : meta的llm team的确是可能慌 因为本来他们就在和 01/25 00:23
976F:→ aria0520 : lecun的FAIR争资源争算力 这对lecun应该是好事 01/25 00:23
977F:推 c41231717 : 来试试 01/25 00:27
978F:推 spen2005 : Eriker到底在供三小 01/25 00:29
979F:推 lovepork : aria到底在讲什麽?你直接回一篇吧? 01/25 00:30
980F:推 wen880225 : 中国取得科技领先有可能,但中国科技领先不可能 01/25 00:31
982F:→ aria0520 : 讲得太业内了吗?XD 01/25 00:32
983F:→ aria0520 : 随手抒发一下而已 没打算回一篇 01/25 00:34
984F:推 godevilyu : 不得不说中国软体真的强..要不是硬体被制裁.. 01/25 00:35
985F:→ yunf : 他就算有AGI要怎麽用还是个问题他到底是个疯狂科学 01/25 00:36
986F:→ yunf : 家还是任性的小女孩? 01/25 00:36
987F:推 coolmark01 : 中国的现况应该都只能想办法弯道超车,尤其在硬体被 01/25 00:37
988F:→ coolmark01 : 限制的情况之下 01/25 00:37
989F:→ yunf : 就跟老鼠一样一直站在牛的头上 然後快到终点的时候 01/25 00:38
990F:→ yunf : 再跳下来说他是第一 01/25 00:38
991F:推 lovepork : 我好奇,印度的软体业不是很强? 01/25 00:38
992F:→ lovepork : 怎麽AI好像没搞出什麽行头? 01/25 00:39
993F:→ yunf : 所以你就要知道其实他们一直都在布一个大局 01/25 00:39
994F:推 ochyi : 有人跟我一样想到人矿吗 ? 01/25 00:39
995F:→ yunf : 你想得到的别人都想过了 你想不到的别人都在默默进 01/25 00:40
996F:→ aria0520 : 软体跟AI不是同个概念 软体有前後端有系统整合 01/25 00:40
997F:→ yunf : 行中 01/25 00:40
998F:→ yunf : 你看全球领导人物有多少人是印度人 01/25 00:41
999F:→ lovepork : 反而是软体业不出色的中国人在AI窜出 01/25 00:41
1000F:→ aria0520 : 但本质上都是码农 顶多演算法很强优化建构能力强 01/25 00:41
1001F:→ aria0520 : AI需要的人本质上是研究员 看paper发paper 01/25 00:41
1002F:→ yunf : 你再偷也没有用 最後也只是别人故意给你偷的 就好像 01/25 00:42
1003F:→ aria0520 : 中美的AI论文量本来就不相上下 在这波浪潮前也是 01/25 00:42
1004F:→ c41231717 : 小玩了一下 自己玩起来的感觉是资料库的限制比几个 01/25 00:42
1005F:→ yunf : 作业系统一样故意让盗版没关系 01/25 00:42
1006F:→ c41231717 : 大头AI的限制少 其实美国人有发现问题啦 不然阿川 01/25 00:43
1007F:→ yunf : 别人只利用你的人力和资源 来完成这些东西 01/25 00:43
1008F:→ c41231717 : 怎会签署松绑AI限制的法案 deepseek的品质还不错 01/25 00:43
1009F:→ aria0520 : 说实在在LLM这条死路上谁冲的快不怎麽关乎大局就是 01/25 00:43
1010F:推 bj45566 : 印度软体强?他们接的主要是中低阶代工单(来自美国 01/25 00:44
1011F:→ aria0520 : 顶尖labs教授不要再让学生去蹭LLM养出一堆产废才是 01/25 00:44
1012F:推 Page122 : 真的屌 技术帝的胜利 01/25 00:44
1013F:→ bj45566 : 、日本) -- 你会觉得帮政府机构架网站的人软体强吗 01/25 00:44
1014F:→ bj45566 : ?印度的理工强者大部分都去美国英国了... 01/25 00:45
1015F:→ aria0520 : 真的 过去一年来这个弊端开始显现了 new grad清一色 01/25 00:45
1016F:→ c41231717 : 辅助吧 AI双面刃 如果拿来产虚假数据的话 基本上就 01/25 00:45
1017F:→ aria0520 : 都在搞LLM 研究主题不如过去十年的多样 01/25 00:46
1018F:→ c41231717 : 变成毒药了 但拿来分析实打实的研究数据是很有用的 01/25 00:46
1019F:→ bj45566 : 不过随着印度慢慢崛起,未来很有可能看到改变 -- 印 01/25 00:46
1020F:→ c41231717 : 工具 01/25 00:46
1021F:→ bj45566 : 度的 Nature Index 成长的很快,目前已经远胜台湾世 01/25 00:46
1022F:→ bj45566 : 界第九 01/25 00:46
1023F:→ aria0520 : 等所有公司都在这条死路封顶後我看这群何去何从 01/25 00:46
1024F:推 fukku100 : DeepSeek r1 14b 的效果真的不错 01/25 00:47
1025F:→ bj45566 : 「AI需要的人本质上是研究员 看paper发paper」 +1 01/25 00:47
1026F:嘘 L1ON : 机翻吗?文章看得很痛苦 还好有原文 01/25 00:48
1027F:推 bj45566 : aria0520 板友绝对是 AI 巷子内的 01/25 00:49
1028F:推 WWIII : 空爆脸书 01/25 00:50
1029F:推 bj45566 : 现在 EE/CS 即使是难度最巅峰的 ACM STOC 都可以看 01/25 00:53
1030F:→ aria0520 : 是 有感而发XD 01/25 00:53
1031F:→ bj45566 : 见来自印度的论文了,在五六年前简直不可思议... 印 01/25 00:53
1032F:→ bj45566 : 度在科研方面的投入明显增加许多,成果也慢慢展现出 01/25 00:53
1033F:→ bj45566 : 来了... 01/25 00:53
1034F:推 bj45566 : CS 之前从来没有一个子领域论文研究和实战能力像 AI 01/25 00:55
1035F:→ c41231717 : 印度仔这几年很多有钱人啦 旅游碰到都有感 小费都 01/25 00:55
1036F:→ bj45566 : 那麽紧密相连过 01/25 00:55
1037F:→ c41231717 : 给一百镁的 吓死人 01/25 00:55
1038F:→ yunf : 印度种姓制度你可能遇到他第二等的那种 01/25 00:57
1039F:推 bj45566 : (EE 则是一直都有,例如最明显的 Info. Theory 领 01/25 00:58
1040F:→ bj45566 : 域论文研究 <-> 人类通讯编码、影音压缩的实战技术) 01/25 00:58
1041F:→ yunf : 暴发户也是很多 你看委内瑞拉30年前和现在 01/25 00:58
1042F:推 li11223344 : 中国就Cost down专业啊..半价买到8成效能还是很吸 01/25 00:59
1043F:→ li11223344 : 引人吧 01/25 01:00
1044F:推 ypc1994 : 绿蟾蜍:台湾技术先进 AI没发展只是没钱 01/25 01:00
1045F:→ yunf : 现在他们就是要你一直用A I一直要电 然後你就自己去 01/25 01:03
1046F:→ yunf : 找电弄碳权 自己拔树破坏生态系 最终就是一堆人生病 01/25 01:03
1047F:→ yunf : 新型态的病菌正在悄悄地进入你的生活圈 01/25 01:04
1048F:推 bj45566 : 又再把 "breakthrough" 转移概念到 "cost down" 了 01/25 01:05
1049F:→ bj45566 : wwww wwww 01/25 01:06
1051F:→ Royalweger : 那麽重要的是多空蛙,分别有哪几支标的能参考的呢 01/25 01:06
1053F:→ yunf : 这里绝大部分的人都不讨论估值问题 01/25 01:11
1054F:→ yunf : 这个东西有没有发展对於企业或者是产业到底能增加多 01/25 01:12
1055F:→ yunf : 少估值? 01/25 01:12
1056F:→ yunf : 现在的A I也都还没有开放这一块 01/25 01:13
1058F:→ yunf : 个画面 01/25 01:15
1059F:→ yunf : 照理来说他结果怎麽形成的这个过程应该都是被严格控 01/25 01:16
1060F:→ yunf : 管的 01/25 01:16
1061F:推 Aquarius126 : 台湾搞AI的都跑出国了吧 01/25 01:18
1062F:→ newwu : ㄜ 有人的英语阅读能力... 01/25 01:21
1063F:推 iamdemonic : 集体耍废被发现了 我要笑死 01/25 01:34
1064F:推 event1408472: 不用那麽多显示卡了 台积电G 01/25 01:44
1065F:推 st950127st : 赢麻了 先存着论文 明天看 01/25 01:55
1066F:推 pleasepo : 人家程式都开源也可以接受国际验证,这样也叫吹? 01/25 01:55
1067F:→ pleasepo : 当初韩国吹常温超导体,结果没有一间实验室可以验证 01/25 01:56
1068F:→ pleasepo : ,这就是造假。 01/25 01:57
1069F:→ pleasepo : 印度软体强没错,但是都是受雇西方国家,加上没有资 01/25 01:58
1070F:→ pleasepo : 金,无法发展。 01/25 01:58
1071F:推 a731977 : 笑死,有人英文看不懂,哈哈 01/25 02:16
1074F:嘘 ilycychien : 快跌好不好 最看不懂在涨什麽的东西 01/25 02:58
1076F:→ yunf : 开飞机 可是重点是你又不是教练你怎麽知道这个细节 01/25 03:13
1077F:→ yunf : 和步骤有没有问题 这个就事实查核有趣的地方 01/25 03:13
1078F:推 hyperyoujo : 大家这麽震惊干嘛,这不就中国日常,这新闻只是说 01/25 03:27
1079F:→ hyperyoujo : 明AI技术成熟的比较快而已,一个制成(包含软体) 01/25 03:27
1080F:→ hyperyoujo : 一向都是只要成熟了就没有其他国家能卷赢中国了, 01/25 03:27
1081F:→ hyperyoujo : 就这麽单纯而已 01/25 03:27
1083F:推 ezezpz : 请大家快跑让我捡便宜 01/25 05:02
1084F:推 vindiesl2000: 美国ai本就是华西街炒股工具 01/25 05:46
1085F:嘘 darktasi : 中国或成最大赢家 01/25 06:12
1086F:推 lanszul : 科技越发达,工业越全面,通缩才正常,只有沙雕才会 01/25 06:16
1087F:→ lanszul : 信美国通膨那套理论,美国人现在都打两份工才能生存 01/25 06:16
1088F:→ lanszul : ,谁比较惨还看不出来吗? 01/25 06:16
1089F:推 JT0624 : 不然美国为什麽要限制中国AI晶片 因为早就输了 01/25 06:42
1090F:推 PttWaHaha : 台湾负责卖铲子发大财,其他国家自己去卷AI…赢麻了 01/25 07:12
1091F:→ PttWaHaha : …… 01/25 07:12
1092F:推 justin200428: 白人怕输 到时发核弹 01/25 07:26
1093F:→ justin200428: 老黄太聪明了 01/25 07:27
1094F:推 Aixtron : AI幻觉 01/25 07:40
1095F:推 NgJovi : AI泡泡@@ 01/25 07:43
1096F:推 supisces : 利好meta,发现人力可以少一半,而且效能多好几倍。 01/25 07:43
1097F:推 Lhmstu : meta 爽太久吧,冗员多 01/25 07:51
1098F:→ howardyeh : 我认为只是脸书自己的问题,之前搞元宇宙就觉得他们 01/25 07:59
1099F:→ howardyeh : 研发审核毫无章法,一堆普普的东西居然也敢拿出来大 01/25 07:59
1100F:→ howardyeh : 吹特吹 01/25 07:59
1101F:推 k1k1832002 : 其实最大冲击大概是原本认为落後五年甚至超过的人 01/25 08:01
1102F:推 k798976869 : meta现金多啊 根本不急 靠卖诈骗广告补血 01/25 08:01
1103F:嘘 deepdish : 帮翻译:请给我黄金 01/25 08:04
1104F:推 Lhmstu : 记忆中meta不是要裁员了吗,考核後10%打算全砍 01/25 08:04
1105F:推 s213092921 : 一堆仇中酸民不愿面对现实,你们得赶快习惯,今年中 01/25 08:19
1106F:→ s213092921 : 国科技会一堆井喷爆发^^ 01/25 08:19
1107F:推 losage : 冗员:干干干,要被发现了 01/25 08:44
1108F:推 peter6666712: 牢美白猪不行很久了 只能靠祖国人跟阿三撑着 01/25 08:54
1109F:→ peter6666712: 现在老川还卡移民 我看五年内牢美要完 01/25 08:54
1110F:→ newwu : 成本是不是那麽低还很难说,他们看起来没有公开详 01/25 09:02
1111F:→ newwu : 细训练细节 01/25 09:03
1112F:嘘 jamesho8743 : 开源就不是抄? 01/25 09:05
1113F:嘘 atlaswhz : 每天都在赢 01/25 09:11
1115F:推 a6976933 : 笑死 到时候发现根本不用这麽多铲子 直接崩盘 01/25 09:23
1117F:→ FatFatQQ : 美国科研早落後了 还领先30年 01/25 09:31
1118F:推 topfree : ..上面那位一直吵的英文能力真的有问题 01/25 09:36
1119F:推 hololive45P : 不用大量显卡+低硬体,怎麽办到的,有点神奇 01/25 09:54
1120F:→ lineak : 我觉得对各家是利多, 裁员人数上升。 导入的门槛 01/25 09:55
1121F:→ lineak : 降低 01/25 09:55
1123F:→ mamorui : 等都会对了再说 01/25 10:23
1124F:推 clou : 先保留吧 有没有懂的乡民可以说明低成本怎麽做到的 01/25 10:26
1125F:推 TaiwanUp : 中国伪论文产量多而已 根本不堪检验 01/25 10:28
1126F:推 mamorui : 他就是只做後训练 烧钱的是预训练 01/25 10:32
1127F:推 mamorui : 借用李鸿毅老师的课程分类简单让一般人理解 01/25 10:36
1129F:→ mamorui : 应该说是DeepSeek r1, 我不是说v3 01/25 10:41
1130F:推 scccc : 没事。美国会禁的 01/25 10:49
1131F:推 mamorui : 然後测试gpt不是用4o、要用o3, 譬如DS v3可以对gpt 01/25 10:51
1132F:→ mamorui : 4o, DS r系列是对标ChatGPT o系列 01/25 10:52
1133F:推 kotorichan : 主打便宜上百倍,堪用啊 01/25 11:04
1134F:→ kotorichan : 先求有就好 看能不能带动中产晶片 01/25 11:05
1135F:推 TaiwanUp : 八卦有篇论文被撤稿率 中国被撤几乎是2-18名加总 01/25 11:17
1136F:推 mamorui : 中国真的不少就是论文模型上HF不限次免费佛心给用 01/25 11:23
1137F:→ mamorui : ,不过标竿还是gpt,所以再说吧 01/25 11:23
1138F:→ FatFatQQ : 数据都是验证过的 还再产量多 快笑死 文组是标案领 01/25 11:39
1139F:→ FatFatQQ : 太多还在睡吗 01/25 11:39
1140F:→ FatFatQQ : 数据还是要现实世界验证过的才能使用 你一直靠AI搞 01/25 11:41
1141F:→ FatFatQQ : 不一定会跑出真的东西 AI+实用数据互相支持 01/25 11:41
1142F:→ FatFatQQ : 才能一直快速迭代 01/25 11:41
1143F:嘘 reasonal : 中国人力成本可以各种压低,国外怎麽可能复制 01/25 11:54
1144F:推 iansrc : 让子弹飞一会 美国科技业又不是纸糊的 很需要这种 01/25 12:04
1145F:→ iansrc : 当头棒喝 01/25 12:04
1146F:推 david54001 : 中国的肝也不盖的 01/25 13:37
1147F:→ Tatsuya72 : 自掘坟墓,嘻嘻 01/25 13:39
1148F:推 Brioni : 可以确定的是AI这块中国领先整个亚洲 01/25 13:41
1149F:→ zer0319 : 所以是软硬体商一起在洗估值吗 01/25 13:48
1150F:推 kdh : 分别问DS和GPT,中国适合民主吗?DS会吹嘘中国,GPT 01/25 15:15
1151F:→ kdh : 回答较中性 01/25 15:15
1152F:→ yunf : 便利商店是怎麽战胜杂货店的? 01/25 15:29
1153F:→ yunf : 你们要知道量变後带来的值变早就在估值里 01/25 15:30
1154F:→ yunf : 这就是为什麽他们吹牛不犯法 01/25 15:31
1155F:→ yunf : 但东西却差很多 01/25 15:33
1156F:→ yunf : 时代就这样转换了 老店就这样被卷死了 01/25 15:35
1157F:嘘 kougousei : 这种陷入恐慌文就别闹了 之前google也陷入恐慌 01/25 16:15
1158F:推 toulio81 : 没啥可信度,中国很多产品卖的都比成本还低 01/25 16:23
1159F:推 live1002 : 不过有没有比较好,这串最好笑的是有人英文很烂 01/25 17:49
1160F:→ Jeff1989 : 阿祖:? 01/25 18:41
1161F:→ louis925 : 会不会 training 的时候,把各个 benchmark 答案也 01/25 19:29
1162F:→ louis925 : 一起 train 了? 01/25 19:29
1163F:→ ActionII : 他们恐慌的原因不是被赶上吧,是发现对岸开始卷起 01/25 21:09
1164F:→ ActionII : 来,他们的好日子要到头了 01/25 21:09
1165F:嘘 Brusolo : 又来吹,这麽屌怎麽Meta昨天又创新高,中吹唬烂洨 01/25 22:27
1166F:→ gk1329 : 中国卷成世界赢家 01/25 22:34
1167F:推 bella1815 : 一堆狂喊美国输了完了,做空了没? 01/25 22:47
1168F:→ yunf : 美股是没有涨跌幅限制的 01/26 00:58
1169F:→ yunf : 你根本不知道什麽时候会灌下来 01/26 00:58
1170F:→ yunf : 亚马逊直接清掉魁北克分部 01/26 00:59
1171F:→ wantsleep : 低成本 只要接近大公司的效果 就够了 01/26 02:11
1172F:推 ksjr : 我问chatgpt他会不会被deepseek取代掉结果他给我 01/26 02:58
1173F:→ ksjr : 答非所问开始说废话 chatgpt是不是急了? 01/26 02:59
1174F:推 DREE : 软体可以复制可以抄当然进步快啊!!人力不值钱 01/26 07:20
1175F:→ TaiwanUp : 太低级的问题ChatGPT会帮你润饰掉 这才是大众产品 01/26 11:36
1176F:推 lain2002 : 中国又赢了 01/26 15:38
1177F:推 penolove5566: 做的事情不一样吧,先做出来跟cost down 01/27 02:23
1180F:推 sg1987 : 一个月内翻船 01/27 14:59
1181F:→ skyyo : 笑死 以上中黑ID完全讲错方向 是不是应该开集中下跪 01/27 17:27
1182F:→ skyyo : 道歉讨论串 01/27 17:28
1183F:推 tw19930419 : 回头来看这篇真爽 有人没读书,就喜欢嘴硬 01/27 22:58
1184F:推 s213092921 : 朝圣经典,中黑哭晕在厕所 02/09 23:43
1185F:嘘 dodoro1 : in 05/03 16:59