Stock 板


LINE

三民治以及蟾蜍网红 很喜欢用北一女笔记这个比喻去打DS 应该是当时候收钱 给的文案就是这样写的吧 但是对AI有一点概念的人 看了真的觉得在瞧不起人民智商 根本是在乱喷 对AI有兴趣的 强烈推荐台大李宏毅老师的频道 https://youtu.be/cCpErV7To2o?si=fhemvtkydilYOMwt
https://youtu.be/Q9cNkUPXUB8?si=Sb2uv6f1KWu1XnlC
https://youtu.be/v12IKvF6Cj8?si=KBFxIZn6KfNDNQoR
简单来说 AI的成形分三阶段 比较好的比喻是 第一阶段是生一个小朋友(pretrain) 第二阶段是让他学校上课学习(督导式学习) 第三阶段则是对这位小朋友的回答提供反馈(RLHF), 告诉他哪一个回答比较好 很明显第一步要生出小朋友是比较困难的 要花很多的资源去train一个模型 打造他的样子 捏他的脸型 肤色 外型比例之类的 这也是为什麽OpenAI 和meta花了这麽多钱的原因 而台湾乃至美国的学校所谓的发展AI 大部分都是拿这些Meta开源的模型(小朋友) 去用他们自己的资料去微调参数 有点像是让这些Meta生的小朋友 去不同学校上课 培养出不同个性和学识的小朋友 这个就相当简单 简单到几个礼拜就可以做完 也不用花什麽钱 所以当你看到新闻 说什麽哪个学校或哪个机构发展自己的AI 花的时间少 成本还很低 你可以看看就好 没什麽稀奇的 而 Deepseek 呢? 他是和那些学校和机构一样 拿别人已经生出来的小朋友去上学 就说自己发展出AI了吗? 人家可不是这样 他跟OpenAI 和Meta一样 都是从头开始 自己捏出一个自己的小朋友 生出这个小朋友的成本还极低 而且在运作时 这位小朋友消耗的能量也少 生的时候花的力气少 生出来後吃的东西也少 这是什麽神仙宝宝 这才是各界震惊的原因 Deepseek的确是让人类在AI发展迈进一大步 并不是三民治在那边造谣就可以抹灭 有良知的媒体和政府 应该让人民认知我们自己目前的不足 然後砥砺大家前进 而不是拿一块布把大家眼睛遮住 一直骗说别人只是作弊 我们没有很差 把时间浪费在造谣和口水 倒不如把时间花在了解和学习 人家跑在前面又怎样 努力跟上去就有机会反超 而不是自欺欺人 导致永远地落後 ----------------- 附上懒人包 简单介绍AI成形三阶段 再次感谢李宏毅老师的贡献 http://i.imgur.com/6KO6GvX.jpg ※引述《netflix06 (OK )》之铭言: : 我的理解啦~ : 这就好像一个北一女的笔记本出售, : 有人去读那个笔记, : 可以在考试上接近不错的分数, : 後来又再出售自己的笔记,卖得很便宜, : 然後呢读书方法这种事真的还是讲兴趣跟天份的吧, : 有兴趣的话,可以融会贯通, : 跨领域联想,可以一直举一反三, : 再来,也有底蕴底气的不同, : 西方国家如果做比喻的话就像三代文人家族, : 从祖父开始是哪里的状元在哪里当官, : 有什麽门生人脉再到父辈; : 然後中国就像寒窗苦读, : 不是斗不起, : 是资源掌握跟运用的问题, : 几十几百个寒窗苦读的人, : 让他们都考上状元榜眼探花举人秀才, : 全部加起来,也很难比过三代文人望族世家贵族阶层; : (例如被限制取得先进光刻机) : 再来,个性决定命运, : 这话也能套用在国家民族特性, : 如果将美国跟中国各看成一个人, : 一个是擅长创新而且鼓励自由发展, : 一个是偷窃邀功欺上瞒下,鼓励不公平竞争个性的人, : 这两个人会有什麽发展,其实不难推断, : 回到现实面,科技的发展取决於晶片, : 晶片的IC设计-美国矽谷跟以色列最强, : 晶片的制造-先进制程-台湾台积电最强, : 目前deepSeek 就像刚刚举例抄笔记, : 可以达到AI运算, : 但是实际比较运算能力跟速度, : DeepSeek 还是比不上chatgpt. : DeepSeek 对比 chatgpt : 就像比亚迪追赶特斯拉,每当追上了硬体或软体, : 特斯拉又去研究新的领域, : 无人驾驶技术或机器人发展或太空领域探索。 : ※ 引述《anti87 (天机老和尚)》之铭言 : : 原文标题:日本AI研究第一人这样评价Deepseek : : 原文连结:https://reurl.cc/5DxgVR : : 发布时间:2025/02/13 : : 记者署名:徐潮、铃木健二朗、岩泽明信 : : 原文内容: : : 中国初创企业DeepSeek(深度求索)开发的高性能、低成本生成式AI(人工智慧)大规模 : : 语言模型(LLM)受到了全世界的关注。日本经济新闻(中文版:日经中文网)就如何评 : : 价该公司的最新AI模型、安全性方面的风险、以及对日本企业的影响等问题,采访了日本 : : AI研究领域的第一人、东京大学教授松尾丰。 : : 性能与美国OpenAI接近 : : 记者:您如何评价DeepSeek的技术? : : 松尾丰:技术很出色,性能与运营「ChatGPT」的美国OpenAI接近。(DeepSeek) : : 每次发布新的AI模型,都会发表论文,详细説明模型采用了什麽样的技术,以及花费心思 : : 实施的改进之处。 : : 该公司还同时以(任何人都可使用的)开源方式进行公开。1月发布的最新模型「 : : R1」进行了提升推理能力的强化学习。最终展现出了与OpenAI的「o1」同等的推理性能。 : : 在中国,AI开发十分活跃,孕育实力企业的环境不断扩大(DeepSeek的APP界面,REUTERS : : ) : : 记者:在AI开发方面,美国一直处於领先地位。竞争的势力格局是否会发生变化? : : 松尾丰:作为大前提,中国的AI水准相当高,可以与美国比肩。至少从顶尖(学会 : : 采纳的)论文数量来看,中国已经超过美国。 : : 另外,中国还有阿里巴巴、腾讯、百度等其他很多实力强劲的企业,拥有众多优秀 : : 原文标题:日本AI研究第一人这样评价Deepseek : : 原文连结:https://reurl.cc/5DxgVR : : 发布时间:2025/02/13 : : 记者署名:徐潮、铃木健二朗、岩泽明信 : : 原文内容: : : 中国初创企业DeepSeek(深度求索)开发的高性能、低成本生成式AI(人工智慧)大规模 : : 语言模型(LLM)受到了全世界的关注。日本经济新闻(中文版:日经中文网)就如何评 : : 价该公司的最新AI模型、安全性方面的风险、以及对日本企业的影响等问题,采访了日本 : : AI研究领域的第一人、东京大学教授松尾丰。 : : 性能与美国OpenAI接近 : : 记者:您如何评价DeepSeek的技术? : : 松尾丰:技术很出色,性能与运营「ChatGPT」的美国OpenAI接近。(DeepSeek) : : 每次发布新的AI模型,都会发表论文,详细説明模型采用了什麽样的技术,以及花费心思 : : 实施的改进之处。 : : 该公司还同时以(任何人都可使用的)开源方式进行公开。1月发布的最新模型「 : : R1」进行了提升推理能力的强化学习。最终展现出了与OpenAI的「o1」同等的推理性能。 : : 在中国,AI开发十分活跃,孕育实力企业的环境不断扩大(DeepSeek的APP界面,REUTERS : : ) : : 记者:在AI开发方面,美国一直处於领先地位。竞争的势力格局是否会发生变化? : : 松尾丰:作为大前提,中国的AI水准相当高,可以与美国比肩。至少从顶尖(学会 : : 采纳的)论文数量来看,中国已经超过美国。 : : 另外,中国还有阿里巴巴、腾讯、百度等其他很多实力强劲的企业,拥有众多优秀 : : 工程师。在这样的生态系统中,AI不断得到开发与应用。出现DeepSeek这样极具实力的企 : : 业,并不令人惊讶。 : : 对日本企业来説也是一种鼓舞 : : 记者:您如何看待DeepSeek的出现对日本産生的影响? : : 松尾丰:日本也需要努力开发生成式AI模型。像DeepSeek这样并非大型科技企业、 : : 也没有雄厚资本的公司,竟然能够实现世界最先进的精度,这对日本的初创企业来説也是 : : 一种鼓舞。即便在日本国内,只要紮实地进行技术开发,就有可能实现这样的飞跃。 : : 很多日本的AI初创企业从松尾教授的研究室诞生(2024年10月摄) : : 记者:您如何看待像DeepSeek这样的企业采取开源战略的动向? : : 松尾丰:最初采取开源战略的企业是美国Meta,该公司推出了「Llama」。後来, : : 中国阿里巴巴推出了性能非常高的模型「Qwen(通义千问)」。在日本,基於这两家企业 : : 的模型进行追加学习的动向也十分活跃。如果基础模型紮实,就能轻松提升性能。 : : 不过,开源强大,还是OpenAI及美国谷歌这样的非公开系统强大,竞争始终存在 : : 。哪一方胜出会因状况而变。 : : 这次DeepSeek的出现,使得开源方面的势力得到了很大的恢复。虽然OpenAI及谷 : : 歌拥有性能卓越的非公开模型,但这表明开源也能够做到同样的事情。 : : 安全风险因使用方式而异 : : 美国OpenAI在应对DeepSeek的崛起(首席执行官萨姆· 阿尔特曼,REUTERS) : : 记者:对於利用现有AI模型输出的数据来创建新的生成AI的DeepSeek的「蒸馏」技 : : 术,OpenAI指出这种做法违规。 : : 松尾丰:我不知道情况的真假。在美国企业之间,这样的传闻非常常见。这次也可 : : 能涉及(中美的)政治含义。 : : 记者:您如何看待使用中的安全等风险? : : 松尾丰:是利用DeepSeek的开源还是使用其服务?根据使用方式的不同,风险也不 : : 同。开源可以下载程式并在本地运作。这样的话,数据不可能被发送到某个地方。 : : 另一方面,DeepSeek的APP服务在中国的伺服器上运作。一旦输入数据,这些数据 : : 就会发送到中国的伺服器,在中国进行处理并返回。虽然表示不使用这些数据进行学习, : : 但实际上并不排除使用的可能性。 : : 这点不管对於DeepSeek还是OpenAI来説都一样。这是一个你对对方投以多大信任的 : : 问题。 : : 记者:围绕AI的智慧财産权和资讯泄露问题,中美间的对立似乎还会加剧。 : : 松尾丰:美国(海军和某些州)提出不要使用DeepSeek。但从研究者的角度来看, : : 我并不认为DeepSeek做了什麽特别的事情。相反,我认为他们只是在好好搞技术并将其发 : : 布。 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 223.138.127.23 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1739675543.A.6DA.html
1F:推 bustinjieber: 清晰的比喻 02/16 11:17
2F:推 sonnyc : 好奇如果是自己生出来的 怎麽会回答我是chatgpt? 02/16 11:23
3F:→ sonnyc : 还是其实也是被黑的XD 02/16 11:23
4F:→ LDPC : 因为第三块啊 合成数据原因RLHF用RL取代=_=... 02/16 11:27
5F:推 stlinman : 因为"我是谁"是哲学问题,现在AI还只能靠人喂的资料 02/16 11:30
6F:→ stlinman : 去认知自己。 02/16 11:30
7F:嘘 good5755 : Deepseek也是用别人模型蒸馏出来的好吗= = 02/16 11:30
8F:推 stlinman : 看别人教材自己编讲义有什麽问题吗? 至少学习方法跟 02/16 11:33
9F:推 kirayue : 推台大李宏毅老师 02/16 11:34
10F:→ stlinman : 讲义编法有改良进步啊! 02/16 11:34
11F:嘘 sazabik : 起手势就扯政治,证明这种废文就没可信度 02/16 11:37
12F:→ sazabik : 对於有这种立场的帐号,当废话听听 02/16 11:37
13F:推 ilw4e : DS一个重点就是证明第二阶段不重要,之前花一堆力 02/16 11:37
14F:→ ilw4e : 气在那边人工做教材教,结果发现AI自己就能通了 02/16 11:37
15F:嘘 Rickyyy : 去政黑 02/16 11:38
16F:推 kistar : DS如果不是中国发布,大概就不会有人扯政治了 02/16 11:38
17F:推 s0914714 : DeepSeek v3并不是蒸馏 好奇的是training data来源 02/16 11:38
18F:→ LDPC : 楼楼楼楼上 你认真=_=? 02/16 11:39
19F:→ LDPC : 第三方的open deepseek 搞出自己版本的合成数据了 02/16 11:40
20F:→ LDPC : 现在一堆人杀入如何设计用大模型生数据创造思考 02/16 11:40
21F:→ LDPC : ai真他x卷 今天我看到paper已经提到关键是structure 02/16 11:40
22F:→ TheBeast : 很怀疑就去了解别人的论文 很难? 02/16 11:41
23F:推 s0914714 : 说真的很感慨啦 尤其是唐凤沾沾自喜绕过64议题 02/16 11:46
24F:→ s0914714 : 台湾什麽时候变得这麽沉沦 我们应该赶快发展AI 02/16 11:47
25F:→ s0914714 : 而不是阿Q心态说这又没多强 02/16 11:47
26F:推 WANGSH : 羡慕中国研发能力强大 反观 02/16 11:47
27F:→ LDPC : @@ 买个4090 实作一下 就很有快感啊 去摸摸比吵架好 02/16 11:48
28F:嘘 as6633208 : deepseek 现在问第二次就死,答案还一直幻觉,这东 02/16 11:49
29F:→ as6633208 : 西早就没用了。我现在只想等这个月gpt5 和claude4 02/16 11:49
30F:→ as6633208 : 付好费等他更新 02/16 11:49
31F:推 qazedcrfv : 我只能说用过deepseek 後,真的没想像中的好用,控 02/16 11:51
32F:→ qazedcrfv : 制力真的还不能拿来应用在各种场域中 02/16 11:51
33F:→ as6633208 : 我观察这边deepseek吹的问题,不是生活或工作几乎没 02/16 11:54
34F:→ as6633208 : 真的使用过ai,就是连deepseek都没打开来用过只看新 02/16 11:54
35F:→ as6633208 : 闻,实际要用,gpt claude才是最好的工具,不是deep 02/16 11:54
36F:→ as6633208 : seek这垃圾== 02/16 11:54
37F:推 lon0623 : DS强项是便宜好吗 02/16 11:54
38F:→ lon0623 : 没有你脑补这些 02/16 11:55
39F:→ lon0623 : 而且DS并没有那麽神,会震惊一方面是他从中国来 02/16 11:56
40F:推 godog : 松尾丰说DS技术很出色 楼上说强在便宜 谁是对的? 02/16 11:59
41F:推 lon0623 : 台湾是小国,能选的路线有限,倒不一定要去 02/16 11:59
42F:→ lon0623 : 硬拼AI 02/16 11:59
43F:→ lon0623 : 便宜不算技术出色吗? 02/16 12:00
44F:推 SRNOB : 都对啊 ds不如o1 claude 但是免费 02/16 12:00
45F:→ SRNOB : o1 claude 20/200 镁刀 02/16 12:01
46F:→ lon0623 : 我没有说他不出色啊,但不是原po讲的那样 02/16 12:01
47F:→ SRNOB : o1大概6-10万可以下载在本地端接你的知识库 02/16 12:01
48F:→ SRNOB : 说错ds ds可以你在家自己部署 closeai claude 可 02/16 12:02
49F:→ SRNOB : 不行 02/16 12:02
50F:嘘 alenn : 优化很强 并不代表基础全都自己做耶 MOE才是重点 02/16 12:02
51F:→ SRNOB : 不要671b的甚至一般显卡也能跑 开源就是屌 02/16 12:03
52F:→ SRNOB : 你看上面免费仔网页用一用就判定死亡 02/16 12:04
53F:推 audic : 谁被中国便宜货卷到都没好处,现在在吹什麽,股板 02/16 12:04
54F:推 b05605019 : 推 02/16 12:05
55F:→ SRNOB : 台湾软体实在不行 02/16 12:05
56F:→ audic : 看企业获利,不是看百姓便不便宜 02/16 12:05
57F:→ lon0623 : 但DS只会是AI发展的一个过程 02/16 12:05
58F:→ lon0623 : 远远不会是最终解 02/16 12:06
59F:→ lon0623 : 我不觉得台湾要发展软体,人口不够 02/16 12:06
60F:→ lon0623 : 台湾务实的方法,应该是利用台积的优势发展本土供 02/16 12:07
61F:→ lon0623 : 应链 02/16 12:07
62F:推 duriamon : 你就算讲那麽白话还是一堆人看不懂啦!他们只会中共 02/16 12:07
63F:→ duriamon : 抄袭,还好台湾没有什麽AI软体股,要不然这群人一定 02/16 12:07
64F:→ duriamon : 是韭菜中的韭菜,笑死! 02/16 12:07
65F:→ b05605019 : 小国可以拿人家的东西来改啊,而不是直接禁止啊,当 02/16 12:07
66F:→ b05605019 : 年荷兰打独立战争一样有和哈布斯王朝贸易啊 02/16 12:07
67F:嘘 FK6819 : 台湾学DS干嘛?你先学不发废文先 02/16 12:07
68F:推 SRNOB : 跟着喊 抗中保台 抵制china 02/16 12:08
69F:→ lon0623 : 我们才两千多万人口,怎麽跟人比 02/16 12:08
70F:→ SRNOB : 我们有台积电!! 02/16 12:09
71F:推 alenn : 开源就是站在过去的巨人上优化在优化 meta/MOE都是 02/16 12:09
72F:→ duriamon : 这波AI大语言模型都降低那麽多软体业门槛了,写码成 02/16 12:09
73F:→ duriamon : 本直接爆减,有好的idea都可以靠这波新创起家了,台 02/16 12:09
74F:→ duriamon : 湾还不趁这个机会发展软体产业,有钱赚也不会赚,真 02/16 12:09
75F:→ duriamon : 的棒!呵呵! 02/16 12:09
76F:→ alenn : 就是优化很好的AI演算法 迈一大步有点夸张 哈 02/16 12:09
77F:→ lon0623 : 倒不如去研究光阻剂之类的 02/16 12:09
78F:→ duriamon : 研究光阻剂?认真?专利早就被人家卡死了啦!呵呵! 02/16 12:10
79F:推 stlinman : 会说问第二次就死...大概不知道要调一下对话流设计! 02/16 12:10
80F:→ lon0623 : 看到什麽都想做,只会资源分散 02/16 12:11
81F:→ stlinman : 当然我也认为"花钱无脑用"才是最好商业模式,问题这 02/16 12:11
82F:→ stlinman : 这串是在讨论技术。 02/16 12:11
83F:→ lon0623 : 被卡也要培养啊 02/16 12:11
84F:→ duriamon : 软体产业写程式码是最不会被专利卡的,结果台湾完全 02/16 12:12
85F:→ duriamon : 放弃,连到现在有好的idea喂ChatGPT搞不好程式码就 02/16 12:12
86F:→ duriamon : 生出来了,也不会用,难怪只能花大钱生个点面线,笑 02/16 12:12
87F:→ duriamon : 死! 02/16 12:12
88F:→ lon0623 : 而且AI不一定赚钱,台积供应链是有母鸡的 02/16 12:12
89F:→ lon0623 : 那你怎麽不去研究 02/16 12:13
90F:→ duriamon : 连用AI工具都不会还想研究光阻剂?人家该研究的早就 02/16 12:14
91F:→ duriamon : 搞完了,真的是想太多,研究光阻剂还是洗洗睡吧? 02/16 12:14
92F:→ duriamon : 你知道人家研究光阻剂的都是专利直接卡官能基吗?好 02/16 12:15
93F:→ duriamon : 用的早就没了,还轮到台湾? 02/16 12:15
94F:推 lon0623 : 人家AI都是多少规模的在做,你以为只有写code喔 02/16 12:17
95F:→ lon0623 : 都是几亿人口大国才撑得起来 02/16 12:17
96F:推 duriamon : 软体产业不是只有AI懂吗?用AI来产生服务性软体可以 02/16 12:18
97F:→ duriamon : 大幅降低成本,懂吗? 02/16 12:18
98F:→ lon0623 : 台湾可以做应用面就好了 02/16 12:18
99F:→ lon0623 : 资源有限的小国,不可能面面俱到 02/16 12:19
100F:→ duriamon : 我知道你不懂啦!这也是为什麽国外疯AI,人家国外新 02/16 12:19
101F:→ duriamon : 创懂得花小钱用ChatGPT生成软体,而国内还在我们有 02/16 12:19
102F:→ duriamon : 台积电,呵呵! 02/16 12:19
103F:→ lon0623 : 不然你看其他小国都在做什麽 02/16 12:19
104F:→ lon0623 : 台积电本来就很重要了 02/16 12:20
105F:→ lon0623 : 我讲的才是务实面的东西 02/16 12:20
106F:→ lon0623 : 你发展供应链,才更好去跟人谈判 02/16 12:21
107F:推 Lowpapa : 确实 股版一堆没知识的 02/16 12:21
108F:→ lon0623 : 全台湾才几间实验室 02/16 12:21
109F:→ lon0623 : 你是要台湾实验室都去发展AI跟人拼喔 02/16 12:22
110F:→ duriamon : 软体产业是成本最低的产业,有大脑有一台电脑就可以 02/16 12:23
111F:→ duriamon : 了,知道国外那些科技巨头当初起家时成本多低吗?只 02/16 12:23
112F:→ duriamon : 有台湾还在我们有台积电,笑死! 02/16 12:23
113F:→ lon0623 : 那为何全世界国家几乎都是用美国,一部分中国的软 02/16 12:24
114F:→ lon0623 : 体 02/16 12:24
※ 编辑: enunion (223.138.127.23 台湾), 02/16/2025 12:25:42
115F:→ lon0623 : 软体几乎就是winners take all的东西 02/16 12:24
116F:→ lon0623 : 而且那些软体,还不是很多都要台积晶片 02/16 12:25
117F:→ duriamon : 我觉得讲白了到最後的结论就是台湾人不够聪明,连大 02/16 12:25
118F:→ duriamon : 陆人都屌赢台湾,那个被你是谁你要做什麽的马云起家 02/16 12:25
119F:→ duriamon : 金也超低,但换个方向思考就是台湾当奴工的才能屌赢 02/16 12:25
120F:→ duriamon : 大陆,呵呵! 02/16 12:25
121F:推 DoraGian : 看成日本研究AV第一人 该换眼镜了 02/16 12:26
122F:→ duriamon : 你不会不知道马斯克是南非起家的吧? 02/16 12:26
123F:→ lon0623 : 那你怎麽不叫那些软体业者自己制造晶片 02/16 12:26
124F:→ lon0623 : 拜托,马斯克都跑去美国起家了 02/16 12:26
125F:推 GanKer : 这篇一开始讲得义正严辞,要讲重点时就歪掉了 @@ 02/16 12:26
126F:→ duriamon : 因为不需要,最聪明的大脑负责搞软体,收割奴工代工 02/16 12:27
127F:→ lon0623 : 那马斯克为何不在南非发展 02/16 12:27
128F:→ duriamon : 们的最大利益就好,看看现在就是如此。 02/16 12:27
129F:嘘 as6633208 : 免费的可以回答一堆,但只能做一些不重要的应用,结 02/16 12:27
130F:→ as6633208 : 果重要的商业应用还是要用付费的ai来解答,请问这个 02/16 12:27
131F:→ as6633208 : 免费的到底有降低多少成本?我看起来是徒增成本,de 02/16 12:27
132F:→ as6633208 : epseek 只有一个贡献,就是让gpt和claude 赶快出新 02/16 12:27
133F:→ as6633208 : 一代,真的要使用ds我想还是算了 02/16 12:27
134F:→ lon0623 : 美国中国都很想要晶圆制造好吗 02/16 12:27
135F:→ duriamon : 因为任何一个公司搞大就是要走向世界获取更多投资, 02/16 12:27
136F:→ duriamon : 奇怪我是在跟三岁小孩讲道理吗? 02/16 12:28
137F:→ lon0623 : 奴工奴工的也很好笑,你以为软体不奴吗 02/16 12:28
138F:→ lon0623 : 你讲那麽多道路,怎麽不亲自示范一下 02/16 12:28
139F:→ lon0623 : 道理 02/16 12:29
140F:→ duriamon : 软体奴但是屌赢代工奴,能在矽谷当码农会去intel当 02/16 12:29
141F:→ duriamon : 作业员? 02/16 12:29
142F:→ lon0623 : 你要不要先设计软体来跟我们看一下 02/16 12:29
143F:→ lon0623 : 不是成本很低吗 02/16 12:29
144F:→ duriamon : 讲不赢要放大绝罗?笑死! 02/16 12:29
145F:→ lon0623 : 按照你的聪明才智应该可以吧 02/16 12:30
146F:→ duriamon : 当然可以呀!ChatGPT会用就可以,呵呵! 02/16 12:30
147F:→ lon0623 : 台湾很多实验室研究类神经网路喔 02/16 12:31
148F:→ lon0623 : 要不要加入一下 02/16 12:31
149F:→ duriamon : 那那麽多实验室有多少H100?笑死人! 02/16 12:31
150F:→ smallca : 发展软体 硬体成本不高 但人工成本很高 台湾老板又 02/16 12:31
151F:→ smallca : 觉得人工只值几块钱而已 谁想做? 02/16 12:31
152F:→ lon0623 : 而且已经研究十年以上了 02/16 12:31
153F:→ duriamon : 所以台湾哪个软体公司独占世界市场够强的? 02/16 12:32
154F:→ lon0623 : 我们学弟跟着AI热潮一堆去研究,还造成人才短缺 02/16 12:33
155F:→ lon0623 : 对啊,然後你看结果呢?那些人不聪明吗 02/16 12:34
156F:→ lon0623 : 四大的喔 02/16 12:34
157F:→ lon0623 : 如果你那麽有热忱,可以去试试看啊 02/16 12:35
158F:→ duriamon : 连H100都没几张了,原po讲的台湾AI大咖李宏毅都没几 02/16 12:35
159F:→ duriamon : 张H100,这还只是单纯花钱就可以办到的事,台湾这几 02/16 12:35
160F:→ duriamon : 年不是赚很多钱吗?买不起H100也太奇怪了吧? 02/16 12:35
161F:推 as6633208 : ds你现在架起来,gpt5和claude出下一代表现更好,你 02/16 12:36
162F:→ as6633208 : 架起来硬体的钱不还是浪费==然後你说ds下一代如果不 02/16 12:36
163F:→ as6633208 : 开源,要你付费了,你最终还不是要面临花钱选边站, 02/16 12:36
164F:→ as6633208 : 既然始终要花钱,为什麽不一开始就花钱在最强的那边 02/16 12:36
165F:→ as6633208 : ,美国== 02/16 12:36
166F:→ duriamon : 讲到最後的结论就是什麽都不如人,还是回去我们有台 02/16 12:36
167F:→ duriamon : 积电吧?最简单最能自嗨,笑死! 02/16 12:36
168F:推 lon0623 : 不用买啊,用租的就好了 02/16 12:37
169F:→ lon0623 : 对啊,那你讲到现实面了,要去租显卡,那钱呢 02/16 12:38
170F:推 SRNOB : 要接个人知识库只能本地部署 02/16 12:38
171F:→ lon0623 : 我们有台积电,那为何不跟台积拿钱 02/16 12:38
172F:→ lon0623 : 你说专利,科技业不都专利卡来卡去 02/16 12:39
173F:→ duriamon : ds发展并没有错,因为大陆有那个需求,也有足够资金 02/16 12:39
174F:→ duriamon : 投入并获利(反观更有钱的台湾),而且就算是开源也 02/16 12:39
175F:→ duriamon : 是有获利模式的。 02/16 12:39
176F:→ lon0623 : 高通卡一堆专利,联发科为何还做起来了 02/16 12:39
177F:→ duriamon : 原来台湾没钱呀?现在是终於要承认台湾只有台积电当 02/16 12:40
178F:→ duriamon : 奴工的份了吗?呵呵! 02/16 12:40
179F:→ lon0623 : 只要本土供应商肯研究,台积一定肯出钱的 02/16 12:40
180F:→ duriamon : 因为联发科靠arm公版好吗? 02/16 12:40
181F:→ duriamon : 你知道联发科是靠arm授权的吧?呵呵! 02/16 12:41
182F:→ lon0623 : 最好是那麽简单 02/16 12:41
183F:→ lon0623 : 你以为只有arm就够了喔 02/16 12:41
184F:→ duriamon : 就这麽简单,没有arm授权,联发科直接死,呵呵! 02/16 12:42
185F:→ lon0623 : 你也太小看工程师的能力了 02/16 12:42
186F:→ duriamon : 现在人家高通已经要计画脱离arm,而arm也打算自己生 02/16 12:42
187F:→ duriamon : 产晶片了,还不知道吗? 02/16 12:42
188F:→ lon0623 : 那照你逻辑,高通也一样啊 02/16 12:42
189F:推 HatanoKokoro: 推 02/16 12:43
190F:→ duriamon : 你以为当arm自己推出晶片的时候联发科还吃香喝辣呀 02/16 12:43
191F:→ duriamon : ?笑死! 02/16 12:43
192F:推 lon0623 : 那高通研发了吗 02/16 12:44
193F:→ lon0623 : 还不是靠arm起来的 02/16 12:45
194F:推 duriamon : 人家早期靠arm,但人家知道靠别人终究不稳,所以要 02/16 12:46
195F:→ duriamon : 自己搞了,这麽简单的道理也不懂?现在arm要自己推 02/16 12:46
196F:→ duriamon : 晶片,联发科就会越来越尴尬,呵呵! 02/16 12:46
197F:嘘 as6633208 : 白痴,联发科的ai我用过,很烂,为啥就不能回到产品 02/16 12:46
198F:→ as6633208 : 面到底好不好用来讨论,还是你又要说是国家不投入导 02/16 12:46
199F:→ as6633208 : 致研不出来,但按你逻辑ds开源免费你应该就要做得出 02/16 12:46
200F:→ as6633208 : 屌打gpt和claude 的东西啊== 然後讲一堆,国籍竞争 02/16 12:46
201F:→ as6633208 : 力中美必争的最後还是跑到台积身上,而不是联发科, 02/16 12:46
202F:→ as6633208 : 不觉得你挺的东西很矛盾吗? 02/16 12:46
203F:推 lon0623 : 尴尬?你也想太多了,他们又不是要做手机晶片 02/16 12:47
204F:→ lon0623 : 还是你已经推导出之後要做手机晶片了 02/16 12:48
205F:→ lon0623 : 高通一个影都没有,而且那是跟arm打官司搞出来的 02/16 12:49
206F:→ lon0623 : 你知道发哥现在已经不输高通了吗 02/16 12:50
207F:→ lon0623 : 这还是高通设一堆关卡下做出来的 02/16 12:51
208F:推 duriamon : https://imgur.com/a/PJBCbOb 02/16 12:51
209F:→ lon0623 : 这就证明了,就算卡专利,还是可以发展啊 02/16 12:51
210F:→ duriamon : 人家孙正义可不认为不做手机晶片耶?呵呵? 02/16 12:52
211F:→ lon0623 : 有没有看到考虑两个字 02/16 12:52
212F:嘘 as6633208 : 蛤?所以你是中吹喔?那你移民去中国不就好了== 02/16 12:53
213F:→ lon0623 : 而且那是新闻报导的 02/16 12:53
214F:→ lon0623 : 你确定可信吗 02/16 12:53
215F:→ duriamon : arm不下来自己干,就会输给高通跟苹果的自研晶片, 02/16 12:54
216F:→ duriamon : 最後丧失市场,至於联发科算什麽咖,人家根本不放在 02/16 12:54
217F:→ duriamon : 眼里,笑死! 02/16 12:54
218F:→ lon0623 : 而且我的重点是,我在证明卡专利还是可以研究啊 02/16 12:54
219F:→ as6633208 : 好,赶快移民,没加盖 02/16 12:54
220F:→ lon0623 : 说联发科什麽咖就更好笑,发哥很强了 02/16 12:54
221F:→ duriamon : 下游专利照样被上游专利卡死啦!懂专利研发吗?有申 02/16 12:54
222F:→ duriamon : 请过专利吗?我有喔! 02/16 12:54
223F:→ lon0623 : 你还在发哥低阶的年代? 02/16 12:55
224F:→ duriamon : 你先回答我没有arm授权联发科做什麽手机晶片这个简 02/16 12:55
225F:→ duriamon : 单的问题就好,笑死! 02/16 12:55
226F:→ lon0623 : 这个重点是什麽 02/16 12:56
227F:→ lon0623 : 那高通就不是用arm? 02/16 12:56
228F:→ lon0623 : 如果发哥可以成功,台积供应链为何不行 02/16 12:56
229F:→ duriamon : 你扯来扯去发哥多神,我就直接呛明arm不授权发哥手 02/16 12:57
230F:→ duriamon : 机晶片直接收摊啦!呵呵! 02/16 12:57
231F:→ duriamon : 你知道什麽是自研架构晶片吗?你知道高通苹果在玩什 02/16 12:57
232F:→ duriamon : 麽吗? 02/16 12:57
233F:推 lon0623 : 发哥市占已经超越高通了 02/16 12:59
234F:推 s74109630 : 台湾是拿了一堆钱结果做了一堆粪 02/16 12:59
235F:→ lon0623 : 而且我重点是,就算卡专利,还是可以研发不是吗 02/16 12:59
236F:→ lon0623 : 那你的重点是什麽 02/16 13:00
237F:推 duriamon : 然後呢?发哥靠arm,人家arm现在要自己玩,到底懂不 02/16 13:00
238F:→ duriamon : 懂呀?你知道arm要自己下场是被高通跟苹果逼的吗? 02/16 13:00
239F:→ duriamon : 呵呵! 02/16 13:00
240F:→ lon0623 : 不授权gg没错啊,但这就是合作 02/16 13:00
241F:→ lon0623 : 台积供应链还不是一样,一个环节都不能缺 02/16 13:01
242F:→ lon0623 : 所以今天才要培养台积供应链啊 02/16 13:02
243F:→ duriamon : 高通跟苹果不想再被arm授权卡死,所以自研架构晶片 02/16 13:02
244F:→ duriamon : ,这两大arm客户没了市场份额直接完蛋,arm为了提早 02/16 13:02
245F:→ duriamon : 准备只能自己下场,到时候就会重演HTC跟Google事件 02/16 13:02
246F:→ duriamon : 了,呵呵! 02/16 13:02
247F:→ lon0623 : 然後你又说供应链不行,那你要什麽 02/16 13:02
248F:推 qasaq : 政府一些公部门都禁止用大陆AI!呵 02/16 13:02
249F:→ lon0623 : 这个不是新闻脑补而已吗 02/16 13:03
250F:推 hcwang1126 : 试管婴儿 跳过最花钱的爱爱(误 02/16 13:03
251F:→ lon0623 : 那你觉得供应链不行的地方在哪里 02/16 13:03
252F:嘘 chysh : 自己生出来的小孩,回答自己是chatgpt???是不是被戴 02/16 13:04
253F:→ chysh : 绿帽了 02/16 13:04
254F:→ duriamon : 做代工不是唯一,还搞不懂喔?为什麽现在台积电危险 02/16 13:04
255F:→ duriamon : 了,因为你全部关键被美国上游技术跟盟友原物料卡死 02/16 13:04
256F:→ duriamon : ,管你供应链整合多强,川普拳头下去,你就是奴才, 02/16 13:04
257F:→ duriamon : 呵呵! 02/16 13:04
258F:嘘 as6633208 : 好可怜,明明出生的时候都是为了自己的生存而活,结 02/16 13:05
259F:→ as6633208 : 果读书时被思想灌注洗脑成自己的性命来自於国家,要 02/16 13:05
260F:→ as6633208 : 你舍弃你身为生物的本性,让你现在心甘情愿为国家死 02/16 13:05
261F:→ as6633208 : ,极权国家最喜欢你这种思想了,让个体去死可以不付 02/16 13:05
262F:→ as6633208 : 出一点代价最有效的就是思想的洗脑,爱一下自己吧== 02/16 13:05
263F:→ lon0623 : 照你的逻辑,没有arm发哥不行,那台积不是更该警惕 02/16 13:05
264F:→ lon0623 : 赔钱也要自己发展本土供应链 02/16 13:05
265F:→ duriamon : 原来美国是极权国家?神了!还有不好意思我是台湾人 02/16 13:05
266F:→ duriamon : 中华民国国民,笑死! 02/16 13:05
267F:→ lon0623 : 你说我讲的是不是很合你说的状况 02/16 13:06
268F:→ duriamon : 所以台积电哪个技术脱离的了老美控制?麻烦讲一下, 02/16 13:06
269F:→ duriamon : 呵呵! 02/16 13:06
270F:→ lon0623 : 对啊,断供会有危机,所以要建立啊 02/16 13:06
271F:→ duriamon : 联发科处境就跟台积电是一样的,你就是不懂而已。 02/16 13:07
272F:→ lon0623 : 如果这都做不到,那其他怎麽拼 02/16 13:07
273F:→ lon0623 : 所以要建立啊 02/16 13:07
274F:→ lon0623 : 为何你反而觉得建立供应链不重要 02/16 13:08
275F:→ duriamon : 有拼吗?没有吧?有拼还会像现在对川普毫无抵抗力? 02/16 13:08
276F:→ lon0623 : 照你的逻辑,高通也要建立啊 02/16 13:08
277F:→ as6633208 : 你知道吗,差别在是不是让政府权力越小,个体权力越 02/16 13:08
278F:→ as6633208 : 大,民主国家的最终型态本来也是最小政府的概念,政 02/16 13:08
279F:→ as6633208 : 府对个体的剥夺权力越小,个体自身的权力越大,然後 02/16 13:08
280F:→ as6633208 : 对於愿意牺牲的个体给予更高的福利与尊敬,你在想这 02/16 13:08
281F:→ as6633208 : 是不是美国 02/16 13:08
282F:→ lon0623 : 对啊,那你为何又觉得台积不用建立 02/16 13:08
283F:→ duriamon : 政府说台积电去美国没有踩红线,这可是最新的新闻, 02/16 13:08
284F:→ duriamon : 呵呵! 02/16 13:08
285F:→ lon0623 : 你这样讲不是矛盾吗 02/16 13:09
286F:→ lon0623 : 台积有供应链不是更好谈判吗?然後你说不用 02/16 13:09
287F:→ duriamon : 对美国国民是呀?你的思考方式很奇特喔!美国对於美 02/16 13:09
288F:→ duriamon : 国国民完全就不是极权国家,比台湾更不是。 02/16 13:09
289F:→ lon0623 : 买就好了。但是高通你觉得自己来可以 02/16 13:10
290F:→ lon0623 : 不觉得怪怪的吗 02/16 13:10
291F:→ duriamon : 美国国民联合诉讼大企业是可以搞到美国大企业破产的 02/16 13:10
292F:→ duriamon : ,台湾行吗?自己好好想想吧! 02/16 13:10
293F:→ lon0623 : 难道arm就没卡专利? 02/16 13:10
294F:→ duriamon : 自研架构就是要拜托专利卡啦! 02/16 13:11
295F:→ duriamon : 摆脱 02/16 13:11
296F:→ lon0623 : 所以只有洋人没有专利问题,这是你的意思? 02/16 13:11
297F:→ lon0623 : 对啊,那台积供应链为何就不行摆脱? 02/16 13:12
298F:→ as6633208 : 然後你在想想极权国家是什麽情况,国家不愿意放弃自 02/16 13:12
299F:→ as6633208 : 己剥夺个体的权力,用思想洗脑方式,让个体相信政府 02/16 13:12
300F:→ as6633208 : 应该要有更大的剥夺个体权力,来比较好管理多数人, 02/16 13:12
301F:→ as6633208 : 越是极权的国家,你的生命就越不值钱,如果你说美国 02/16 13:12
302F:→ as6633208 : 不好,那你觉得中国比较好吗? 02/16 13:12
303F:→ duriamon : 洋人有专利问题,但人家会想办法不被别人控制,而且 02/16 13:12
304F:→ lon0623 : 你不觉得自己在双标吗 02/16 13:12
305F:→ duriamon : 不只洋人,人家华为最新的晶片价架构也已经脱离了ar 02/16 13:12
306F:→ duriamon : m。 02/16 13:12
307F:→ lon0623 : 台积电比高通还有钱耶 02/16 13:13
308F:→ lon0623 : 对啊,所以重点呢? 02/16 13:13
309F:→ duriamon : 你到底在说什麽?美国哪里是极权国家?你自己定义的 02/16 13:13
310F:→ duriamon : 吗?笑死! 02/16 13:13
311F:→ lon0623 : 所以你的重点是高通华为可以自己发展供应链,台积 02/16 13:14
312F:→ lon0623 : 不行 02/16 13:14
313F:→ lon0623 : 是这个意思吗?但台积电好像更有钱耶 02/16 13:14
314F:→ duriamon : 而且你自己打的东西,你自己想想台湾有没有吧?我就 02/16 13:14
315F:→ lon0623 : 而且市场地位更高 02/16 13:14
316F:→ duriamon : 直接回答你美国不是极权国家,川普的作为是为了履行 02/16 13:14
317F:→ duriamon : 他的政见,完全正常。 02/16 13:14
318F:嘘 as6633208 : 是阿,美国不是极权国家,那中国是极权国家吗?你想 02/16 13:15
319F:→ as6633208 : 去极权国家吗? 02/16 13:15
320F:→ lon0623 : 照你的逻辑,我讲的不是更务实吗? 02/16 13:16
321F:→ lon0623 : 一开始供应链一定会赔钱,不如进口 02/16 13:16
322F:→ lon0623 : 但靠台积输血会越来越好 02/16 13:16
323F:→ duriamon : 中共是集权体制,但有人在讨论中共吗?现在是流行比 02/16 13:17
324F:→ duriamon : 烂大会是吧?现在是中共威胁台积电吗?呵呵! 02/16 13:17
325F:→ lon0623 : 不用马上跟进口一样好 02/16 13:17
326F:→ lon0623 : 台积电一年赚上兆,有的是钱 02/16 13:18
327F:→ duriamon : OK,反正我们有台积电,呵呵! 02/16 13:18
328F:嘘 as6633208 : 我看你的意思很像是,说美国对台湾不好,所以中国更 02/16 13:18
329F:→ as6633208 : 好的意思捏?高通都搬出来了,前面还在吹deepseek 02/16 13:18
330F:→ as6633208 : ,如果觉得中国比较好为什麽不移民去中呢? 02/16 13:18
331F:→ lon0623 : 而且晶圆制造是台积独大,可以玩 02/16 13:19
332F:→ lon0623 : 我讲的这个不是比你的AI优先务实吗 02/16 13:19
333F:推 yurian : claude最好 但是免费版本限制多 02/16 13:20
334F:→ yurian : deep太多争议实在很难说到底怎样 但至少台面上已经 02/16 13:21
335F:→ yurian : 端出来 台湾只有面线… 02/16 13:21
336F:嘘 as6633208 : 你说美国不好 台湾也不好 然後中国最好 ,中国这麽 02/16 13:21
337F:→ as6633208 : 好为什麽不选择移民呢?门槛最低吧? 02/16 13:21
338F:嘘 tsaigau6987 : DS也是蒸馏出来的好吗,才不是什麽自己从头开发 02/16 13:22
339F:→ yurian : gpt要付费版本才比较追得上claude 02/16 13:22
340F:→ lon0623 : 不然顶大研究AI的不多吗 02/16 13:22
341F:嘘 q2825842 : 中吹应该看下之前怎麽在股版瞎吹捧ds、嘲笑chatgpt 02/16 13:22
342F:→ q2825842 : 和nvidia。结果两个星期後,chatgpt在app store又 02/16 13:22
343F:→ q2825842 : 重新超越ds,後者的股价也逐渐回来 02/16 13:22
344F:→ lon0623 : 结果顶大一堆研究生做AI 十年过後还是这样而已 02/16 13:23
345F:推 lon0623 : 也不是没成就,AlphaGo之父就台湾人 02/16 13:29
346F:嘘 Jeff1989 : 举的例子有点怪 02/16 13:30
347F:嘘 cityhunter04: 你真的当这里是栅栏版喔?完全不演了! 02/16 13:32
348F:嘘 garlic1234 : 栅栏仔发错板了 02/16 13:39
349F:→ BoyceChu : 很白话的解释,应该置顶精华 02/16 13:41
350F:推 ksjr : 我只知道台湾只有套皮deepseek 02/16 13:46
351F:推 cheng399 : 怎麽在駡政府呢, 应该去骂习维尼64啊 02/16 13:46
352F:→ cheng399 : 駡政府是不行的唷,看看usaid 02/16 13:47
353F:→ stocktonty : 该桶了 02/16 13:48
354F:推 Crpaul5566 : 李宏毅几班 02/16 14:04
355F:推 s213092921 : 你这篇让一堆人破防大骂怎麽不移去中国XDDD 02/16 14:06
356F:→ s213092921 : 美吹只能拿辉达股价回升跟下载量应了,也不看看Clos 02/16 14:07
357F:→ s213092921 : eAI开始打价格战了 02/16 14:07
358F:推 fukku100 : v3的训练数据肯定也有包含OpenAI生成的 严格说来也 02/16 14:10
359F:→ fukku100 : 算是有蒸馏在里面吧 只是他们把蒸馏这个方法做的很 02/16 14:10
360F:→ fukku100 : 好 甚至验证在小模型上 02/16 14:10
361F:嘘 TaiwanUp : 这个要水桶10年 太明目张胆了 直接写在第一句 02/16 14:13
362F:→ sunpedro0202: v3本来就不可能是完全从头自己来的你这篇先等等 02/16 14:15
363F:推 gt99 : ds不是你说的第一阶段就自己开发 02/16 14:17
364F:嘘 shiki1988 : 中吹崛起 02/16 14:36
365F:推 andre9 : 是啊 可是政治脑会说你中共同路人 02/16 14:52
366F:推 chenteddy : deepseek v3基於v2 v2基於DeepseekMoE 02/16 14:57
367F:→ chenteddy : 读完DeepseekMoE的论文就知道一二了吧 02/16 14:57
368F:→ chenteddy : 更别说R1这种蒸馏Llama与Qwen的产物了 02/16 14:57
369F:推 chenteddy : DeepseekMoE的论文开头就说基於传统MoE模型了 02/16 15:00
370F:→ chenteddy : 到底哪来从头自己捏小朋友 02/16 15:00
371F:→ q2825842 : 跟中共同路人还是反共同路人没狗屁关系,纯粹之前 02/16 15:14
372F:→ q2825842 : 被吹过头。现在热度不见,多数人还是继续用chatgpt 02/16 15:14
373F:→ q2825842 : 小红书之前也是一样吹上天,结果现在哪还有什麽小 02/16 15:17
374F:→ q2825842 : 红书移民潮 02/16 15:17
375F:推 gogogogo3333: 最大的贡献在开源。几乎每个业内公司都花了百万美 02/16 15:17
376F:→ gogogogo3333: 元把它部署上去了。 02/16 15:17
377F:推 gogogogo3333: Just 16-32个h100, 就可以有最好的llm 来加工 02/16 15:19
378F:→ q2825842 : ds说白了就是贡献ai众多进步当中的一步,但硬要瞎 02/16 15:19
379F:→ q2825842 : 吹最後就是和现实脱节 02/16 15:19
380F:嘘 PureAnSimple: 对你的解释也没兴趣 这里不是在ㄟㄞ课 02/16 15:28
381F:嘘 s930406 : 水桶见 02/16 15:32
382F:嘘 Cactusman : Deepseek问题是伺服器繁忙 02/16 16:24
383F:嘘 leviathen : 训练资料哪来的?拿别人模型输出的 02/16 16:30
384F:嘘 Ligamenta : 中国一定有很棒的地方,台湾不需要和中国比较 02/16 16:38
385F:嘘 linuxpi : DS没pretrained,你可以专业一点吗?不要自打脸。 02/16 17:21
386F:推 stonecold123: 我斑愿称你为体术第一人 02/16 17:41
387F:嘘 ian41360 : 还要拿台大教授来背书…教授知道吗?这边不是八卦 02/16 18:07
388F:→ ian41360 : 版 02/16 18:07
389F:嘘 blackjose : 笑死 02/16 18:15
390F:→ blackjose : 走水沟反超,棒棒的。 02/16 18:19
391F:推 taikouhncheu: 看来很多人V3和R1傻傻分不清楚 02/16 18:31
392F:推 jboys75 : 买个5090实作一下 很好用的 02/16 18:44
393F:推 fs821210 : 很厉害 02/16 19:38
394F:推 stcr3011 : de开源被检视 02/16 19:44
395F:嘘 ImHoluCan : 你当大家都没出过社会?会被你这个震住? 02/16 19:47
396F:→ ImHoluCan : 拿台大来震压社会人士? 02/16 19:47
397F:→ ImHoluCan : 你不要丢脸了 02/16 19:47
398F:→ as6633208 : 我只能说deepseek很多人吹,结果用起来没那麽强,这 02/16 20:45
399F:→ as6633208 : 才是重点,第二次开始繁忙,回答这麽跳,最後要解问 02/16 20:45
400F:→ as6633208 : 题还是用gpt claude ,最强ai? 这跟中国人满脑子自 02/16 20:46
401F:→ as6633208 : 己超越美国,但数据一摊开美国不知道输了哪,这种洗 02/16 20:46
402F:→ as6633208 : 脑法真的看了让人觉得相当弱智 02/16 20:46
403F:推 cmcmcmcm2 : 推个 02/16 20:57
404F:推 cmcmcmcm2 : 讲强弱的从头到尾搞错重点 重点在成本好吗 唉 02/16 21:00
405F:→ qxpbyd : 伺服器繁忙正常 他就不是要靠这赚钱 还是有其他家DS 02/16 23:03
406F:→ qxpbyd : 的服务 Azure目前免费 中国也一堆公司DS限免 perple 02/16 23:04
407F:→ qxpbyd : xity付费也能用 02/16 23:04
408F:→ qxpbyd : 排名就摆在那 livebench第三 chatbotarena第四 02/16 23:06
409F:→ qxpbyd : 然後我记得R1不搞RLHF 他是直接用真的RL 02/16 23:08
410F:→ qxpbyd : 这也是它这次的亮点 借镜AlphaGo-Zero 02/16 23:09
411F:→ qxpbyd : R1有蒸馏版 和 满血版671b 怎麽现在还有人没搞清楚 02/16 23:12
412F:→ qxpbyd : 蒸馏版最大也才70B 02/16 23:14
413F:嘘 permoon : 鬼扯,DeepSeek是拿Meta的开源模型进行优化 02/16 23:24
414F:→ permoon : 不是无中生有干一个模型出来 02/16 23:25
415F:嘘 TaiTY2021 : 那人家的补习重点再出一版精简版讲义.... 02/16 23:26
416F:推 HeiSiaN : 推分享 02/16 23:33
417F:嘘 csghuuguh : 你要吹捧也不要只讲一半啊 Deepseek隐藏层参数怎麽 02/17 03:40
418F:→ csghuuguh : 来的怎麽不介绍一下 02/17 03:40
419F:→ csghuuguh : 还从头捏勒 好会扯 02/17 03:40
420F:→ qxpbyd : 蒸馏版qwen,llama的模型,是训练完671B满血版才做 02/17 07:20
421F:→ qxpbyd : 的事,llama中文这麽差,蒸馏它完模型还会变笨,要 02/17 07:20
422F:→ qxpbyd : 怀疑的是到底有没有蒸馏openai 02/17 07:20
423F:嘘 artning : 还捏出一个小朋友咧,很会胡扯,DeepSeek是用蒸馏 02/18 11:00
424F:→ artning : 技术利用别人的模型,最好他是自己捏出一个小朋友 02/18 11:00
425F:→ artning : 啦 02/18 11:00
426F:推 miyazakisun2: 宝宝好可爱喔 02/20 10:53







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Gossiping站内搜寻

TOP