作者nisi0773 (深知身在情常在)
看板Stock
标题[新闻] 阿里发布新开源模型 家用显卡就能跑
时间Thu Mar 6 21:01:52 2025
原文标题:DeepSeek有劲敌!阿里发布新开源模型 家用显卡就能跑
原文连结:
https://udn.com/news/story/7333/8590256?from=udn-catebreaknews_ch2
发布时间:2025-03-06 14:25
记者署名:联合报/ 记者陈湘瑾
原文内容:
阿里巴巴AI To C业务旗下AI应用「阿里通义」在6日正式发布最新的开源推理模型通义千
问QwQ-32B,其官方介绍称,透过大规模强化学习,千问QwQ-32B在数学、代码及通用能力
上进步飞跃,整体性能比肩DeepSeek-R1,同时大幅降低部署使用成本,在消费级显卡上
能实现本地部署。
使用者已可免费下载及商用QwQ-32B模型,或透过网页版Qwen Chat体验,该模型也将免费
上架通义App。
阿里通义团队表示,QwQ-32B模型针对数学和编程任务、通用能力分别进行2轮大规模强化
学习,在32B的模型尺寸上获得推理能力提升,印证了大规模强化学习(Reinforcement
Learning,一种机器学习技术)可显着提高模型性能。
该团队指,千问QwQ-32B能提供极强的推理能力,以及满足更低的资源消耗需求,背後关
键在於强化学习。该团队表示,希望能够证明强大的基础模型叠加大规模强化学习,也许
是一条通往通用人工智能(AGI)的可行之路。
此外,QwQ-32B模型中还集成了与智能体(AI Agent,指的是能够自主做出决策、完成行
动,且毋需人类介入的人工智慧)相关的能力,能在使用工具的同时进行批判性思考,以
及根据环境回馈调整推理过程。
受此消息影响,6日阿里巴巴集团港股早盘大幅高开涨逾6%,截至午盘涨逾7%。
心得/评论:
原来今天阿里巴巴是在涨这个
看来DS确实带动了AI走出了不同的局面与蓬勃发展
同时也带动了港股与其他科技类股不小的涨幅
00753跟00752今天也几乎要收复去年十月开始的跌幅了
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.167.19.153 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Stock/M.1741266117.A.AD8.html
1F:推 cuteSquirrel: 40大盗 03/06 21:02
2F:→ bonaqabo : 我蒸馏别人蒸馏你的蒸馏 03/06 21:03
3F:推 LINPINPARK : 蛤今天在涨这个? 03/06 21:03
4F:推 holysong : 卖杈,我的模型用内显就可以跑啦 03/06 21:03
5F:推 k1k1832002 : 接下来还要观察manus ai agent正式推出的时候到底付 03/06 21:06
6F:→ k1k1832002 : 费方案跟效用有没有像它展示的那麽炫炮了 03/06 21:06
7F:推 g0t24568 : 也太卷了吧 太扯! 03/06 21:09
8F:推 dsfs : 过几天就会研发出用3.5磁片运作的ai,不要不信 03/06 21:13
9F:→ puta : QwQ 这表情是边哭边发抖吗? 03/06 21:14
10F:推 jerry10307 : 内卷AI, 马上改玩边缘 03/06 21:17
11F:→ love80 : 老黄gg 03/06 21:18
12F:→ love80 : 以後会不会内显就跑的动 03/06 21:18
13F:→ noirskakashi: QwQ 03/06 21:19
14F:推 sheng76314 : 虽然慢 但台币8000就能跑 03/06 21:24
15F:推 richaelchen : 阿里都不知道涨多少 03/06 21:28
16F:→ loveadu : CUDA被攻破迟早的事情 03/06 21:29
17F:推 kimula01 : 川普:请皮衣刀客再把5090D切一下卖中国 03/06 21:29
18F:推 jack1218 : qwen有些模型真的不错 03/06 21:30
19F:→ jack1218 : 中文侧的使用者用起来比LLama好用多了 03/06 21:30
20F:→ Karida : Nvidia BBQ了 03/06 21:38
21F:推 lolpklol0975: CUDA一座城池 攻破难, 绕过去就好 03/06 21:40
22F:→ lianli1024 : 能跑是能跑但是多久才跑完 03/06 21:40
23F:→ abbjesper : 被逼上绝路才会激发潜力 03/06 21:41
24F:推 c7683fh6 : 阿里阿多 03/06 21:41
25F:推 ariadne : 跑本来就什麽都能跑 效率问题而已 当初挖BTC不用gp 03/06 21:49
26F:→ ariadne : u用cpu也行 只是别人一天相当你跑一个月 03/06 21:49
27F:→ FatFatQQ : 马其顿防线直接被绕阿登森林? 03/06 21:50
28F:推 mungbeanJ : 好强 03/06 21:55
29F:推 la8day : 显卡娘! 03/06 21:56
30F:→ ab4daa : PC DIY仔丸子 03/06 22:02
31F:→ azhu : No on car ,DS是钦定的 03/06 22:05
32F:推 by19 : 还不是要买nv 03/06 22:08
33F:→ CGDGAD : 你好,我是阿里的爸爸,阿里巴巴 03/06 22:18
34F:推 ntnuljg : 我的模型用电子锅就可以运行了 03/06 22:22
35F:推 thetide0512 : 5070也要买不到了吗 03/06 22:34
36F:→ ueo2518 : 矩阵运算就是这麽多资料要过,家用显卡记忆体够?4k 03/06 22:37
37F:→ ueo2518 : 影片用480就能放?这什麽压缩技术? 03/06 22:37
38F:推 tony1768 : 马董真会通用化 03/06 22:53
39F:推 eli5816459 : 用了,不错 03/06 23:31
40F:推 xx013652 : 看reddit讨论,3090就能跑了 03/06 23:37
41F:→ xx013652 : fp4应该对於减少记忆体需求有帮助(?) 03/06 23:37
42F:推 avmm9898 : 蒸馏水 03/07 00:16
43F:→ yunf : 原本手机就可以用ai 03/07 03:58
44F:→ yunf : 看要跑什麽而已 03/07 03:59
45F:推 arcysaint : 下一个:我用650w电供就能跑 03/07 05:15
46F:推 icome : 开始卷了 DS只是开第一枪 03/07 06:09
47F:推 mdkn35 : 32B要怎麽塞到显卡?量化就垃圾了啊 03/07 06:42
48F:推 PTIMIKE : 再来就游戏机也可以跑了 03/07 07:03
49F:→ s56565566123: 大家都在笑中国的时候 喷啦 03/07 08:42