作者hihihihehehe (远离尘嚣)
看板CrossStrait
标题[新闻] DeepSeek走红 开发者是「95後」天才少女 Meta组4团队应对
时间Tue Jan 28 00:26:34 2025
DeepSeek走红 开发者是「95後」天才少女 Meta组4团队应对
记者陈言乔/即时报导 2025-01-27 09:57 ET
https://imgur.com/xKCV8kd
DeepSeek-V2的关键开发者之一罗福莉,被誉为AI天才少女,今年不到30岁。小米以年薪
人民币1千万元挖角。(取自罗福莉公众号)
中国AI新创公司DeepSeek近来迅速走红,令矽谷十分紧张。DeepSeek-V2的关键开发者之
一是被称为95後AI「天才少女」罗福莉。小米创始人雷军以人民币千万元年薪招揽罗福莉
,领导小米AI大模型团队。
红星资本局报导,2024年底,DeepSeek发布了新一代大语言模型DeepSeek-V3,同时宣布
开源。1月20日,DeepSeek发布新模型DeepSeek-R1并同步开源模型权重,再次引发全球AI
科技圈关注。
DeepSeek昨天(26日)曾出现短时闪崩现象,DeepSeek回应称,当天下午确实出现了局部
服务波动,但问题在数分钟内就得到了解决。此次事件可能是由於新模型发布後用户访问
量激增,伺服器一时无法满足大量用户的并发需求。
红星资本局指,在多项基准测试中,V3的成绩超越了主流开源模型,并和世界顶尖的闭源
模型不分伯仲。同时,由於其极低的训练成本,DeepSeek-V3被称为「AI界拼多多」。
公开资料显示,DeepSeek来自杭州「深度求索人工智慧基础技术研究有限公司」(下称「
深度求索公司」),专注於开发先进的大语言模型和相关技术,由中国知名量化资管巨头
「幻方量化」於2023年7月创立,也因此获得资本市场的广泛关注。
而DeepSeek-V2的关键开发者之一罗福莉也迅速走红,她被称为95後(1995年以後出生)
AI「天才少女」。罗福莉本科就读於北京师范大学电脑专业,硕士毕业於北京大学计算语
言学专业。
硕士毕业後,罗福莉先是进入阿里达摩院做人工智慧研究,从事预训练语言模型相关的工
作,负责阿里达摩院AliceMind开源专案,主导开发了多语言预训练模型VECO。
2022年,罗福莉加入「幻方量化」从事深度学习相关策略建模和演算法研究,後又跳槽到
DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。
就在DeepSeek-V3发布前几天,小米创始人雷军已开出千万年薪招聘罗福莉,领导小米AI
大模型团队。
DeepSeek的爆火後,登顶苹果中国和美国应用商店免费APP下载排行榜,超越了ChatGPT。
澎湃新闻报导,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经
升至全类别大模型第3,与OpenAI的ChatGPT-4o最新版并列。不过,DeepSeek-R1的预训练
费用为557.6万美元,不到OpenAI GPT-4o模型训练成本的十分之一。
红星资本局称,DeepSeek公司的北京子公司正在招人,现共释出52个岗位,包括深度学习
研究员、核心系统研发工程师以及资深ui设计师等。其中,薪资最高的为核心系统研发工
程师(校招),薪资范围人民币6至9万元;大部分岗位的起薪在人民币2万元及以上。
DeepSeek以其研发的极低成本优势,引起美国矽谷等AI公司的紧张。澎湃新闻27日引述
Information网站报导,脸书母公司Meta已成立了4个专门研究小组来研究量化巨头「幻方
量化」旗下的国产大模型DeepSeek的工作原理,并基於此来改进旗下大模型Llama。
其中2个小组正在试图了解「幻方量化」如何降低训练和运行DeepSeek的成本;第3个研究
小组则正在研究「幻方量化」可能使用了哪些资料来训练其模型;第4个小组正在考虑基
於DeepSeek模型属性重构Meta模型的新技术。
据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达(辉达)H800 GPU
(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的
不到十分之一。一经推出,DeepSeek-R1便凭藉其物美价廉的特性在海外开发者社区中引
发了轰动,更是凭藉极低的训练成本震撼了矽谷。
数日前,有Meta的工程师们在匿名社交平台TeamBlind上吐露心声,表示DeepSeek所研发
的AI模型为其带来了巨大压力。
新闻出处:世界新闻网
https://reurl.cc/kM2XNd
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 118.166.36.64 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/CrossStrait/M.1737995198.A.254.html
1F:嘘 marathons: 到处转贴新闻洗文. 98.35.147.58 01/28 04:52