AfterPhD 板


LINE

美国史丹福大学AI团队被控抄袭中国大数据团队 作者道歉下架模型 撰文:许祺安出版:2024-06-04 19:30更新:2024-06-04 21:12 近日,史丹福大学AI团队主导的 Llama3-V 开源模型被证实套壳抄袭国内清华与面壁智能 的开源模型「小钢炮」MiniCPM-Llama3-V 2.5一事,在网路上引发热议。 史丹福Llama3-V团队的两位作者Siddharth Sharma(森德哈斯·沙玛)和 Aksh Garg(阿 克沙·加格)在社交平台上就这一学术不端行为向面壁MiniCPM团队正式道歉,并表示会 将Llama3-V模型全数撤下。 人工智慧的飞速发展离不开全球演算法、资料与模型的开源共享。(Reuters) 5月29日,一个来自史丹福的AI团队开始在网路上宣传500美元就能训练出一个SOTA 多模 态模型,该模型名为Llama3-V,作者声称Llama3-V比GPT-4V、Gemini Ultra、Claude Opus 性能更强。公开资料显示,团队两位成员是来自史丹福大学的本科生,曾发表多篇 机器学习领域论文,实习经历包括了AWS、SpaceX等。 由於该团队成员背景亮眼,Llama3-V项目很快冲到HuggingFace (一个开发者社区和平台 )首页,并引发开发者群体的关注。随後,网民发现,该团队的Llama3-V模型使用的模型 结构和程式码与面壁智能不久前发布的MiniCPM-Llama3-V2.5极为相似,仅修改了部分变 数名。Llama3-V也具有与MiniCPM-Llama3-V 2.5相同的分词器,包括後者新定义的特殊符 号。 面壁智能CEO:感慨这也是一种受到国际团队认可的方式 6月2日深夜,面壁智能团队证实,史丹福大模型项目Llama3-V与MiniCPM一样,可以识别 出「清华简」战国古文字,「不仅对得一模一样、连错得都一模一样」。这一古文字资料 为研究团队花费数月从清华简上逐字扫描并人工标注得来,并未对外公开,证实抄袭事实 。 李大海指出,关键证据在於Llama3-V同样使用面壁智能团队新设定的清华简识别能力(清 华大学於2008年7月收藏的一批战国竹简),且呈现的做错案例都与MiniCPM一模一样,而 这一训练资料尚未完全公开。 李大海称,这项工作是团队同学耗时数个月,从卷帙浩繁的清华简中一个字一个字扫描下 来,并逐一进行资料标注,融合进模型中的。更加微妙的是,两个模型在高斯扰动验证( 一种用於验证模型相似性的方法)後,在正确和错误表现方面都高度相似。 李大海指出,关键证据在於Llama3-V同样使用面壁智能团队新设定的清华简识别能力(清 华大学於2008年7月收藏的一批战国竹简),且呈现的做错案例都与MiniCPM一模一样,而 这一训练资料尚未完全公开。(第一财经) 面壁智能CEO李大海表示,「我们对这件事深表遗憾。一方面感慨这也是一种受到国际团 队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。」「我们希望团 队的好工作被更多人关注与认可,但不是以这种方式。」 史丹福Llama3-V团队的成员Aksh Garg(阿克沙·加格)随後公开致歉称,该团队是由三 人负责,其中编写程式码的成员Mustafa,从昨天起就无法联络他,「我们向作者道歉, 并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任, 并已撤下Llama3-V,再次致歉。」 另外,史丹福人工智慧实验室主任Christopher David Manning也发文谴责这一抄袭行为 ,并对MiniCPM这一中国开源模型表示赞扬。 中国科技创新成果受到国际关注 中国AI近年高速发展。(视觉中国) 面壁智能联合创始人刘知远说道,人工智慧的飞速发展离不开全球演算法、资料与模型的 开源共享,面壁开放原始码的 MiniCPM-Llama3-V 2.5 就用了最新的Llama3 作为语言模 型基座。而开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊 重和致敬,Llama3-V团队无疑严重破坏了这一点。 刘知远称,Llama3-V团队在受到质疑後已在Huggingface删库,该团队三人中的两位也只 是史丹福大学本科生,未来还有很长的路,「如果知错能改,善莫大焉」。 刘知远也表示,国内大模型团队如智谱-清华GLM、阿里Qwen、DeepSeek和面壁-清华 OpenBMB正在通过持续的开源共享,在国际上受到了广泛的关注和认可,「这次事件也算 侧面反映出,我们的创新成果也一直受到国际关注。」刘知远说。 https://s.yam.com/4wfP8 --
QR Code



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 180.176.190.76 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/AfterPhD/M.1717516473.A.94C.html







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:Boy-Girl站内搜寻

TOP