文章摘要
【关 键 词】 学术抄袭、开源项目、AI领域、技术挑战、国际认可
斯坦福大学的两名学生Aksh Garg和Siddharth Sharma因抄袭清华大学与面壁智能联合开发的MiniCPM-Llama3-V2.5多模态大模型而引起广泛关注。该事件在社交媒体上引发了广泛讨论,并得到了斯坦福大学AI实验室主任Christopher Manning的确认。他赞扬了中国大学和企业对开源项目的贡献,并对该事件表示不知情。
抄袭的证据包括:两款模型的特色功能相似,特别在于都能识别“清华简”这种罕见的古文字;Llama3-V的模型架构、代码、配置文件和分词器与V2.5基本相同;模型之间的重叠度高达87%,且在测试WebAgent时的错误也一致。这些证据表明,Llama3-V在很大程度上复制了V2.5。
在强大的舆论压力下,两名学生公开道歉,并删除了相关开源项目。他们声称自己只是负责模型的社区宣传,实际的代码作者是Mustafa Aljadery。这一说法受到了批评,因为他们在作者栏中署了自己的名字。
该事件反映出中国在AI领域面对的技术挑战,尤其是在高性能计算资源受限的背景下,依然致力于从算法和数据处理等方面提升模型性能。此外,中国的开源项目逐渐获得国际认可,表明其在大模型开发方面的实力和开源生态的潜力。
原文和模型
【原文链接】 阅读原文 [ 1666字 | 7分钟 ]
【原文作者】 AIGC开放社区
【摘要模型】 glm-4
【摘要评分】 ★★★☆☆
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...