模型信息
【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★★★
文章摘要
【关 键 词】 AI、开源、Gemma、InternLM2、大模型
谷歌近期开源了名为Gemma的AI大模型,这一行动在全球科技界引起了广泛关注。Gemma 7B在发布时被宣称在综合能力、推理、数学和编程等方面超越了同量级的Llama 2和Mistral。然而,Gemma在HuggingFace的开源大模型排行榜中仅位列7B预训练模型的第三,前两名被中国的InternLM2(书生·浦语2.0)占据。InternLM2在各项细分赛道中均表现出色,甚至在与更大体量的13B Llama-2的比较中也取得了完胜。
InternLM2的成功归功于其数据策略,团队投入大量精力进行数据迭代,通过多维度数据价值分析、基于高质量语料的数据扩展和目标化数据补充,优化了数据集。此外,InternLM2还针对超长上下文处理需求进行了性能增强,支持200K超长上下文,提高了模型处理长文本的能力。
Gemma的发布不仅为开源大模型领域带来了新的趋势和信心,也展示了中国在AI大模型领域的竞争力。随着大模型技术的不断发展,如何让技术更高效地应用将成为关键。
原文信息
【原文链接】 阅读原文
【阅读预估】 2426 / 10分钟
【原文作者】 量子位
【作者简介】 追踪人工智能新趋势,关注科技行业新突破
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...