代码、多模态检索全面登顶SOTA!智源BGE向量模型三连击,并全面开放

代码、多模态检索全面登顶SOTA!智源BGE向量模型三连击,并全面开放

 

文章摘要


【关 键 词】 检索向量多模态代码视觉

检索增强技术在代码多模态场景中发挥着重要作用,而向量模型是这一技术体系中的核心组成部分。近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量模型 BGE-Code-v1、多模态向量模型 BGE-VL-v1.5 以及视觉化文档向量模型 BGE-VL-Screenshot。这些模型在代码及多模态检索领域取得了显著成果,并在多个主要测试基准中登顶,展现了其在技术上的领先地位。BGE 系列模型自 2023 年 8 月发布以来,已成为中国首个登顶 Hugging Face 榜首的国产 AI 模型,并在全球范围内获得了极高的下载量。

BGE-Code-v1 是一款专为代码检索任务设计的新一代代码向量模型,基于 Qwen2.5-Coder-1.5B 打造,具备强大的多语言文本理解能力。该模型在 CoIR 和 CodeRAG-Bench 基准测试中均以显著优势超越其他商业和开源模型,成为代码检索任务的最优选择。其应用场景包括开发文档搜索、代码库语义检索以及跨语言信息获取等,为大规模代码库的检索需求提供了高效解决方案。

BGE-VL-v1.5 是一款通用多模态检索模型,基于 LLaVA-1.6 训练,全面升级了图文理解能力。该模型在 MMEB 基准测试中刷新了 zero-shot 模型的最佳表现,并在多模态检索任务中展现了高适应性与准确率。其应用场景涵盖图文匹配、多模态问答以及跨模态推荐等,为多模态数据的检索提供了强有力的支持。

BGE-VL-Screenshot 是一款专注于视觉化文档检索的模型,基于 Qwen2.5-VL-3B-Instruct 训练,能够从复杂的多模态数据中提取关键信息。该模型在多模态检索基准 MVRB 的 4 项任务中均表现出色,以 60.61 的综合得分达到 SOTA 水平。其应用场景包括网页、文档等可视化信息检索任务,为多模态数据的精准理解与检索提供了新的解决方案。

智源研究院主导研发的 BGE 系列模型,旨在为各类数据提供高效的一站式向量表征与语义检索方案。该系列模型凭借高性能与开源特性,已广泛应用于 RAG、神经搜索等场景,累计下载量超过 6 亿次,并被国内外多家 AI 企业集成。未来,智源研究院将继续深耕向量模型与检索增强技术,进一步提升 BGE 系列模型的能力与通用性,推动检索技术与人工智能的进一步发展。

原文和模型


【原文链接】 阅读原文 [ 1739字 | 7分钟 ]
【原文作者】 机器之心
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...