标签：评测体系

主流开源大模型生态解析

开源生态已成为驱动AI领域发展的核心力量，2025年全球开源大模型形成了由Llama、GLM、Qwen和DeepSeek构成的'四强争霸'格局。Meta的Llama系列作为开源世界的奠...

AIGC动态

3周前

全球百模争霸，国产大模型拿下多个冠军！智源FlagEval全球评测榜单出炉

智源研究院于2024年12月19日发布了下半年大模型综合评测结果，涉及100余个开源和商业闭源模型，覆盖文本、语音、图像和视频等多个领域。此次评测在5月的基础...

AIGC动态

12个月前

智源发布FlagEval「百模」评测结果，丈量模型生态变局

智源研究院于2024年12月19日发布了对国内外100余个大模型的综合及专项评测结果。此次评测不仅扩展了任务解决能力的内涵，新增了数据处理、高级编程和工具调用...

AIGC动态

12个月前

100+大模型综测结果出炉！智源发布FlagEval“百模”评测结果，覆盖文本语音图片视频多种模态

智源研究院于2024年12月19日发布了国内外100余个大模型的综合及专项评测结果。评测显示，大模型发展更注重综合能力提升与实际应用，多模态模型发展迅速，而语...

AIGC动态

1年前 (2024)