标签:评测体系

全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉

智源研究院于2024年12月19日发布了下半年大模型综合评测结果,涉及100余个开源和商业闭源模型,覆盖文本、语音、图像和视频等多个领域。此次评测在5月的基础...

智源发布FlagEval「百模」评测结果,丈量模型生态变局

智源研究院于2024年12月19日发布了对国内外100余个大模型的综合及专项评测结果。此次评测不仅扩展了任务解决能力的内涵,新增了数据处理、高级编程和工具调用...

100+大模型综测结果出炉!智源发布FlagEval“百模”评测结果,覆盖文本语音图片视频多种模态

智源研究院于2024年12月19日发布了国内外100余个大模型的综合及专项评测结果。评测显示,大模型发展更注重综合能力提升与实际应用,多模态模型发展迅速,而语...