标签:语言模型
全球百模争霸,国产大模型拿下多个冠军!智源FlagEval全球评测榜单出炉
智源研究院于2024年12月19日发布了下半年大模型综合评测结果,涉及100余个开源和商业闭源模型,覆盖文本、语音、图像和视频等多个领域。此次评测在5月的基础...
智源发布FlagEval「百模」评测结果,丈量模型生态变局
智源研究院于2024年12月19日发布了对国内外100余个大模型的综合及专项评测结果。此次评测不仅扩展了任务解决能力的内涵,新增了数据处理、高级编程和工具调用...
100+大模型综测结果出炉!智源发布FlagEval“百模”评测结果,覆盖文本语音图片视频多种模态
智源研究院于2024年12月19日发布了国内外100余个大模型的综合及专项评测结果。评测显示,大模型发展更注重综合能力提升与实际应用,多模态模型发展迅速,而语...
李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪
斯坦福大学的研究团队在多模态语言模型领域取得了新进展,提出了一种能够同时处理语音、文本和动作生成任务的模型。该模型能够理解并生成富有表现力的人类动...
田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式
在认知科学领域,关于语言是否用于思考或交流的辩论一直存在。随着大型语言模型(LLM)和思维链(Chain of Thought, CoT)的兴起,语言已成为机器推理的默认...
吴恩达发布开源 Python 库,一个接口可调用多个大模型
吴恩达最近推出了一个名为aisuite的开源Python库,旨在简化开发人员集成多个大型语言模型(LLM)的过程。该库通过提供一个标准化接口,允许用户仅通过更改一...
重磅!OpenAI发布满血o1、无限使用,最强大模型来了
OpenAI最近推出了ChatGPT Pro,这是一个高级版本的语言模型,提供无限使用完整版o1和Pro模式,以及高级语音和图片上传功能。与之前的o1-preview版本相比,新...
吴恩达出手,开源最新Python包,一个接口调用OpenAI等模型
斯坦福大学教授吴恩达最近开源了一个名为aisuite的Python包,旨在简化开发者在构建应用程序时与多个大型语言模型(LLM)提供商的集成工作。这个工具使得开发...
国产模型指令跟随全球第一!来自LeCun亲推的「最难作弊」大模型新榜单
国内初创公司阶跃星辰的万亿参数语言大模型Step-2-16k-202411在LiveBench榜单上取得显著成绩,位列全球第五、国内第一。LiveBench是由图灵奖得主杨立昆联合纽...
史上最严“中文真实性评估”:OpenAI o1第1豆包第2,其它全部不及格
淘宝天猫集团的研究者们最近提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,旨在评估语言模型回答简短问题的真实性能力。该基准具有中文...