标签:语言模型
田渊栋团队论文火了!连续思维链优于CoT,打开LLM推理新范式
在认知科学领域,关于语言是否用于思考或交流的辩论一直存在。随着大型语言模型(LLM)和思维链(Chain of Thought, CoT)的兴起,语言已成为机器推理的默认...
吴恩达发布开源 Python 库,一个接口可调用多个大模型
吴恩达最近推出了一个名为aisuite的开源Python库,旨在简化开发人员集成多个大型语言模型(LLM)的过程。该库通过提供一个标准化接口,允许用户仅通过更改一...
重磅!OpenAI发布满血o1、无限使用,最强大模型来了
OpenAI最近推出了ChatGPT Pro,这是一个高级版本的语言模型,提供无限使用完整版o1和Pro模式,以及高级语音和图片上传功能。与之前的o1-preview版本相比,新...
吴恩达出手,开源最新Python包,一个接口调用OpenAI等模型
斯坦福大学教授吴恩达最近开源了一个名为aisuite的Python包,旨在简化开发者在构建应用程序时与多个大型语言模型(LLM)提供商的集成工作。这个工具使得开发...
国产模型指令跟随全球第一!来自LeCun亲推的「最难作弊」大模型新榜单
国内初创公司阶跃星辰的万亿参数语言大模型Step-2-16k-202411在LiveBench榜单上取得显著成绩,位列全球第五、国内第一。LiveBench是由图灵奖得主杨立昆联合纽...
史上最严“中文真实性评估”:OpenAI o1第1豆包第2,其它全部不及格
淘宝天猫集团的研究者们最近提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,旨在评估语言模型回答简短问题的真实性能力。该基准具有中文...
超越 GPT-4o 和 Gemini-1.5,阶跃星辰拿下中国大模型第一
在大模型技术领域,中国公司阶跃星辰的自研万亿参数语言大模型Step-2在国际权威LiveBench榜单中取得了显著成绩,位列国产基座大模型第一,全球第五,逼近Open...
逼真到离谱!1000个人类「克隆」进西部世界,AI相似度85%细节太炸裂
斯坦福大学的研究团队通过深度访谈1052名参与者,创建了1000多个AI智能体,这些智能体能够以85%的准确度模拟真实人类的行为和态度。这项研究采用了生成式智能...
LLM 比之前预想的更像人类,竟也能「三省吾身」
近期,一个多机构联合团队的研究证实了语言模型(LLM)可以通过内省来了解自身。这项研究的论文标题为“Looking Inward: Language Models Can Learn About The...
刚刚,OpenAI开源SimpleQA!轻松检测、校准大模型能力
OpenAI最新开源的SimpleQA基准测试集旨在帮助开发者检测和校准大型语言模型(LLM)的真实性能力。该测试集特别设计来挑战高级模型如GPT-4,仅包含模型至少有...