标签:语言模型

国产模型指令跟随全球第一!来自LeCun亲推的「最难作弊」大模型新榜单

国内初创公司阶跃星辰的万亿参数语言大模型Step-2-16k-202411在LiveBench榜单上取得显著成绩,位列全球第五、国内第一。LiveBench是由图灵奖得主杨立昆联合纽...

史上最严“中文真实性评估”:OpenAI o1第1豆包第2,其它全部不及格

淘宝天猫集团的研究者们最近提出了中文简短问答(Chinese SimpleQA),这是首个全面的中文基准,旨在评估语言模型回答简短问题的真实性能力。该基准具有中文...

超越 GPT-4o 和 Gemini-1.5,阶跃星辰拿下中国大模型第一

在大模型技术领域,中国公司阶跃星辰的自研万亿参数语言大模型Step-2在国际权威LiveBench榜单中取得了显著成绩,位列国产基座大模型第一,全球第五,逼近Open...

逼真到离谱!1000个人类「克隆」进西部世界,AI相似度85%细节太炸裂

斯坦福大学的研究团队通过深度访谈1052名参与者,创建了1000多个AI智能体,这些智能体能够以85%的准确度模拟真实人类的行为和态度。这项研究采用了生成式智能...

LLM 比之前预想的更像人类,竟也能「三省吾身」

近期,一个多机构联合团队的研究证实了语言模型(LLM)可以通过内省来了解自身。这项研究的论文标题为“Looking Inward: Language Models Can Learn About The...

刚刚,OpenAI开源SimpleQA!轻松检测、校准大模型能力

OpenAI最新开源的SimpleQA基准测试集旨在帮助开发者检测和校准大型语言模型(LLM)的真实性能力。该测试集特别设计来挑战高级模型如GPT-4,仅包含模型至少有...

AI「长脑子」了?LLM惊现「人类脑叶」结构并有数学代码分区,MIT大牛新作震惊学界!

Max Tegmark团队的最新研究揭示了大型语言模型(LLM)在学习概念时展现出的惊人几何结构,类似于人类大脑的脑叶分区。研究发现LLM中的稀疏自编码器(SAE)特...

他们掰开神经元,终于让大模型9.8大于9.11了:神秘创业公司,开源AI「洗脑」工具

AI研究实验室Transluce开发了一款名为Monitor的交互界面,旨在帮助人类观察、理解和引导语言模型的内部计算。该界面通过分析模型预测词的概率分布,寻找影响...

追逐AGI!微软AI副总裁、Phi小模型领导者Bubeck将加入OpenAI

微软人工智能副总裁兼杰出科学家Sebastien Bubeck宣布将离开微软,加入OpenAI。Bubeck自2014年加入微软,历任多个职位,领导开发了Phi系列小模型,包括Phi-3 ...

这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机

微软研究院和清华大学的研究团队提出了一种新型的Transformer架构——Differential Transformer(简称Diff Transformer),旨在解决传统Transformer在处理大型...
1 2 3 9