标签:语言模型
超越 GPT-4o 和 Gemini-1.5,阶跃星辰拿下中国大模型第一
在大模型技术领域,中国公司阶跃星辰的自研万亿参数语言大模型Step-2在国际权威LiveBench榜单中取得了显著成绩,位列国产基座大模型第一,全球第五,逼近Open...
逼真到离谱!1000个人类「克隆」进西部世界,AI相似度85%细节太炸裂
斯坦福大学的研究团队通过深度访谈1052名参与者,创建了1000多个AI智能体,这些智能体能够以85%的准确度模拟真实人类的行为和态度。这项研究采用了生成式智能...
LLM 比之前预想的更像人类,竟也能「三省吾身」
近期,一个多机构联合团队的研究证实了语言模型(LLM)可以通过内省来了解自身。这项研究的论文标题为“Looking Inward: Language Models Can Learn About The...
刚刚,OpenAI开源SimpleQA!轻松检测、校准大模型能力
OpenAI最新开源的SimpleQA基准测试集旨在帮助开发者检测和校准大型语言模型(LLM)的真实性能力。该测试集特别设计来挑战高级模型如GPT-4,仅包含模型至少有...
AI「长脑子」了?LLM惊现「人类脑叶」结构并有数学代码分区,MIT大牛新作震惊学界!
Max Tegmark团队的最新研究揭示了大型语言模型(LLM)在学习概念时展现出的惊人几何结构,类似于人类大脑的脑叶分区。研究发现LLM中的稀疏自编码器(SAE)特...
他们掰开神经元,终于让大模型9.8大于9.11了:神秘创业公司,开源AI「洗脑」工具
AI研究实验室Transluce开发了一款名为Monitor的交互界面,旨在帮助人类观察、理解和引导语言模型的内部计算。该界面通过分析模型预测词的概率分布,寻找影响...
追逐AGI!微软AI副总裁、Phi小模型领导者Bubeck将加入OpenAI
微软人工智能副总裁兼杰出科学家Sebastien Bubeck宣布将离开微软,加入OpenAI。Bubeck自2014年加入微软,历任多个职位,领导开发了Phi系列小模型,包括Phi-3 ...
这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机
微软研究院和清华大学的研究团队提出了一种新型的Transformer架构——Differential Transformer(简称Diff Transformer),旨在解决传统Transformer在处理大型...
「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need
近期,MIT的两位华人学者提出了一种名为L-Mul的新型乘法算法,旨在优化大规模语言模型(LLM)的能耗问题。LLM的能耗问题已经引起了联合国的关注,因为其能耗...
AI 加入 Scrum 团队,生产力翻倍?
在Scrum.org首席运营官Eric Naiburg的文章“AI as a Scrum Team Member”中,他探讨了人工智能(AI)如何作为Scrum团队的一员,提升Scrum Master、产品负责人和...