标签:语言模型
他们掰开神经元,终于让大模型9.8大于9.11了:神秘创业公司,开源AI「洗脑」工具
AI研究实验室Transluce开发了一款名为Monitor的交互界面,旨在帮助人类观察、理解和引导语言模型的内部计算。该界面通过分析模型预测词的概率分布,寻找影响...
追逐AGI!微软AI副总裁、Phi小模型领导者Bubeck将加入OpenAI
微软人工智能副总裁兼杰出科学家Sebastien Bubeck宣布将离开微软,加入OpenAI。Bubeck自2014年加入微软,历任多个职位,领导开发了Phi系列小模型,包括Phi-3 ...
这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机
微软研究院和清华大学的研究团队提出了一种新型的Transformer架构——Differential Transformer(简称Diff Transformer),旨在解决传统Transformer在处理大型...
「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need
近期,MIT的两位华人学者提出了一种名为L-Mul的新型乘法算法,旨在优化大规模语言模型(LLM)的能耗问题。LLM的能耗问题已经引起了联合国的关注,因为其能耗...
AI 加入 Scrum 团队,生产力翻倍?
在Scrum.org首席运营官Eric Naiburg的文章“AI as a Scrum Team Member”中,他探讨了人工智能(AI)如何作为Scrum团队的一员,提升Scrum Master、产品负责人和...
Cursor创始团队最新访谈:如果Github整合o1,Cursor可能要倒闭了
Cursor是一款基于VS Code的代码编辑器,它集成了AI辅助编程功能,引起了编程界和人工智能界的广泛关注。Cursor的起源可以追溯到2020年左右,当时OpenAI发布了...
00后国人论文登Nature,大模型对人类可靠性降低
这篇论文探讨了大型语言模型(LLMs)的可靠性问题,发现随着模型规模的增大,其在遵循指令方面的表现反而变得不可靠。研究指出,即使是最新的模型,如GPT-4,...
Ilya预言错了!华人Nature一作给RLHF「判死刑」,全球大模型都不可靠
剑桥大学等机构的研究人员在Nature上发表的论文中,对当前领先的大型语言模型(LLM)进行了全面评估,结果发现这些模型存在显著的不可靠性。研究团队对包括o1...
天下苦LangChain久矣
Ell 是一个新发布的语言模型编程库,旨在与 LangChain、Llama-Index 和 DSPy 等现有库竞争,甚至有可能取代它们。Ell 的核心维护者对 LangChain 的抽象表示不...
《Python机器学习》作者科普长文:从头构建类GPT文本分类器,代码开源
在Sebastian Raschka的长文中,他详细阐述了如何将预训练的大型语言模型(LLM)转化为文本分类器。文章首先强调了文本分类在商业应用中的重要性,如垃圾邮件...