标签:大语言模型

奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式

强化学习已成为推动人工智能向通用人工智能(AGI)发展的关键技术节点,但奖励模型的设计与训练一直是制约模型能力提升的瓶颈。当前,大语言模型通过Next Tok...

搜索领域的下一个重大转变:从产品到基础设施

随着AI技术的广泛应用,搜索功能正在经历一场根本性的转变,从人类直接使用的产品演变为支撑AI运转的数字基础设施。搜索将成为AI时代的信息供给系统,为数百...

Hugging Face开源顶级模型:双模式推理+128K上下文,最强3B

全球著名大模型开放平台Hugging Face近日开源了顶级小参数模型SmolLM3,该模型仅有30亿参数,但其性能显著超越了Llama-3.2-3B和Qwen2.5-3B等同类开源模型。Sm...

彻底戳穿AI「失忆症」!超越OpenAI全局记忆,中国队开源LLM记忆操作系统

大语言模型在长期知识管理与个性化演进方面存在本质缺陷,主要表现为难以平衡效率、可追溯性与长期适应性。记忆张量团队联合多家顶尖机构研发的MemOS框架,通...

人机协同筛出2600万条数据,七项基准全部SOTA,昆仑万维开源奖励模型再迎新突破

大语言模型(LLM)的生成能力虽然强大,但其输出是否符合人类偏好需要依赖奖励模型(Reward Model, RM)的精准评判。奖励模型在大模型训练中扮演着关键角色,...

LLM进入「拖拽时代」!只靠Prompt,几秒定制一个大模型,效率飙升12000倍

最近,来自新加坡国立大学、得克萨斯大学奥斯汀分校等机构的研究人员提出了一种名为「拖拽式大语言模型」(DnD)的创新方法,能够基于提示词快速生成模型参数...

AI圈纷纷传阅,Andrej Karpathy 的最新演讲全文来了

Andrej Karpathy在首届YC AI创业学校的演讲中,深入探讨了人工智能时代软件的变革及其对未来编程范式的影响。他提出,软件正在经历第三次革命,即“软件3.0”,...

一次集成,减少 80% 适配工作!从 0 到 1 开发一款 MCP Server 难不难?

Base44的8000万美元收购案例展现了小型技术团队在AI领域的巨大潜力,仅用8名员工和180天就完成了从开发到退出的全过程。这一成功案例打破了硅谷传统创业模式...

TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨

在大语言模型(LLMs)竞争日益激烈的背景下,推理能力成为评估模型性能的关键指标。测试时缩放(TTS)作为一种新兴策略,通过优化推理过程(如多数投票、蒙特...

DeepSeek之后,每一家公司都是Agent

以DeepSeek-R1为代表的大型语言模型,在推理方面展现了巨大的进步,这种进步对企业和个人而言是一个重要的发展机遇。尽管这些模型功能强大,但也存在一定的问...
1 2 3 11