大模型
LLM,VLM,模型
被《经验时代》刷屏之后,剑桥博士长文讲述RL破局之路
强化学习(RL)与大型语言模型(LLM)的结合在2025年展现了巨大的潜力,尤其是在后训练时代。RL通过其在策略优化和创造力方面的优势,证明了其与LLM的互补性...
8大主流AI Agent平台深度测评:哪款最值得入手?| 赠书福利
AI Agent(人工智能代理)是一种能够感知环境、自主理解、决策并执行动作的智能体,具备通过独立思考调用工具实现目标的能力。与依赖提示词交互的大模型不同...
TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨
在大语言模型(LLMs)竞争日益激烈的背景下,推理能力成为评估模型性能的关键指标。测试时缩放(TTS)作为一种新兴策略,通过优化推理过程(如多数投票、蒙特...
AI 智能体老“崩”?DeepSeek 前员工联手李飞飞等大佬开源新框架,教会模型真正推理
2025年被许多人视为“AI智能体元年”,然而当前大多数智能体仍处于实验阶段,尚未真正进入企业应用。李飞飞团队与多所大学及微软合作,推出了名为RAGEN的新系统...
高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI
昆仑万维最新发布的Skywork-R1V 2.0版本,标志着多模态推理模型的又一次重大突破。作为全球首个工业界多模态推理模型,R1V 2.0不仅在技术上实现了显著进化,...
刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦
OpenAI于今日凌晨发布了全新的图像生成模型GPT-image-1,并通过API向全球开发者开放使用。该模型与ChatGPT版本有显著不同,具备多项高级功能,包括控制生成图...
Deep Research类产品深度测评:下一个大模型产品跃迁点到来了吗?
Deep Research 产品是一种以大模型能力为基础,结合检索与报告生成的端到端系统,能够对信息进行迭代搜索和分析,并生成详细报告。这类产品在输出深度和训练...
Demis 谈 AI4S 最新进展:DeepMind 的 AlphaFold 一年就画了 2 亿个蛋白质!
蛋白质结构预测技术的快速发展正在彻底改变生物学和药物研发领域。DeepMind开发的AlphaFold系列模型,尤其是AlphaFold 3,能够在几分钟内预测蛋白质的三维结...
业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10
大规模强化学习在激发大型语言模型的复杂推理行为方面展现出显著效果,OpenAI 的 o1 系列和 DeepSeek-R1 的成功便是明证。然而,这些模型的核心训练方法在技...
腾讯、华为、微软、阿里专家齐聚一堂,共谈推理优化实践 | AICon
在人工智能快速发展的背景下,大模型的推理性能优化已成为应对算力挑战、内存瓶颈与通信压力的关键突破口。当前,优化工作主要围绕模型优化、推理加速与工程...