大模型
LLM,VLM,模型
奖励模型也能Scaling!上海AI Lab突破强化学习短板,提出策略判别学习新范式
强化学习已成为推动人工智能向通用人工智能(AGI)发展的关键技术节点,但奖励模型的设计与训练一直是制约模型能力提升的瓶颈。当前,大语言模型通过Next Tok...
深夜开源首个万亿模型K2,压力给到OpenAI,Kimi时刻要来了?
月之暗面正式发布了 Kimi K2 大模型并开源,新模型同步上线并更新了 API,价格为 16 元人民币 / 百万 token 输出。此次发布赶在了全球大模型集中发布的风口浪...
刚刚,OpenAI想收购的Windsurf,被谷歌DeepMind抢走了核心团队
谷歌 DeepMind 宣布成功截胡 OpenAI 原本计划收购的 AI 初创公司 Windsurf,这一消息在科技界引起了广泛关注。DeepMind 的 CEO Demis Hassabis 和 CTO Koray ...
杨植麟交卷,Kimi 万亿参数K2开源:Agent能力紧逼Anthropic,延展DeepSeek,上手实测如何?
月之暗面在2025年7月11日深夜悄然开源了Kimi K2模型,这一举动标志着其在人工智能领域的重要进展。Kimi K2是一个万亿参数规模的混合专家(MoE)模型,激活参...
全球首个科研LLM竞技场上线!23款顶尖模型火拼:o3夺冠,DeepSeek第四
AI大模型在科研领域的应用日益广泛,但如何准确评估其科研能力仍是一个难题。为了解决这一问题,Ai2联合耶鲁大学和纽约大学推出了SciArena,这是一个专为科学...
ICML 2025 Spotlight | 快手、南开联合提出模块化双工注意力机制,显著提升多模态大模型情感理解能力!
新一代人工智能发展的重要方向是“情智兼备”,这是迈向通用人工智能的关键一步。在人机交互场景中,具备情智的数字人与机器人需要精准解译多模态交互信息,深...
外卖补贴大战之外,美团悄悄“买下”半个机器人赛道
美团在7月初通过大额补贴将外卖日订单量提升至超1亿单,展现了其在外卖市场的绝对统治力。这一举措被视为对京东入局外卖市场的全面反击,同时也标志着互联网...
前 OpenAI 研究员 Kevin Lu:别折腾 RL 了,互联网才是让大模型进步的关键
前 OpenAI 研究员 Kevin Lu 在其博客文章《The Only Important Technology Is The Internet》中提出,互联网而非 Transformer 等模型架构,才是推动人工智能...
OpenAI去年挖的坑填上了!奖励模型首现Scaling Law,1.8B给70B巨兽上了一课
POLAR是一种全新的奖励模型,采用了对比学习范式,通过衡量模型回复与参考答案的「距离」来给出精细分数。这一创新方法不仅减少了对海量人工标注的依赖,还展...
HBM,新大战
在AI模型参数量呈指数级增长的时代背景下,数据中心正经历一场从“算力至上”向“带宽驱动”的深刻变革。HBM(高带宽存储器)作为支撑大模型计算的核心基础设施,...