大模型

奖励模型也能Scaling！上海AI Lab突破强化学习短板，提出策略判别学习新范式

强化学习已成为推动人工智能向通用人工智能（AGI）发展的关键技术节点，但奖励模型的设计与训练一直是制约模型能力提升的瓶颈。当前，大语言模型通过Next Tok...

AIGC动态

3小时前

月之暗面正式发布了 Kimi K2 大模型并开源，新模型同步上线并更新了 API，价格为 16 元人民币 / 百万 token 输出。此次发布赶在了全球大模型集中发布的风口浪...

AI-Agent

3小时前

谷歌 DeepMind 宣布成功截胡 OpenAI 原本计划收购的 AI 初创公司 Windsurf，这一消息在科技界引起了广泛关注。DeepMind 的 CEO Demis Hassabis 和 CTO Koray ...

AIGC动态

3小时前

月之暗面在2025年7月11日深夜悄然开源了Kimi K2模型，这一举动标志着其在人工智能领域的重要进展。Kimi K2是一个万亿参数规模的混合专家（MoE）模型，激活参...

AI-Agent

3小时前

AI大模型在科研领域的应用日益广泛，但如何准确评估其科研能力仍是一个难题。为了解决这一问题，Ai2联合耶鲁大学和纽约大学推出了SciArena，这是一个专为科学...

AIGC动态

5小时前

新一代人工智能发展的重要方向是“情智兼备”，这是迈向通用人工智能的关键一步。在人机交互场景中，具备情智的数字人与机器人需要精准解译多模态交互信息，深...

AIGC动态

5小时前

美团在7月初通过大额补贴将外卖日订单量提升至超1亿单，展现了其在外卖市场的绝对统治力。这一举措被视为对京东入局外卖市场的全面反击，同时也标志着互联网...

AIGC动态

5小时前

前 OpenAI 研究员 Kevin Lu 在其博客文章《The Only Important Technology Is The Internet》中提出，互联网而非 Transformer 等模型架构，才是推动人工智能...

AIGC动态

5小时前

POLAR是一种全新的奖励模型，采用了对比学习范式，通过衡量模型回复与参考答案的「距离」来给出精细分数。这一创新方法不仅减少了对海量人工标注的依赖，还展...

AIGC动态

5小时前

在AI模型参数量呈指数级增长的时代背景下，数据中心正经历一场从“算力至上”向“带宽驱动”的深刻变革。HBM（高带宽存储器）作为支撑大模型计算的核心基础设施，...

AIGC动态

5小时前