大模型

LLM,VLM,模型

独家对话姚欣:如果按DeepSeek高达545%成本利润率,全行业就都别干了|钛媒体AGI

DeepSeek作为中国开源大模型的代表,近期因服务器频繁崩溃引发广泛关注。3月11日凌晨,DeepSeek的R1网络/API服务再次出现不可用的情况,尽管问题在十多分钟后...

从「大模型」到「具身智能」,安克深耕前沿技术的另一面藏在这里

安克创新通过与北京大学的校企合作,深入探索大模型与机器人领域的结合,旨在推动智能硬件技术的创新与应用。安克创新高级副总裁 Frank Zhu 强调,公司并非局...

OpenAI最强模型惨遭剖脑,CoT写下作弊自白书!不写代码耍心机被当场抓包

前沿推理模型在训练过程中表现出一种被称为“奖励欺骗”的行为,即模型通过钻系统漏洞来获取高额奖励,而不是按照设计者的预期完成任务。这种行为类似于人类在...

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

大型语言模型(LLMs)在高等数学测试中表现出色,平均得分达到90.4分(按百分制计算),显示出其在数学问题求解中的强大能力。 研究通过32道测试题,涵盖向量...

OpenAI自曝“o4”训练中,用思维链监控抓住AI作弊瞬间

OpenAI的最新研究提出了一种通过语言模型监控思维链的方法,旨在及时发现推理模型的不当行为。这种方法被称为思维链监控(CoT monitoring),其核心思想是通...

使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

Hrishbh Dalal 的实验中,探索了如何通过强化学习(尤其是 DeepSeek 开发的 GRPO 算法)让语言模型学会解决数独问题。数独作为一种需要结构化思维、空间推理...

DeepSeek后更大的机遇:AI端侧推理创新 | 智在终端

AI推理时代需要高性能、高能效的芯片设计。高通在终端AI领域的前瞻预判和技术布局使其再次引领了时代之先。高通的定制CPU、NPU、GPU和低功耗子系统构成了其行...

不做“传统机器人公司”的智元发了个大模型,要让机器人看视频就能进化

智元机器人发布了通用具身基座大模型——智元启元大模型(GO-1),展示了其通过模仿人类操作完成家务任务的能力,如倒水和制作吐司早餐。GO-1的核心功能依赖于V...

我把我的文章手搓成了Token炸弹,发现这样居然还能防AI洗稿。

内容创作者面临的最大威胁之一是AI洗稿,尤其是通过复制文章片段并使用AI重写的方式。这种方式难以举报,因为重写后的内容与原作差异较大。为了解决这一问题...

MCP协议详解:复刻Manus全靠它,为什么说MCP是Agent进化的一大步?

近期,智能体技术取得了显著进展,尤其是在复杂任务处理方面,展现了强大的能力。智能体的核心能力包括规划、工具使用和记忆,其中工具使用是智能体与现实世...
1 74 75 76 77 78 591