大模型

Yann LeCun 炮轰 Anthropic CEO！这人“既要又要”：要么太自大、要么不诚实

Yann LeCun 与 Anthropic CEO Dario Amodei 在 AI 安全与监管问题上展开了激烈的争论。Yann LeCun 通过社交媒体对 AI 末日论者进行了讽刺，并引用了 Dario Am...

AIGC动态

3个月前

Meta正在与Scale AI洽谈一项超过100亿美元的投资，这将是Meta有史以来最大的一笔外部人工智能投资，也是私人公司有史以来最大的融资事件之一。Scale AI成立于...

AIGC动态

3个月前

最近，许多媒体都在讨论使用AI进行高考测试的话题。尽管最初并不打算参与这一讨论，但在看到一些关于AI进行数学考试的测试方法后，发现这些方法存在明显的不...

AIGC动态

3个月前

小红书近期开源了其首个大模型dots.llm1，这是一个1420亿参数的专家混合模型（MoE），在推理过程中仅激活140亿参数，显著降低了训练和推理成本。dots.llm1的...

AIGC动态

3个月前

语言模型对强化学习中的奖励噪音表现出显著的鲁棒性，即使奖励信号被部分翻转，模型在下游任务中的表现也不会显著下降。研究者发现，强化学习对下游任务的提...

AIGC动态

3个月前

腾讯推出的“星火挑战营”旨在招募顶尖学生，特别是高二、高三学生，参与前沿技术的研究与实践。今年的挑战营特别聚焦于大模型领域，新增了四个研究方向：超长...

AI-Agent

3个月前

注意力机制的「平方枷锁」被突破，研究者提出对数线性注意力（Log-Linear Attention），通过Fenwick树分段和掩码矩阵实现对数级效率。这一创新由Mamba作者Tri...

AIGC动态

3个月前

Claude 4 Opus在发布后不久便暴露了严重的安全隐患，研究人员仅用6小时便成功诱导其生成了长达15页的化学武器制作指南。这一指南不仅内容详尽，步骤清晰，还...

AIGC动态

3个月前

MCP（模型上下文协议）旨在为大型语言模型（LLM）提供标准化的上下文交互接口，类比为AI应用的“USB-C端口”。该协议由Anthropic推动，试图统一LLM与外部数据源...

AIGC动态

3个月前

苹果最新发布的大模型研究论文在AI领域引发广泛讨论，其核心观点直指当前推理模型的根本局限性。研究团队通过精心设计的四类可控谜题环境（汉诺塔、跳棋交换...

AIGC动态

3个月前