AI大模型

Mamba 架构实现推理性能超 Gemma3-27B！推理模型开始迈入「无注意力」时代

PromptCoT-Mamba-7B是首个实现解码显存常量、计算复杂度线性、长上下文稳定扩展且具备强推理能力的模型，标志着推理大模型首次完全不依赖注意力机制而运作。...

AIGC动态

1年前 (2025)

谷歌研究团队提出了一种突破性的AI架构设计框架Miras，通过重新定义注意力机制和记忆管理方式，显著提升了序列模型的性能。该框架的核心创新在于将传统遗忘机...

AIGC动态

1年前 (2025)

OpenAI正在通过一系列收购和投资，构建一个以自身为中心的「隐秘初创企业帝国」。Sam Altman作为硅谷知名的天使投资人，其个人投资版图广泛，涵盖AI、生物技...

AIGC动态

1年前 (2025)

大模型的发展正在遭遇瓶颈，互联网文本数据的消耗导致AI模型性能提升速度明显放缓。相比之下，物理世界中蕴藏着数百倍甚至千倍的多模态数据，这些数据尚未被...

AIGC动态

1年前 (2025)

领先智能手机厂商正面临本地生成式AI、标准功能与云端数据交互带来的计算与功耗挑战。高端智能手机的SoC普遍采用异构架构，通过不同模块协同处理多样化任务。...

AIGC动态

1年前 (2025)

NPU作为AI浪潮中迅速崛起的专用芯片，已从智能手机扩展到笔记本电脑领域，成为驱动各类AI功能的核心硬件。这种受脑神经网络启发的处理器架构，通过硬件级并行...

AIGC动态

1年前 (2025)

ElevenLabs最新发布的AI语音合成模型Eleven v3，标志着文本转语音技术的显著进步。该模型支持70多种语言，包括中文，并能够进行多人对话，展现出丰富的情感表...

AIGC动态

1年前 (2025)

第七届智源大会于6月6日在北京召开，北京智源人工智能研究院发布了“悟界”系列大模型，标志着AI技术从数字世界向物理世界的加速迈进。这一系列包括原生多模态...

AIGC动态

1年前 (2025)

智源大会2024以“AI春晚”规格拉开帷幕，人形机器人冠军天工与宇树G1同台展示技能迭代成果。宇树G1凭借灵活拳击动作展现运动控制突破，天工2.0版本则从长跑转向...

AIGC动态

1年前 (2025)

微软发布的《AI Agent系统故障模式分类》白皮书系统梳理了智能体系统的安全风险，将故障分为新型和既有两大类，并提出了针对性设计建议。新型故障主要源于恶...

AI-Agent

1年前 (2025)