标签:Transformer

腾讯放大招,超Meta!史上参数最大,开源专家混合模型

腾讯公司在开源大模型领域推出了一款名为Hunyuan-Large的超大模型,该模型基于Transformer架构,拥有3890亿参数,其中激活参数为520亿,能够处理长达256K的上...

每帧都是AI实时生成的,全球首款AI游戏问世了!

谷歌GameNGen的突破性技术使得AI能够基于扩散模型实时生成可玩的游戏,这一技术的发展预示着全球游戏产业的重大变革。紧随其后,Etched和Decart AI两家初创公...

全球首款AI游戏诞生!无需游戏引擎,视频模型直出「我的世界」

Decart和Etched两家初创公司联合推出了Oasis,这是一款无需游戏引擎即可实时生成开放世界游戏的AI基座模型。Oasis经过数百万小时游戏视频的训练,能够仅通过...

一个模型走天下!智源提出全新扩散架构OmniGen,AI生图进入「一键生成」时代

智源最近推出了一款名为OmniGen的新型扩散模型架构,旨在实现图像生成任务的统一。OmniGen模型以其统一性、简单性和知识迁移能力为特点,能够处理包括文生图...

新扩散模型OmniGen一统图像生成,架构还高度简化、易用

智源近日推出了OmniGen,这是一种新的扩散模型架构,旨在统一图像生成的多模态模型。OmniGen以其统一性、简单性和知识迁移能力为特点,支持多种图像生成任务...

陶哲轩神预言!Transformer破解百年三体难题,凭数学直觉找到李雅普诺夫函数

Meta研究者发现,Transformer模型能够解决132年前提出的数学难题——发现全局李雅普诺夫函数。这一发现被发表在NeurIPS 2024上,引起了AI社区的广泛关注。全局...

Transformer能否推理引争议,DeepMind连夜更新论文开源数据集:Transformer真的很强

DeepMind最近的研究在人工智能领域引起了广泛关注,他们训练了一个仅270M大小的Transformer模型,该模型在下棋任务中展现出了大师级的表现,且无需依赖搜索算...

大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了

最近,谷歌DeepMind的一篇论文《Grandmaster-Level Chess Without Search》引发了广泛关注。该论文介绍了一个参数量为2.7亿的Transformer模型,该模型无需依...

132年未解开的李雅普诺夫函数谜题,被Symbolic Transformer攻克了

AI在解决高级数学问题上的能力再次取得突破。Meta和巴黎理工学院的研究人员合作,针对数学界长期未解的李雅普诺夫函数问题提出了新的研究。李雅普诺夫函数是...

何恺明新作出炉!异构预训练Transformer颠覆本体视觉学习范式,AI性能暴涨超20%

异构性是构建通用机器人模型面临的主要挑战之一,因为它要求收集特定于每个机器人、任务和环境的数据,而这些策略往往无法泛化到其他设置。为了解决这一问题...
1 2 3 7