“注意力机制”的搜索结果

新架构RNN反超Transformer:每个隐藏状态都是一个模型,一作:从根本上改变语言模型
一项新的架构TTT(Test-Time Training)向现有的Transformer模型发起了挑战,提出了一种在测试时也能学习的模型,旨在从根本上改变语言...
大模型最强架构TTT问世!斯坦福UCSD等5年磨一剑, 一夜推翻Transformer
斯坦福大学、加州大学圣地亚哥分校、加州大学伯克利分校和Meta的研究人员提出了一种名为测试时间训练层(Test-Time-Training layers,TT...
谷歌推出全新模型,将Transformer与NAR相结合
在AIGC领域,Transformer架构的引入极大地推动了大模型的技术创新,催生了ChatGPT、Coplit、讯飞星火、文心一言等生成式AI产品。尽管Tra...
快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅
可灵AI的图生视频和视频续写功能在全球范围内引发了视频创作的热潮。一位网友使用该技术将爷爷的两张老照片还原成视频,不仅为即将接受...
谷歌推出基于Transformer的创新技术——无限注意力
随着生成式AI产品如ChatGPT和Sora等的流行,Transformer架构已成为处理文本、图像、视频和音频等数据的大型语言模型(LLM)的基础。谷歌...
拯救Transformer推理能力!DeepMind新研究TransNAR:给模型嵌入「算法推理大脑」
DeepMind最近提出了一种结合Transformer和神经算法推理器(NAR)的混合架构方法,以解决Transformer模型在算法推理任务上的缺陷。这种新...
北大快手攻克复杂视频生成难题!新框架轻松组合各种细节,代码将开源
北京大学与快手AI团队合作提出了一个名为VideoTetris的新框架,旨在解决高难度、指令复杂的视频生成问题。该框架通过类似于拼图游戏俄罗...
苹果智能背后模型公布:3B模型优于Gemma-7B,服务器模型媲美GPT-3.5-Turbo
苹果推出了深度集成于iOS 18、iPadOS 18和macOS Sequoia的全新个性化智能系统——Apple Intelligence。该系统包含两种基础模型:一款拥有...
媲美Sora,最长2分钟!快手发布文生视频大模型-可灵
快手AI团队最新发布的大模型“可灵”引人瞩目,该模型具备文本生成视频的能力,能够创作出2分钟长、1080P分辨率、每秒30帧的超长视频。在...
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
本文介绍了一款名为可灵的全新国产视频生成大模型,它是快手公司推出的产品级应用。可灵采用了类似Sora的技术路线,融合了多项自研技术...
1 2 3 4 5 9