“架构”的搜索结果

没上过大学的“天才少年”大战OpenAI!偷架构?偷论文?到底谁在剽窃AI 开源项目
OpenAI最近发布了一个名为Swarm的开源框架,旨在帮助开发者构建、编排和部署多代理系统。Swarm框架的核心是智能体和交接两个基础抽象,...
基于Mamba架构的,生物医学文本分析大模型
生物医学文献的复杂性对传统模型构成挑战,因为它们难以处理专业术语的多义性和快速更新的知识。为了应对这些挑战,美国伦斯勒理工学院...
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
Meta公司最近推出了一款名为Movie Gen的先进媒体基础模型,该模型包括两个部分:Movie Gen Video和Movie Gen Audio。Movie Gen Video是...
非Transformer架构新模型爆火,从第一性原理出发,MIT CSAIL衍生团队打造
MIT初创团队Liquid AI推出了一种新型架构模型LFM(Liquid Foundation Model),在性能上超越了同等规模的Transformer模型如Llama3.2。LF...
MIT系初创打破Transformer霸权!液体基础模型刷新SOTA,非GPT架构首次显著超越Transformer
MIT系初创公司Liquid AI推出了一种新型多模态非Transformer模型——液体基础模型LFM,该模型在基准测试中超越了现有的Transformer模型,成...
「群体智能」剑指AGI革命!国产架构挑战Transformer霸权,首款非Attention模型更新
国内AI初创团队RockAI提出了一种新的方法来实现通用人工智能(AGI),即通过“群体智能”来赋予每个设备智能,并实现类人交互。他们认为,...
Kimi 背后的长文本大模型推理实践:以 KVCache 为中心的分离式推理架构
在AICon全球人工智能开发与应用大会上,月之暗面高级研发工程师唐飞虎分享了Kimi智能助手背后的推理加速方案,以及该方案在设计时所需要...
5 个月从 0 到 1,Meta 如何利用单体架构实现 Threads 的快速开发?
在2023年1月,Meta公司面临了一个紧迫的挑战:在数月内开发一款能与Twitter竞争的微博服务。为了应对这一挑战,Meta迅速组建了一支团队...
论文荣登计算机体系结构顶会ISCA,芯片架构成为边缘AI最佳并行计算选择
随着AI大模型的快速发展,对GPU的需求不断增长,同时边缘AI应用的兴起也推动了边缘AI服务器和加速处理器市场的增长。在众多计算架构中,...
非Transformer架构站起来了!首个纯无注意力大模型,超越开源巨头Llama 3.1
阿布扎比技术创新研究所(TII)发布了一款名为Falcon Mamba 7B的新型开源Mamba架构模型,该模型自2023年12月首次推出以来,已成为Transf...
1 2 3 98