“架构”的搜索结果

图解Transformer架构设计

近年来，Transformer技术在自然语言处理（NLP）领域引起了巨大关注。Transformer是一种新型架构，利用注意力机制显著提升深度学习NLP翻...

AIGC动态

7个月前

英伟达在2023年的GTC开发者大会上发布了一款名为Blackwell的新型GPU，标志着AI算力的显著提升。Blackwell平台的GPU采用多芯片封装（MCM...

AIGC动态

7个月前

在GTC 2024发布会上，英伟达CEO黄仁勋宣布了一系列新产品，包括目前最强大的AI芯片Blackwell B200、NIM推理引擎、人形机器人平台Project...

AIGC动态

7个月前

马斯克旗下的大模型公司xAI宣布正式开源了3140亿参数的混合专家（MoE）模型「Grok-1」，这是目前参数量最大的开源大语言模型。Grok-1模...

AIGC动态

7个月前

这篇文章介绍了苹果公司在多模态大模型（MLLMs）领域的研究成果，通过一篇名为《MM1: Methods, Analysis & Insights from Multimodal LL...

AIGC动态

7个月前

苹果公司近期在生成式人工智能（GenAI）领域取得了显著进展，特别是在多模态大型语言模型（MLLM）的研究上。苹果CEO蒂姆·库克在2024年苹...

AIGC动态

7个月前

摘要总结：本文主要介绍了国内AIGC创业公司生数科技在多模态大模型领域的成就和技术创新。生数科技的U-ViT技术与OpenAI的Sora在架构上具...

AIGC动态

7个月前

机器之心专栏机器之心编辑部近期报道了Meta开源的LLaMA架构在大型语言模型(LLM)中的成功应用，以及最新研究成果VisionLLaMA的进展。Visi...

AIGC动态

7个月前

金磊和衡宇从凹非寺发来的报道揭示了一个引人入胜的故事，关于一家位于中关村的创业公司——智子引擎，以及它与OpenAI技术上的“撞车”事件...

AIGC动态

7个月前

Groq, 一家创业公司，因其自研的硬件加速器LPU（Language Processing Unit）一夜爆火，实现了500个token/s的推理速度，秒杀了ChatGPT。...

AIGC动态

7个月前