“架构”的搜索结果

图解Transformer架构设计
近年来,Transformer技术在自然语言处理(NLP)领域引起了巨大关注。Transformer是一种新型架构,利用注意力机制显著提升深度学习NLP翻...
英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍
英伟达在2023年的GTC开发者大会上发布了一款名为Blackwell的新型GPU,标志着AI算力的显著提升。Blackwell平台的GPU采用多芯片封装(MCM...
能炼10万亿参数模型!黄仁勋发布全新架构GPU,性能提升30倍,H100已成过去时
在GTC 2024发布会上,英伟达CEO黄仁勋宣布了一系列新产品,包括目前最强大的AI芯片Blackwell B200、NIM推理引擎、人形机器人平台Project...
马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载
马斯克旗下的大模型公司xAI宣布正式开源了3140亿参数的混合专家(MoE)模型「Grok-1」,这是目前参数量最大的开源大语言模型。Grok-1模...
苹果终于入局大模型了:300亿参数、MoE 架构,手机要迎来全面的大变革了?
这篇文章介绍了苹果公司在多模态大模型(MLLMs)领域的研究成果,通过一篇名为《MM1: Methods, Analysis & Insights from Multimodal LL...
苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人
苹果公司近期在生成式人工智能(GenAI)领域取得了显著进展,特别是在多模态大型语言模型(MLLM)的研究上。苹果CEO蒂姆·库克在2024年苹...
比 Sora DiT 架构早两个月的 U-ViT,由这家中国 AIGC 公司提出
摘要总结:本文主要介绍了国内AIGC创业公司生数科技在多模态大模型领域的成就和技术创新。生数科技的U-ViT技术与OpenAI的Sora在架构上具...
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA
机器之心专栏机器之心编辑部近期报道了Meta开源的LLaMA架构在大型语言模型(LLM)中的成功应用,以及最新研究成果VisionLLaMA的进展。Visi...
人大系初创与OpenAI三次“撞车”:类Sora架构一年前已发论文
金磊和衡宇从凹非寺发来的报道揭示了一个引人入胜的故事,关于一家位于中关村的创业公司——智子引擎,以及它与OpenAI技术上的“撞车”事件...
揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!
Groq, 一家创业公司,因其自研的硬件加速器LPU(Language Processing Unit)一夜爆火,实现了500个token/s的推理速度,秒杀了ChatGPT。...
1 3 4 5 6 7 99