并行计算 | 学习AIGC

狂拿大模型明星订单，一家清华系HPC-AI Infra公司浮出水面

93年创始人闫博文带领的是石科技在高性能计算领域展现出独特的发展路径。这家从国家超级计算无锡中心孵化而来的企业，凭借深厚的技术积累，在不盲目囤积算力...

AIGC动态

2个月前

MoE推理「王炸」组合：昇腾×盘古让推理性能狂飙6-8倍

华为团队推出的Pangu Pro MoE 72B模型在昇腾平台上实现了显著的推理性能提升，通过系统级软硬协同优化，推理性能提升6~8倍。该模型采用混合专家（MoE）架构，...

AIGC动态

3个月前

博士宿舍激情脑暴，革新了Scaling Law？Qwen和浙大联手推出新定律，直接干掉95.5%推理内存！

阿里巴巴研究团队与浙江大学合作提出了一种新的并行计算缩放定律（ParScale），该定律通过在训练和推理阶段增加并行计算量，显著提升大模型的能力，同时保持...

AIGC动态

4个月前

黄仁勋被实习生说服用 CUDA，但遭团队嫌弃？！英伟达早期架构师首次曝光：12 人团队如何开启“算力帝国”

在 NVIDIA 的一次内部对话中，三位员工 Nader、Stephen 和 Carter 分享了他们对 CUDA 技术发展及其在计算科学和 AI 领域应用的见解。Stephen 作为 CUDA 架构...

AIGC动态

6个月前

「注意力实际上是对数的」？七年前的Transformer还有新发现，Karpathy点赞

在当前的AI社区中，注意力机制的计算复杂度问题再次引发了广泛讨论。作者提出了一种全新的视角，认为Transformer中的注意力机制在计算复杂度上应被视为对数级...

AIGC动态

6个月前

英伟达AI算力的五个层次，2024年GTC大会GB200技术全拆解！

根据文章内容，可以总结如下：1. 英伟达在2024GTC大会上发布了全新的Blackwell AI芯片，研发成本高达100亿美元。该芯片具有非常强大的性能，在单芯片层面就已...

AIGC动态

1年前 (2024)

一文读懂：GPU是如何工作的？

根据文章内容的详细介绍和分析，我总结了以下关键观点：1. GPU的工作原理是通过大量并行线程来加速计算，特别适合于执行大量重复性高的计算任务。2. 与CPU相...

AIGC动态

1年前 (2024)

从零开始手搓GPU，照着英伟达CUDA来，只用两个星期

Adam Majmudar，一位美国web3开发公司的创始工程师，分享了他在两周内从零开始构建GPU的经历。他的项目在GitHub上公开，获得了5300个Star。Majmudar的GPU设计...

AIGC动态

1年前 (2024)

超越英伟达！字节跳动MegaScale如何实现大规模GPU的高效利用？

在2024年2月，字帖跳动发布了一篇关于大语言模型训练框架的论文《MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs》。MegaScale...

AIGC动态

2年前 (2024)

标签：并行计算

狂拿大模型明星订单，一家清华系HPC-AI Infra公司浮出水面

MoE推理「王炸」组合：昇腾×盘古让推理性能狂飙6-8倍

博士宿舍激情脑暴，革新了Scaling Law？Qwen和浙大联手推出新定律，直接干掉95.5%推理内存！

黄仁勋被实习生说服用 CUDA，但遭团队嫌弃？！英伟达早期架构师首次曝光：12 人团队如何开启“算力帝国”

「注意力实际上是对数的」？七年前的Transformer还有新发现，Karpathy点赞

英伟达AI算力的五个层次，2024年GTC大会GB200技术全拆解！

一文读懂：GPU是如何工作的？

从零开始手搓GPU，照着英伟达CUDA来，只用两个星期

超越英伟达！字节跳动MegaScale如何实现大规模GPU的高效利用？

热门网址

标签：并行计算

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址