标签:GPU优化
一家中国公司,凭什么敢说自己是真正的“物理世界模拟器”?
在2024年,AI领域出现了一个新趋势,即从基于互联网数据训练的大模型转向与物理世界紧密结合的物理AI。这种转变意味着AI系统需要将物理世界的基本规律和特性...
Mamba一作再祭神作,H100利用率飙至75%!FlashAttention三代性能翻倍,比标准注意力快16倍
FlashAttention-3是针对H100 GPU优化的第三代FlashAttention技术,它在前一代的基础上实现了1.5至2倍的速度提升,将H100 GPU的FLOPs利用率提高到了75%。Flash...