标签:硬件优化

梁文锋亲自挂名,DeepSeek 最新论文丢出注意力新机制,推理速度直线提升 11 倍

DeepSeek研究团队近期发布了一种名为NSA的新型注意力机制,其核心设计包含动态分层稀疏策略、粗粒度token压缩与细粒度token选择三大技术要素。该机制通过优化...

DeepSeek满血微调秘籍来了,全网首发打破低价内卷!解锁升级版全家桶

Colossal-AI近期发布了开源大模型后训练工具箱,旨在帮助开发者通过低成本方式对DeepSeek V3/R1等大规模模型进行监督微调与强化学习优化。该工具箱支持高达67...

英伟达CUDA的护城河到底有多深?

英伟达(Nvidia)在GPU市场中面临来自英特尔和AMD的激烈竞争,这两家公司的新加速器在内存容量、性能和价格方面对英伟达的芯片构成挑战。英伟达通过近二十年...

ChatGPT一年电费高达2亿元,AI 为何如此耗电?| 钛媒体AGI深度

随着ChatGPT等人工智能技术的快速发展,其背后的能源消耗问题也日益凸显。Arm公司CEO哈斯预测,到2030年,AI数据中心可能会消耗美国20%至25%的电力,远超今天...

49152 个GPU!Meta最新算力集群曝光,扎克伯格:算力,算力,还是 Meta 的算力

Meta最近披露了两个新的GPU集群,用于训练下一代生成式人工智能模型,包括即将推出的Llama 3和其他领域的人工智能研究与开发。这两个集群在硬件、网络、存储...