标签:张量并行

GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?

在人工智能领域,对于高端GPU的狂热追求并非总是最佳解决方案。尽管GPU在并行处理能力上具有优势,但其显存容量受限,且成本高昂,对于科研人员和应用厂商来...

想跑千亿大模型?算力厂商放大招!CPU通用服务器成为新选择

浪潮信息在其NF8260G7通用服务器上成功运行了千亿参数规模的源2.0大模型,这一技术突破使得传统行业在不更换硬件的情况下也能利用AI技术。该服务器仅使用了4...