DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1

AIGC动态22小时前发布 QbitAI
82 0 0
DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1

 

文章摘要


【关 键 词】 M3 UltraDeepSeek R1本地推理性价比大模型

搭载M3 Ultra芯片的Mac Studio在本地运行满血版DeepSeek R1模型的表现引发了广泛关注。M3 Ultra作为苹果最新的高性能芯片,配备了32核中央处理器、80核图形处理器和32核神经网络引擎,结合512GB统一内存和1TB固态硬盘,展现了强大的计算能力。通过Thunderbolt 5互连技术,两台Mac Studio成功运行了671B参数的DeepSeek R1模型,实际速度达到11 tokens/秒,理论峰值可达20 tokens/秒。尽管单台设备价格高达74249元,但相较于传统需要多张A100显卡的方案,M3 Ultra版Mac Studio被认为是性价比最高的大模型一体机”

在性能测试中,M3 Ultra展现了其在大模型本地推理中的优势。例如,B站博主“虽然但是张黑黑”的测试结果显示,采用Ollama的GGUF格式时,速度为15.78 tokens/秒,而使用更适合苹果的MLX格式时,速度提升至19.17 tokens/秒,几乎与在线使用DeepSeek R1的速度相当。此外,外网博主Xcreate将M3 Ultra与M4 Max进行了对比,发现两者在CPU性能上接近,但在运行DeepSeek R1 70B模型时,M3 Ultra的速度略胜一筹,分别为11.3 tokens/秒和10.69 tokens/秒。

值得注意的是,尽管671B参数的DeepSeek R1模型体量更大,但其运行速度却比70B模型更快。这是因为DeepSeek将671B模型分片为“专家混合体”,实际运行时根据问题切换,类似于运行30B的模型,从而提高了效率。此外,测试中还发现,8bit量化版本的DeepSeek R1运行速度为9-21 tokens/秒,而4bit量化版本的速度为16-18 tokens/秒,进一步验证了M3 Ultra在处理大模型时的灵活性。

然而,博主也提醒用户,苹果可能在今年WWDC上发布M4 Ultra芯片,因此对于计划在本地运行大模型的用户来说,观望M4 Ultra的表现可能是更明智的选择。总体而言,M3 Ultra版Mac Studio在本地大模型推理中的表现不仅展示了苹果芯片的强大性能,也为用户提供了一种相对经济高效的解决方案,推动了本地运行大模型的风潮。

原文和模型


【原文链接】 阅读原文 [ 724字 | 3分钟 ]
【原文作者】 量子位
【摘要模型】 deepseek-v3
【摘要评分】 ★☆☆☆☆

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...