DeepSeek玩家能提前拿苹果新品！只要15万元，在家跑满血版R1

82 0 0

文章摘要

【关键词】 M3 Ultra、DeepSeek R1、本地推理、性价比、大模型

搭载M3 Ultra芯片的Mac Studio在本地运行满血版DeepSeek R1模型的表现引发了广泛关注。M3 Ultra作为苹果最新的高性能芯片，配备了32核中央处理器、80核图形处理器和32核神经网络引擎，结合512GB统一内存和1TB固态硬盘，展现了强大的计算能力。通过Thunderbolt 5互连技术，两台Mac Studio成功运行了671B参数的DeepSeek R1模型，实际速度达到11 tokens/秒，理论峰值可达20 tokens/秒。尽管单台设备价格高达74249元，但相较于传统需要多张A100显卡的方案，M3 Ultra版Mac Studio被认为是“性价比最高的大模型一体机”。

在性能测试中，M3 Ultra展现了其在大模型本地推理中的优势。例如，B站博主“虽然但是张黑黑”的测试结果显示，采用Ollama的GGUF格式时，速度为15.78 tokens/秒，而使用更适合苹果的MLX格式时，速度提升至19.17 tokens/秒，几乎与在线使用DeepSeek R1的速度相当。此外，外网博主Xcreate将M3 Ultra与M4 Max进行了对比，发现两者在CPU性能上接近，但在运行DeepSeek R1 70B模型时，M3 Ultra的速度略胜一筹，分别为11.3 tokens/秒和10.69 tokens/秒。

值得注意的是，尽管671B参数的DeepSeek R1模型体量更大，但其运行速度却比70B模型更快。这是因为DeepSeek将671B模型分片为“专家混合体”，实际运行时根据问题切换，类似于运行30B的模型，从而提高了效率。此外，测试中还发现，8bit量化版本的DeepSeek R1运行速度为9-21 tokens/秒，而4bit量化版本的速度为16-18 tokens/秒，进一步验证了M3 Ultra在处理大模型时的灵活性。

然而，博主也提醒用户，苹果可能在今年WWDC上发布M4 Ultra芯片，因此对于计划在本地运行大模型的用户来说，观望M4 Ultra的表现可能是更明智的选择。总体而言，M3 Ultra版Mac Studio在本地大模型推理中的表现不仅展示了苹果芯片的强大性能，也为用户提供了一种相对经济高效的解决方案，推动了本地运行大模型的风潮。