标签:高并发

飞书接入DeepSeek-R1后,用一次顶一万次,而且再也不「服务器繁忙」了

DeepSeek-R1模型因用户需求激增导致服务器持续处于高负载状态,巨大的访问量已引发第三方客户端和API服务的涌现。为应对这一趋势,DeepSeek在GitHub创建了集...

对话清华章明星、月之暗面许欣然:Mooncake架构背后,如何用“炒菜”的思路实现推理的极致优化

在硅星人首届AI创造者大会(ACC 2024)上,硅星人创始人兼CEO骆轶航与清华大学助理教授章明星和月之暗面Kimi工程副总裁许欣然共同探讨了AI推理架构的创新与开...