Claude 急了！模型降智，官方长文用 bug 搪塞？开发者怒怼“太晚了”：承认不达标为何不退钱？

93 0 0

文章摘要

Anthropic的Claude模型在8月至9月初出现质量下降问题，引发用户不满。Anthropic将问题归咎于三项基础设施漏洞，并进行了详细解释。

用户反馈Claude响应降级，开发者认为其质量变差。Anthropic坦承最初未发觉问题，后经调查发现三项互不关联的基础设施bug。用户上报的问题纯由基础设施bug所导致，Anthropic未能落实确保基础设施变更不影响模型输出的标准。

Claude通过多平台为全球用户提供服务，每个平台需相应优化，基础设施变更需审慎验证。三项bug相互交织，诊断困难。第一项bug于8月5日出现，影响部分请求；8月25日和26日，另外两项bug依次出现；8月29日负载均衡变化使受影响流量增加。

具体三个bug包括：上下文窗口路由错误，部分请求被错误路由，影响部分用户，9月完成修复；输出异常，错误配置导致token生成出错，9月2日撤销配置并添加检验测试；近似top – k XLA:TPU编译错误，影响部分模型响应，进行回滚并修复编译器bug。

深入研究发现，XLA编译器bug与混合精度算法有关，修复过程又引发更深层次bug。该bug变化不定，导致严重不一致。Anthropic决定用效率换稳定性，切换为精确top – k运算。

检测困难的原因在于，原有评估无法捕捉性能下降根源，Claude能从孤立错误中恢复，且隐私保护措施给调查带来挑战，各项bug在不同平台症状有别，上报情况混乱。

Anthropic提出改进方案，包括建立更灵敏评估方法、扩大质量评估范围、提升调试工具速度。然而，许多用户不再买账，要求退款或赠送免费服务。Claude用户流失数月，原因不仅在于技术问题，还包括使用限制变严格，付费后问题依旧存在，且官方对用户具体问题回复少。Anthropic能否挽回用户信任，需更多“真诚”措施。