GPT-4.1 偷摸开测？神秘模型登顶编程榜，社区细扒指向 OpenAI，网友：营销鬼才又来了！

336 0 0

文章摘要

近日，一款名为“Quasar Alpha”的神秘AI模型悄然上线，迅速成为OpenRouter平台上使用率排名第一的编程类AI模型。该模型拥有100万token的上下文窗口，能够处理超长文本和复杂文档，代码生成能力出色，且完全免费提供使用。Quasar Alpha的推出引发了AI社区的广泛讨论，随后另一款名为Optimus Alpha的模型也上线，同样具备100万token上下文窗口和卓越的编码能力，且免费开放。这两款模型在多个用例中表现优异，尤其是在编程和复杂任务处理方面，被认为超越了现有的大多数模型。

Quasar Alpha的最大亮点在于其超长的上下文处理能力，能够一次性处理相当于数百页文档的信息量，使其在长序列任务中具备显著优势。该模型专门针对编码任务进行了优化，能够高效生成高质量代码，但其设计初衷仍定位于通用型AI工具，适用于从文本生成到数据分析的多样化应用。这种兼顾专业性与广泛性的设计，正在让Quasar Alpha在众多AI模型中脱颖而出，各类用例持续激增。

Optimus Alpha则针对通用任务进行了优化，适用于现实世界中的各种应用场景。值得注意的是，Optimus Alpha为300多家模型及供应商提供了一个与OpenAI兼容的补全API，用户可以直接调用它，也可以使用OpenAI软件开发工具包来调用。此外，还有一些第三方软件开发工具包可供使用。

尽管Quasar Alpha和Optimus Alpha的表现令人瞩目，但其具体来源至今未明。有猜测认为，这两款模型可能是某大型科技公司（如OpenAI或Google）的实验性项目，甚至可能是下一代旗舰模型的测试版。X用户paradite_注意到，Quasar Alpha的风格与OpenAI目前的顶级模型GPT-4o非常相似，这让人不禁怀疑Quasar Alpha是否出自OpenAI，只是换了个名字而已。此外，AI研究员Sam Paech通过生物信息学聚类工具PHYLIP简约法发现，Quasar Alpha与OpenAI的模型极为相近，尤其是与GPT 4.5预览版，并且与其他模型存在显著差异。

OpenAI的CEO Sam Altman也公开称赞了Quasar Alpha模型，称其是“非常明亮的事物”。有观点认为，AI实验室选择在没有大规模宣传的情况下秘密推出一款模型，是为了在不炒作的情况下于现实环境中进行测试，收集开发者真实的反馈意见，同时保持低调可以减轻满足过高期望所带来的压力。秘密发布还能够促使这款模型与市场上的其他模型进行更为公平、客观的比较，而不会受到营销宣传言论的干扰。

在性能方面，Quasar Alpha和Optimus Alpha表现出很强的能力，尤其是在编程和遵循指令方面。开源AI配对编程工具创建者AiderPaul Gauthier称，Quasar Alpha运行起来似乎非常快，在Aider多语言编码基准测试中取得了55%的成绩，可与o3 – mini – medium、DeepSeek V3以及Claude 3.5 Sonnet相抗衡。X用户paradite_在体验Quasar Alpha后表示，该模型在遵循指令方面比Claude 3.5 Sonnet和Gemini 2.5 Pro出色得多，并评价：“就我默认的编码测试提示而言，它给出了我目前为止所见过的最佳输出结果。”

模型体验者Austin Starks对Optimus Alpha和Quasar Alpha在进行一段时间的手动测试后称，对于复杂的SQL查询生成任务，这两款隐秘模型在PURE性能和准确率方面无疑是当今市面上最强大的选项。从公布的数据来看，Optimus Alpha和Quasar Alpha不单是完全可用，甚至远远超越了其他老牌经典模型。Optimus Alpha的平均得分达到了0.83，而Claude 3.7 Sonnet的平均得分仅为0.66。至于Gemini 2.0 Flash和Grok 3，它们的得分分别只有0.717和0.747。此外，二者的其他指标，如成功率（即模型是否执行完成）亦位居榜首。更要命的是，这两款模型还完全免费。

在成本方面，Quasar Alpha和Optimus Alpha的输入和输出均免费，而成本第二低的是Gemini 2.0 Flash，每百万输入token的成本为0.10美元，每百万输出token的成本为0.40美元。Starks认为，相较于还在按token收费的竞争对手，这些“世外高手”般的模型却正在重新定义零成本的可能性。虽然后续情况很可能发生变化，但这些不受限的模型当前确实可以随意使用。