GPT-4.1 偷摸开测?神秘模型登顶编程榜,社区细扒指向 OpenAI,网友:营销鬼才又来了!

AIGC动态3天前发布 ai-front
336 0 0
GPT-4.1 偷摸开测?神秘模型登顶编程榜,社区细扒指向 OpenAI,网友:营销鬼才又来了!

 

文章摘要


【关 键 词】 AI模型编程上下文免费OpenAI

近日,一款名为“Quasar Alpha”的神秘AI模型悄然上线,迅速成为OpenRouter平台上使用率排名第一的编程类AI模型。该模型拥有100万token的上下文窗口,能够处理超长文本和复杂文档,代码生成能力出色,且完全免费提供使用。Quasar Alpha的推出引发了AI社区的广泛讨论,随后另一款名为Optimus Alpha的模型也上线,同样具备100万token上下文窗口和卓越的编码能力,且免费开放。这两款模型在多个用例中表现优异,尤其是在编程和复杂任务处理方面,被认为超越了现有的大多数模型。

Quasar Alpha的最大亮点在于其超长的上下文处理能力,能够一次性处理相当于数百页文档的信息量,使其在长序列任务中具备显著优势。该模型专门针对编码任务进行了优化,能够高效生成高质量代码,但其设计初衷仍定位于通用型AI工具,适用于从文本生成到数据分析的多样化应用。这种兼顾专业性与广泛性的设计,正在让Quasar Alpha在众多AI模型中脱颖而出,各类用例持续激增。

Optimus Alpha则针对通用任务进行了优化,适用于现实世界中的各种应用场景。值得注意的是,Optimus Alpha为300多家模型及供应商提供了一个与OpenAI兼容的补全API,用户可以直接调用它,也可以使用OpenAI软件开发工具包来调用。此外,还有一些第三方软件开发工具包可供使用。

尽管Quasar Alpha和Optimus Alpha的表现令人瞩目,但其具体来源至今未明。有猜测认为,这两款模型可能是某大型科技公司(如OpenAI或Google)的实验性项目,甚至可能是下一代旗舰模型的测试版。X用户paradite_注意到,Quasar Alpha的风格与OpenAI目前的顶级模型GPT-4o非常相似,这让人不禁怀疑Quasar Alpha是否出自OpenAI,只是换了个名字而已。此外,AI研究员Sam Paech通过生物信息学聚类工具PHYLIP简约法发现,Quasar Alpha与OpenAI的模型极为相近,尤其是与GPT 4.5预览版,并且与其他模型存在显著差异。

OpenAI的CEO Sam Altman也公开称赞了Quasar Alpha模型,称其是“非常明亮的事物”。有观点认为,AI实验室选择在没有大规模宣传的情况下秘密推出一款模型,是为了在不炒作的情况下于现实环境中进行测试,收集开发者真实的反馈意见,同时保持低调可以减轻满足过高期望所带来的压力。秘密发布还能够促使这款模型与市场上的其他模型进行更为公平、客观的比较,而不会受到营销宣传言论的干扰。

在性能方面,Quasar Alpha和Optimus Alpha表现出很强的能力,尤其是在编程和遵循指令方面。开源AI配对编程工具创建者AiderPaul Gauthier称,Quasar Alpha运行起来似乎非常快,在Aider多语言编码基准测试中取得了55%的成绩,可与o3 – mini – medium、DeepSeek V3以及Claude 3.5 Sonnet相抗衡。X用户paradite_在体验Quasar Alpha后表示,该模型在遵循指令方面比Claude 3.5 Sonnet和Gemini 2.5 Pro出色得多,并评价:“就我默认的编码测试提示而言,它给出了我目前为止所见过的最佳输出结果。”

模型体验者Austin Starks对Optimus Alpha和Quasar Alpha在进行一段时间的手动测试后称,对于复杂的SQL查询生成任务,这两款隐秘模型在PURE性能和准确率方面无疑是当今市面上最强大的选项。从公布的数据来看,Optimus Alpha和Quasar Alpha不单是完全可用,甚至远远超越了其他老牌经典模型。Optimus Alpha的平均得分达到了0.83,而Claude 3.7 Sonnet的平均得分仅为0.66。至于Gemini 2.0 Flash和Grok 3,它们的得分分别只有0.717和0.747。此外,二者的其他指标,如成功率(即模型是否执行完成)亦位居榜首。更要命的是,这两款模型还完全免费。

在成本方面,Quasar Alpha和Optimus Alpha的输入和输出均免费,而成本第二低的是Gemini 2.0 Flash,每百万输入token的成本为0.10美元,每百万输出token的成本为0.40美元。Starks认为,相较于还在按token收费的竞争对手,这些“世外高手”般的模型却正在重新定义零成本的可能性。虽然后续情况很可能发生变化,但这些不受限的模型当前确实可以随意使用。

原文和模型


【原文链接】 阅读原文 [ 2439字 | 10分钟 ]
【原文作者】 AI前线
【摘要模型】 deepseek-v3
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...