标签：开源基准

Claude挣钱强于o1！OpenAI开源百万美元编码基准，检验大模型钞能力

OpenAI推出并开源了全新基准测试SWE-Lancer，旨在通过真实软件工程任务评估大模型的编码能力。该基准包含来自自由职业平台Upwork的1,488个任务，总价值达100...

AIGC动态

7个月前

全球首测！OpenAI开源SWELancer，大模型冲击100万年薪

OpenAI近日开源了名为SWE-Lancer的新型大模型代码能力评估基准，该测试基准通过真实软件开发任务和端到端测试方法，为评估大语言模型的工程实践能力提供了新...

AIGC动态

7个月前