标签：端到端测试

全球首测！OpenAI开源SWELancer，大模型冲击100万年薪

OpenAI近日开源了名为SWE-Lancer的新型大模型代码能力评估基准，该测试基准通过真实软件开发任务和端到端测试方法，为评估大语言模型的工程实践能力提供了新...

AIGC动态

7个月前