标签:端到端测试

全球首测!OpenAI开源SWELancer,大模型冲击100万年薪

OpenAI近日开源了名为SWE-Lancer的新型大模型代码能力评估基准,该测试基准通过真实软件开发任务和端到端测试方法,为评估大语言模型的工程实践能力提供了新...