“模型评测”的搜索结果

GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了
DevBench团队最近推出了首个AI软件工程师Devin,它的能力在技术界引起了广泛关注。Devin不仅能够解决编码任务,还能独立完成软件开发的...
清华系面壁MiniCPM:国产AI模型新突破,2B小钢炮成本效率双优
面壁MiniCPM模型是一款由清华系创业团队面壁智能发布的人工智能模型,具有24亿参数。该模型在多项AI评测中取得了领先成绩,成功挑战了70...
1 2 3