标签:编程能力

北大图灵班3位00后夺ICPC 2024全球冠军!清华第三,北交大第七,浙大第十

在2024年9月15日至20日于哈萨克斯坦首都阿斯塔纳举行的第48届国际大学生程序设计竞赛(ICPC)全球总决赛中,北京大学信息科学技术学院的三名学生王蔚澄、王相...

刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限

OpenAI在9月13日宣布了其最新AI大模型系列的发布,这标志着大模型技术发展的新起点。新模型专门设计用于解决复杂问题,能够执行复杂推理,超越了以往科学、代...

GPT-4o mini,你好!GPT-3.5 彻底再见!|AI 鲜测

OpenAI 最新推出的 GPT-4o mini 模型以其卓越的性价比和强大的多模态能力,重新定义了 AI 成本效益的标准。在 MMLU 中以 82% 的得分领先市场,成本仅为每百万...

马斯克新作!Grok-1.5V多模态模型震撼发布:数字与物理世界完美融合

模型Grok-1.5V的概述与特点马斯克的xAI团队推出了新的多模态模型Grok-1.5V,这是一个具有划时代意义的AI模型,它不仅在多项基准测试中超越了GPT-4V,还展示了...

GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了

DevBench团队最近推出了首个AI软件工程师Devin,它的能力在技术界引起了广泛关注。Devin不仅能够解决编码任务,还能独立完成软件开发的整个周期,包括项目规...

“AI程序员”Devin大杀四方后,人类程序员开始了他们的反击……

近期,首个AI程序员Devin的发布引发了广泛关注。Devin展示了AI自主处理各种程序任务的能力,其中包括生成“生命游戏”的演示,这是由英国数学家约翰·何顿·康威...

UC伯克利「LLM排位赛」结果出炉!Claude 3追平GPT-4并列第一

新智元报道了Anthropic公司推出的Claude 3模型,该模型在数据集跑分和用户体验方面均领先于GPT-4。尽管以往的新模型在跑分上超越GPT-4,但实际体验往往不如GP...