标签:代码生成

超GPT-4o,代码能力超强!Claude 3.5 Sonnet正式发布

这是Claude 3.5系列中的首个模型,也是Anthropic目前最强的视觉模型。Sonnet的性能不仅超过了上一代Claude 3旗舰模型Opus,还大幅度超越了OpenAI的GPT-4o和谷...

国产开源之光 Qwen2-72B 大战海外霸主 Llama3-70B |AI 鲜测

Qwen2模型在高考第一天(6月7日)正式开源,迅速引起了广泛关注。其中参数最大的Qwen2-72B在多语言能力、代码生成、数学推理、长文本处理等方面表现出色,同...

超越 Devin,姚班带队 OpenCSG 刷新大模型编程 SWEBench 评测榜单

中国初创公司OpenCSG推出的StarShip CodeGen Agent在全球编程评测排行榜上取得了显著成绩,以23.67%的通过率成为普林斯顿SWEBench排行榜的第二名,同时创下了...

Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star

Meta发布开源大模型llama3系列后,该模型在多个关键基准测试中表现优异,尤其在代码生成任务上处于领先地位。开发者们迅速开始尝试本地部署和实现,如llama3...

对话蚂蚁李建国:当前AI写代码相当于L2.5,实现L3后替代50%人类编程

```李建国,蚂蚁集团代码大模型CodeFuse的负责人,清华大学博士,机器学习和深度学习领域的资深专家,认为未来3-5年内,人类50%的编程工作可以被AI替代,部分...

首个AI程序员造假被抓,Devin再次“震撼”硅谷!扒皮视频文字详解附上

首个AI程序员Devin被指控演示视频造假。油管程序员博主Internet of Bugs(光头哥)通过逐帧分析,指出Devin的演示视频存在多处问题,包括但不限于:处理的任...

代码大模型再现国之利刃,开源aiXcoder-7B性能完爆同级大模型!

在人工智能技术推动各行各业创新的背景下,国产大模型aiXcoder 7B引起了广泛关注。北京大学软件工程研究所的aiXcoder团队开源的这一模型,不仅助力国内软件企...

Stability AI开源3B代码生成模型:可补全,还能Debug

本文报道了Stability AI 公司开源的小体量预训练模型 Stable Code Instruct 3B,该模型是一个基于 Stable Code 3B 的指令调整编码语言模型,能够处理各种任务...

刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习

新智元报道了一种新型强化学习框架StepCoder,由复旦大学、华中科技大学和皇家理工学院的研究人员共同提出。StepCoder旨在解决大型语言模型(LLMsCCCS);2) ...

全新开源AI代码工具诞生!超越谷歌DeepMind旗下AlphaCode

文章首先介绍了AlphaCodium的诞生背景,它的开发受到了AlphaCode和AlphaCode 2的启发,但已经超越了它们,引起了广泛关注。AlphaCodium采用了流程引擎的方法...