标签:模型训练

通义灵码 SWE-GPT:从 静态代码建模 迈向 软件开发过程长链推理

通义灵码团队在其最新论文《An Open Development-Process-Centric Language Model for Automated Software Improvement》中提出了面向程序改进的软件工程大模...

Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈

哈佛、斯坦福和麻省理工学院的研究人员首次提出了一种“精度感知”的scaling law,揭示了精度、参数规模和数据量之间的统一关系。研究发现,随着数据量的增加,...

o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

OpenAI的o1模型自问世以来,以其卓越的推理能力在人工智能领域引起了广泛关注。o1不仅在数学奥林匹克竞赛中表现出色,甚至在博士级别的科学问答中超越了人类...

腾讯推出首个游戏大模型,能生成《巫师3》、《对马岛之魂》等3A巨作!

腾讯公司推出了一款名为GameGen-O的新型大模型,专门针对3A级开放世界游戏的生成。该模型能够模拟包括《巫师3》、《赛博朋克2077》、《对马岛之魂》、《荒野...

榨取大模型算力,百度想了一些招

在当前的科技领域,算力已成为一种极其宝贵的资源,其重要性甚至超过了黄金。随着OpenAI发布o1-preview,即“草莓”模型,算力的需求和消耗达到了前所未有的高...

MUMU:用文本、图像引导,多模态图像生成模型

AIGC领域的专业社区专注于微软、OpenAI、百度文心一言、讯飞星火等大型语言模型(LLM)的发展和应用落地,致力于LLM的市场研究和AIGC开发者生态建设。在图像...

关于AI你最关心什么?技术专家团亲自答(含往期真人纯享版)

2022年底,OpenAI推出了大模型ChatGPT,引发了全球对大型人工智能模型的关注。2023年,谷歌、微软等全球科技巨头以及中国企业纷纷推出了自己的大模型,加速了...

AI美女全军覆没!赛博照妖镜下集体变“鬼”,AI代码拆台AI生图

随着人工智能技术的飞速发展,AI生成的人像越来越逼真,以至于人们越来越难以区分真假。最近,一款由Claude开发的新工具被用来检测AI生成的人像,通过将图像...

谷歌发布大模型数据筛选方法:效率提升13倍,算力降低10倍

在AIGC领域,大语言模型(LLM)的发展和应用落地对训练数据的需求日益增长。然而,现有的数据处理流程依赖人工筛选,成本高昂且效率低下。谷歌Deepmind的研究...

OpenAI发布最新大模型安全对齐奖励方法——RBR

随着大型语言模型(LLM)如ChatGPT的普及,确保其输出安全性变得至关重要。然而,传统的基于人类反馈的强化学习(RLHF)方法存在成本高昂和潜在偏见的问题。...
1 2 3