标签:模型训练

直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型

斯坦福大学、加州大学伯克利分校等机构联合发布了开源推理模型OpenThinker-32B,其性能接近当前最先进的DeepSeek-R1-32B模型。该模型仅使用114k训练数据(相...

“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑,上海交大本科生新“低成本推理”或成新宠!

斯坦福大学和华盛顿大学的研究人员开发了一个名为 s1 的人工智能推理模型,该模型以不到 50 美元的云计算成本成功训练而成,并在数学和编码能力测试中表现出...

英特尔开源RAG Foundry 框架,可增强多种RAG用例

英特尔实验室研究人员开源了RAG Foundry,这是一个专为大模型RAG框架开发和增强的工具,具有高度灵活性和扩展性。RAG Foundry支持多种RAG用例,包括数据选择...

OpenAI怀疑DeepSeek使用其模型,蒸馏R1

OpenAI指控国内大模型平台DeepSeek使用其模型训练竞争对手,违反服务条款。大模型蒸馏是行业普遍训练方法,将知识从复杂教师模型转移到简单学生模型。教师模...

企业部署生成式 AI,五个最大的挑战是什么?

在拉斯维加斯的re:Invent大会上,亚马逊云科技推出了一系列生成式AI新产品,旨在解决企业在引入生成式AI时面临的五大挑战:选择权、部署成本、训练小模型、消...

通义灵码 SWE-GPT:从 静态代码建模 迈向 软件开发过程长链推理

通义灵码团队在其最新论文《An Open Development-Process-Centric Language Model for Automated Software Improvement》中提出了面向程序改进的软件工程大模...

Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈

哈佛、斯坦福和麻省理工学院的研究人员首次提出了一种“精度感知”的scaling law,揭示了精度、参数规模和数据量之间的统一关系。研究发现,随着数据量的增加,...

o1 研发团队完整采访:Ilya早期曾参与,灵感源于AlphaGo

OpenAI的o1模型自问世以来,以其卓越的推理能力在人工智能领域引起了广泛关注。o1不仅在数学奥林匹克竞赛中表现出色,甚至在博士级别的科学问答中超越了人类...

腾讯推出首个游戏大模型,能生成《巫师3》、《对马岛之魂》等3A巨作!

腾讯公司推出了一款名为GameGen-O的新型大模型,专门针对3A级开放世界游戏的生成。该模型能够模拟包括《巫师3》、《赛博朋克2077》、《对马岛之魂》、《荒野...

榨取大模型算力,百度想了一些招

在当前的科技领域,算力已成为一种极其宝贵的资源,其重要性甚至超过了黄金。随着OpenAI发布o1-preview,即“草莓”模型,算力的需求和消耗达到了前所未有的高...
1 2 3