模型训练 | 第 2 页

“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑，上海交大本科生新“低成本推理”或成新宠！

斯坦福大学和华盛顿大学的研究人员开发了一个名为 s1 的人工智能推理模型，该模型以不到 50 美元的云计算成本成功训练而成，并在数学和编码能力测试中表现出...

AIGC动态

7个月前

英特尔开源RAG Foundry 框架，可增强多种RAG用例

英特尔实验室研究人员开源了RAG Foundry，这是一个专为大模型RAG框架开发和增强的工具，具有高度灵活性和扩展性。RAG Foundry支持多种RAG用例，包括数据选择...

AIGC动态

7个月前

OpenAI怀疑DeepSeek使用其模型，蒸馏R1

OpenAI指控国内大模型平台DeepSeek使用其模型训练竞争对手，违反服务条款。大模型蒸馏是行业普遍训练方法，将知识从复杂教师模型转移到简单学生模型。教师模...

AIGC动态

7个月前

企业部署生成式 AI，五个最大的挑战是什么？

在拉斯维加斯的re:Invent大会上，亚马逊云科技推出了一系列生成式AI新产品，旨在解决企业在引入生成式AI时面临的五大挑战：选择权、部署成本、训练小模型、消...

AIGC动态

9个月前

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

通义灵码团队在其最新论文《An Open Development-Process-Centric Language Model for Automated Software Improvement》中提出了面向程序改进的软件工程大模...

AIGC动态

10个月前

Scaling Law或将终结？哈佛MIT预警：低精度量化已无路可走，重磅研究掀翻AI圈

哈佛、斯坦福和麻省理工学院的研究人员首次提出了一种“精度感知”的scaling law，揭示了精度、参数规模和数据量之间的统一关系。研究发现，随着数据量的增加，...

AIGC动态

10个月前

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

OpenAI的o1模型自问世以来，以其卓越的推理能力在人工智能领域引起了广泛关注。o1不仅在数学奥林匹克竞赛中表现出色，甚至在博士级别的科学问答中超越了人类...

AIGC动态

12个月前

腾讯推出首个游戏大模型，能生成《巫师3》、《对马岛之魂》等3A巨作！

腾讯公司推出了一款名为GameGen-O的新型大模型，专门针对3A级开放世界游戏的生成。该模型能够模拟包括《巫师3》、《赛博朋克2077》、《对马岛之魂》、《荒野...

AIGC动态

1年前 (2024)

榨取大模型算力，百度想了一些招

在当前的科技领域，算力已成为一种极其宝贵的资源，其重要性甚至超过了黄金。随着OpenAI发布o1-preview，即“草莓”模型，算力的需求和消耗达到了前所未有的高...

AIGC动态

1年前 (2024)

MUMU：用文本、图像引导，多模态图像生成模型

AIGC领域的专业社区专注于微软、OpenAI、百度文心一言、讯飞星火等大型语言模型（LLM）的发展和应用落地，致力于LLM的市场研究和AIGC开发者生态建设。在图像...

AIGC动态

1年前 (2024)

标签：模型训练

“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑，上海交大本科生新“低成本推理”或成新宠！

英特尔开源RAG Foundry 框架，可增强多种RAG用例

OpenAI怀疑DeepSeek使用其模型，蒸馏R1

企业部署生成式 AI，五个最大的挑战是什么？

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

Scaling Law或将终结？哈佛MIT预警：低精度量化已无路可走，重磅研究掀翻AI圈

o1 研发团队完整采访：Ilya早期曾参与，灵感源于AlphaGo

腾讯推出首个游戏大模型，能生成《巫师3》、《对马岛之魂》等3A巨作！

榨取大模型算力，百度想了一些招

MUMU：用文本、图像引导，多模态图像生成模型

热门网址

标签：模型训练

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址