高效训练 | 学习AIGC

影视级3D生成新王：Direct3D-S2全面开源！8块GPU超越闭源登顶HF

DreamTech联合南京大学、复旦大学和牛津大学发布的Direct3D-S2 3D生成模型，近日登顶HuggingFace 3D建模应用趋势榜，并在综合榜单上跃居至第4位。这一模型仅...

AIGC动态

3个月前

20万美元商业级视频生成大模型Open-Sora 2.0来了，权重、推理代码及训练流程全开源！

潞晨科技推出的 Open-Sora 2.0 是一款开源的 SOTA 视频生成模型，标志着视频生成领域的开源革命。该模型仅用 20 万美元（224 张 GPU）成功训练出商业级 11B ...

AIGC动态

6个月前

OpenAI科学家盛赞中国大模型：算法非常强，算力用到极致！

OpenAI的高级研究科学家Andrej Karpathy分享了中国开源大模型DeepSeek-v3的显著成就。该模型以其高效的训练效率和低成本而受到关注，仅用280万小时的GPU算力...

AIGC动态

9个月前

DeepSeek V3刷屏，550万元2000张卡做出的开源模型，和OpenAI几亿烧出来的一样好

深度求索公司发布的DeepSeek V3技术报告揭示了其高效训练的关键数据，展现了该模型在资源依赖小、成本低的同时，效果异常出色。在预训练阶段，DeepSeek-V3在...

AIGC动态

9个月前

五年后的今天，训练GPT-2只需不到700刀、24小时，Karpathy又整新活

2019年2月，OpenAI发布了具有15亿参数的GPT-2模型，该模型在文本生成方面表现出色，充分利用了预训练的Transformer架构，被认为是大型预言模型的始祖。现在在...

AIGC动态

1年前 (2024)

快手版Sora「可灵」开放测试：生成超120s视频，更懂物理，复杂运动也能精准建模

本文介绍了一款名为可灵的全新国产视频生成大模型，它是快手公司推出的产品级应用。可灵采用了类似Sora的技术路线，融合了多项自研技术创新，生成的视频不仅...

AIGC动态

1年前 (2024)

Karpathy新教程爆火，网友抢着送他H100：从头复现GPT-2训练

AI领域的大神Karpathy近日成功复现了OpenAI的经典成果GPT-2，而且仅用了20美元、90分钟就完成了训练，令人震惊的是，其Loss和评测还超越了原版。他使用的是A1...

AIGC动态

1年前 (2024)

中文OCR超越GPT-4V，参数量仅2B，面壁小钢炮拿出了第二弹

面壁智能，一家源自清华大学的创业公司，近期在大语言模型领域取得了显著进展。该公司致力于优化语言模型，以提高效率并降低成本。今年2月，面壁智能发布了第...

AIGC动态

1年前 (2024)

被低估的面壁：打造出不输 OpenAI 的 Scaling Law 曲线

面壁智能团队在大模型领域的探索与实践面壁智能团队，由曾国洋担任CTO，自2020年GPT-3发布后开始训练大模型，逐渐认识到提升模型效果是大模型训练的根本目标...

AIGC动态

1年前 (2024)

标签：高效训练

影视级3D生成新王：Direct3D-S2全面开源！8块GPU超越闭源登顶HF

20万美元商业级视频生成大模型Open-Sora 2.0来了，权重、推理代码及训练流程全开源！

OpenAI科学家盛赞中国大模型：算法非常强，算力用到极致！

DeepSeek V3刷屏，550万元2000张卡做出的开源模型，和OpenAI几亿烧出来的一样好

五年后的今天，训练GPT-2只需不到700刀、24小时，Karpathy又整新活

快手版Sora「可灵」开放测试：生成超120s视频，更懂物理，复杂运动也能精准建模

Karpathy新教程爆火，网友抢着送他H100：从头复现GPT-2训练

中文OCR超越GPT-4V，参数量仅2B，面壁小钢炮拿出了第二弹

被低估的面壁：打造出不输 OpenAI 的 Scaling Law 曲线

热门网址

标签：高效训练

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址