“分布式训练”的搜索结果

AI 大模型落地金融:如何应对五大挑战?
随着人工智能(AI)技术的不断进步,大模型在金融科技领域的应用越来越广泛,不仅提升了运营效率和客户体验,还推动了创新型金融服务的...
Llama3训练每3小时崩一次?豆包大模型、港大团队为脆皮万卡训练提效
随着大模型迭代速度的加快和训练集群规模的增大,软硬件故障已成为提高训练效率的瓶颈。为此,字节跳动豆包大模型团队与香港大学联合提...
深度解码:AI 大模型的繁荣与困境 | Q福利
人工智能(AI)大模型的发展在数字化时代中突飞猛进,成为技术进步的重要推动力。AI大模型以其庞大的参数量和卓越的性能,在自然语言处...
直击算力焦虑,这家清华系 AI 创企搞了个千卡异构混训平台,算力利用率最高达 97.6%
GPT-4等大型模型在自然语言处理、机器翻译和文本生成等领域取得了显著成就,但随着模型参数的增加,计算和内存需求也随之增加,给算力和...
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
本文介绍了一款名为可灵的全新国产视频生成大模型,它是快手公司推出的产品级应用。可灵采用了类似Sora的技术路线,融合了多项自研技术...
昆仑万维开源 2 千亿稀疏大模型天工 MoE,全球首创能用 4090 推理
昆仑万维宣布开源其千亿稀疏大模型Skywork-MoE,此模型基于先前的Skywork-13B模型中间checkpoint扩展而成,是首个将MoE Upcycling技术应...
国产GPU重大利好!“中国英伟达”千卡集群已就位
< strong >北京市最新出台的《北京市算力基础设施建设实施方案(2024-2027年)》旨在通过一系列措施加速智算资源供给的自主可控和绿色节...
一键生成 16 秒 1080P 视频,国产 Sora 的秘密,藏在这个清华系大模型团队中
在2024年,Sora技术因其在长视频生成领域的革命性突破而受到全球关注。Sora技术采用Diffusion加Transformer架构,克服了传统Stable Diff...
国产 Sora 的秘密,藏在这个清华系大模型团队中
在视频AIGC(人工智能生成内容)领域,Sora技术因其在长视频生成方面的突破性进展而备受关注。Sora采用的Diffusion加Transformer架构在...
马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!
马斯克最新发布的人工智能模型Grok-1.5,以其卓越的编码与数学处理能力、深入的上下文理解以及精准的长文本检索能力,引起了业界的广泛...
1 2