“GPU”的搜索结果
老黄最新专访:芯片短缺难以结束,下个Transformer已经出现
英伟达创始人黄仁勋在接受WIED专访时分享了他对公司未来的想法和预测,以及对过去问题的再思考。黄仁勋强调了英伟达在AI芯片市场的领导...
成为全球第4之后,世界终于认清了黄仁勋的运气
这是刘润公众号的第2171篇原创文章。2024年2月22日凌晨,全球投资者关注英伟达发布的第四季度财报。英伟达公布的财报数字远超市场预期,...
字节万卡集群技术细节公开:2天搞定GPT-3训练,算力利用率超英伟达Megatron-LM
字节跳动与北京大学合作的一篇新论文揭示了AI基础设施的重要性,并介绍了字节搭建的万卡集群,该集群能在1.75天内完成GPT-3规模模型(17...
全球AI大事记 · 疯狂二月|钛媒体AGI
2024年2月,全球人工智能(AI)领域迎来了一系列重大进展和新闻。OpenAI、谷歌、微软等科技巨头纷纷发布重要AI消息,包括视频生成模型So...
李彦宏找到“救命药”
在2023年,百度公布了其第四季度及全年的财报,展现了公司在过去一年中的强劲增长。百度的总营收达到了1345.98亿元,净利润(non-GAAP)...
AGI行业“疯狂”的2月:视频生成模型Sora震撼全球;英伟达首次将华为列为竞争对手|钛媒体AGI
近期,生成式人工智能(AI)领域涌现出多款新应用,钛媒体AGI梳理了五款免费AI“神器”,展示了AI技术的快速发展。2024年2月,ChatGPT引发...
Hugging Face发布AI代码生成工具StarCoder 2,支持600多种编程语言
摘要:开发者们正迅速采用AI驱动的代码生成器,如GitHub Copilot和Amazon CodeWhisperer,以及Meta的Code Llama。然而,这些工具存在局...
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transfo...
微软6页论文爆火:三进制LLM,真香!
在最新的研究中,微软和中国中科院大学提出了一种名为BitNet b1.58的方法,标志着大语言模型(LLM)进入了“1-bit时代”。这种方法通过将...
英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑
英伟达近期推出了具有150亿参数的Nemotron-4模型,旨在打造一个能在单个A100/H100 GPU上运行的通用大模型。该模型在英语、多语言和编码...