标签:新智元

60行代码,从头开始构建GPT!最全实践指南来了

摘要:本文介绍了如何使用60行代码从头开始构建GPT(生成式预训练Transformer)的实践指南。GPT是一种基于Transformer的神经网络结构,能够生成文本,并通过...

全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了

Ideogram是一款新兴的文生图工具,它在文字渲染能力上表现出色,成功获得了8000万美元的融资。这款工具能够根据用户的提示生成带有自然悬浮文字或立体文字的...

OpenAI把GPT塞进机器人大脑,具身AGI奇点迫近!英伟达微软参投26亿美金独角兽Figure

新智元报道了OpenAI与Figure的合作,旨在为机器人开发下一代AI多模态模型。Figure 01机器人的视频展示了其通过学习实现的端到端视觉运动策略,以及在煮咖啡等...

AI版西游记震撼百万网友!AI电影平台炸裂发布颠覆好莱坞,手把手打造爆款视频

新智元报道指出,AI视频制作正成为全网热潮,网友们利用Runway、Pika等工具制作出电影级大片,如B站的AI版西游记动画短片,播放量接近百万。Lightricks公司推...

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

本文探讨了在扩散模型中UNet结构的long skip connection上应用scaling操作对模型训练稳定性的影响。研究发现,适当的scaling系数可以缓解特征不稳定现象,提...

英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑

英伟达近期推出了具有150亿参数的Nemotron-4模型,旨在打造一个能在单个A100/H100 GPU上运行的通用大模型。该模型在英语、多语言和编码任务上表现出色,性能...

Llama 3被爆7月解禁剑指GPT-4,最大参数超1400亿!2名核心团队成员却离职

新智元报道:据外媒报道,Meta计划在7月发布Llama 3,这是一个开源大模型,预计将具有超过1400亿参数,性能将远超Llama 2。Llama 3将解除一些限制,能更好地...

中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻

摘要:OpenAI研究员Jason Wei将Sora视频生成模型比作视频领域的GPT-2,预示着视频生成技术的新时代。Sora能够创作出具有艺术感和逼真度的短视频,尽管还不能...

谷歌豪掷6000万美元买「美版贴吧」数据,只为训AI模型!Altman竟是第三大股东

摘要:Reddit与谷歌宣布了一项价值6000万美元的合作协议,Reddit将提供其用户内容数据帮助谷歌训练AI模型。Reddit的CEO Steve Huffman强调了Reddit作为数据源...

AI x 机器人爆发年!英伟达Jim Fan领衔登月任务,谷歌DeepMind新技术曝光

摘要:AI与机器人技术的结合正在成为时代的新风口。谷歌DeepMind和英伟达等AI巨头在机器人领域取得了新的进展。Jim Fan与Yuke Zhu合作创立了GEAR研究小组,致...
1 14 15 16 17 18