标签:moonshot-v1-32k

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

本文探讨了在扩散模型中UNet结构的long skip connection上应用scaling操作对模型训练稳定性的影响。研究发现,适当的scaling系数可以缓解特征不稳定现象,提...

英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑

英伟达近期推出了具有150亿参数的Nemotron-4模型,旨在打造一个能在单个A100/H100 GPU上运行的通用大模型。该模型在英语、多语言和编码任务上表现出色,性能...

Llama 3被爆7月解禁剑指GPT-4,最大参数超1400亿!2名核心团队成员却离职

新智元报道:据外媒报道,Meta计划在7月发布Llama 3,这是一个开源大模型,预计将具有超过1400亿参数,性能将远超Llama 2。Llama 3将解除一些限制,能更好地...

中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻

摘要:OpenAI研究员Jason Wei将Sora视频生成模型比作视频领域的GPT-2,预示着视频生成技术的新时代。Sora能够创作出具有艺术感和逼真度的短视频,尽管还不能...

苹果奔向AI原生应用元年

苹果公司在2024年决定结束其10年的造车实验,转而集中资源发展人工智能。这一转变标志着移动互联网时代的巨头开始拥抱人工智能时代。高通骁龙3芯片的出现使得...

AI大混战,为什么挣钱的是百度?

百度在AI领域的成就显著,2023年总营收达1346亿元,净利润287亿元,同比增长39%。文心大模型的持续迭代和生成式AI的重构广告系统是其成绩的核心。文心一言APP...

人工智能体(AI Agent)开发与应用全面调研:原理及开发、应用及挑战

摘要:本文探讨了2023年人工智能体(AI Agent)的开发与应用,强调了AI Agent在信息处理和生成方面的强大能力。随着大模型的快速发展,AI Agent能够更好地理解...

AI正在加速“一人公司”的新个体诞生!

在这篇文章中,作者探讨了新个体经济的概念,认为它将打破传统的“公司+雇员”模式,转而采用“平台+个人”的模式。文章以AI游戏初创公司“奇酷网络”为例,展示了...
1 35 36 37