标签:moonshot-v1-32k

RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba

摘要:谷歌 DeepMind 最近推出了两种新的 AI 模型,Hawk 和 Griffin,它们在基础模型方面为 AI 领域提供了新的选择。这些模型是基于循环神经网络(RNN)的,...

马斯克用微软论文当论据起诉OpenAI:你们自己早承认AGI了

本文讨论了埃隆·马斯克起诉OpenAI的事件,其中涉及到微软研究院的一篇关于GPT-4的论文。这篇论文被认为是早期AGI(人工通用智能)的证据,而马斯克利用这一点...

北大发起复现Sora,框架已搭!袁粒田永鸿领衔,AnimateDiff大神响应

北大信息工程学院的袁粒教授和田永鸿教授领衔的团队联合兔展发起了一项名为Open Sora的Sora复现计划。该计划旨在集结开源社区的力量,以有限的资源尽可能完成...

上下文长度越卷越离谱,我们真需要这么多token么?

摘要总结:去年,通义舞王在科目三的火爆出圈中成为了顶流,引发了对通义千问的广泛关注。文章首先介绍了大模型中的一个关键概念——上下文窗口,它决定了模型...

阿里云 AI 产品大合集!从通义系列到开源社区,多点开花,都挺好用

通义舞王的火爆出圈 去年,通义舞王在科目三的火爆出圈中成为了顶流,引发了对通义千问的广泛关注。这股热潮不仅推动了通义千问的人气,同时也让阿里云的AI产...

MWC2024,看看厂商的新产品能多离谱!

在巴塞罗那举行的世界移动通信大会(MWC)上,AI和智能手机的结合成为焦点。智能手机制造商强调AI提高了设备安全性、解锁新应用并加快处理速度。CCS Insight...

给AI Agent完整的一生!港大NYU谢赛宁等最新智能体研究:虚拟即现实

新智元报道:香港大学和纽约大学的研究人员发表了一项新研究,通过V-IRL平台,将真实世界的地图、街景等信息融入虚拟环境,为AI智能体提供了一个更完整和真实...

大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界

新智元报道指出,谷歌DeepMind、UC伯克利和MIT的研究人员提出了一种大视频模型的概念,认为这可能比现有的大语言模型更接近于构建一个完整的世界模型。他们认...

为了AGI,全员主动996!OpenAI匿名员工自曝3年工作感受

OpenAI员工评价:高薪酬与996工作制OpenAI作为人工智能领域的领军企业,其工作环境和员工体验一直是外界关注的焦点。最近,Glassdoor上的员工评价揭示了在Ope...

周鸿祎首堂AI课引争议,专业性错误遭质疑;智联招聘被“挤崩”,网友:找工作更焦虑了;马斯克起诉OpenAI,要求开源 | Q资讯

阿里云“疯狂星期四”:阿里云全线下调云产品官网售价,平均降价幅度超过20%,最高降幅达55%。涉及100多款产品、500多个产品规格,覆盖计算、存储、数据库等所...
1 26 27 28 29 30 37