“模型架构”的搜索结果

谷歌具身智能新研究:比RT-2优秀的RT-H来了
谷歌DeepMind的RT系列机器人在具身智能研究中取得了显著进展。RT-2是全球首个控制机器人的视觉-语言-动作(VLA)模型,能够通过对话识别...
国内复现Sora并开源:成本降低46%,序列扩充近百万!
本文介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。文章首...
「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题
摘要:在机器之心编辑部的专栏中,介绍了牛津大学 VGG 实验室 Andrew Zisserman 团队最新工作,解决了计算机视觉中遮挡问题的挑战。该工...
谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA
摘要:谷歌的最新研究成果ScreenAI是一个强大的视觉语言模型,它在理解和操作用户界面方面取得了显著进展。这个模型能够执行屏幕问答、...
DeepMind携Mamba华人作者推Transformer革命之作!性能暴涨媲美Llama 2,推理能效大幅碾压
摘要:谷歌DeepMind推出了两种新的RNN架构——Hawk和Griffin,它们在d基准测试中超越了Transformer。Griffin模型在训练数据减少一半的情况...
RNN效率媲美Transformer,谷歌新架构两连发:同等规模强于Mamba
摘要:谷歌 DeepMind 最近推出了两种新的 AI 模型,Hawk 和 Griffin,它们在基础模型方面为 AI 领域提供了新的选择。这些模型是基于循环...
复现 Sora 的方法及路径分析
本文深入探讨了Sora的核心技术原理、实现方法,并对其未来发展进行展望。Sora采用了高质量的数据集,结合UE数据,通过深度神经网络学习...
大模型Scaling Law同样适用于下游任务性能?斯坦福、谷歌最新研究揭秘
本文探讨了大模型性能与训练数据规模、模型架构等设计要素之间的关系,即Scaling Law。研究者们主要关注了迁移学习中的Scaling Law,即...
全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,今夜重燃开源之战
摘要总结:谷歌发布了全球最强的开源大模型Gemma,性能超越了Llama 2 13B,标志着谷歌和OpenAI在AI领域的竞争达到了新的高度。Gemma模型...
Sora横空出世,AI创业者和投资人们一夜无眠
全球成百上千家AI创业企业一夜回到解放前,由于OpenAI发布的Sora在AI视频生成领域的颠覆性进展。Sora的出现,不仅在视频生成的时间长度...
1 8 9 10 11