“多模态”的搜索结果
专访优必选庞建新:在大模型时代推动机器人智能化|GAIR live
未来几年,AI+人形机器人领域将迎来颠覆性的技术变革。庞建新,优必选副总裁、研究院副院长,正领导团队将大模型技术应用于人形机器人的...
首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作
UC Berkeley的研究人员最近开源了首个“世界模型”(LargeWorldModel,简称LWM),这是一个在多模态任务上表现出色的模型,特别是在长视频...
ChatGPT现在能帮你P图了,只需简单说几个字
OpenAI的DALL-E 3在AI图像编辑领域迈出了重要一步,通过与ChatGPT的集成,用户现在可以在网页、iOS和安卓版的ChatGPT中使用DALL-E的强大...
让AI进入物理世界,首届中国具身智能大会展望智能新纪元
在近期的播客中,图灵奖得主Yann Lecun提到,机器人行业的发展长期以来一直期待着AI技术的进步。2022年被称为,而到了2024年,我们已经...
华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍
机器之心专栏近期介绍了一种基于频域的大语言模型架构——帝江,这一架构旨在解决现有大型Transformer模型在推理成本和训练成本上的问题。...
国内首个音乐版「ChatGPT」来了!Sora同款架构,唱作技巧全面发展,还剧透了全新MoE大模型
昆仑万维近期宣布了其AI音乐生成大模型「天工SkyMusic」的开放邀测,这一模型基于公司的「天工3.0」超级大模型构建。这个模型的亮点在于...
长文本之罪:Claude团队新越狱技术,Llama 2到GPT-4无一幸免
Anthropic公司最近发现了一种新型的“越狱”技术,这种技术能够让攻击者绕过大型语言模型(LLM)的安全限制。这种越狱技术被称为“Many-sho...
月之暗面 Kimi 智能助手实现 200 万字长上下文,火山引擎提供云服务支持
Kimi智能助手自2023年10月亮相以来,以其20万汉字的无损上下文能力,为用户提供了多种新的使用场景,如学术论文翻译、法律问题分析和API...
全球AI大事记·疯狂三月盘点:9万亿时代即将到来|钛媒体AGI
2024年3月,人工智能(AI)领域发生了一系列重大事件其中包括OpenAI最强AI大模型GPT-4发布一周年,以及多家科技巨头发布关于AI的重要消...
上来就是万亿模型,要单挑大厂的阶跃星辰就是中国版Inflection AI
2023年,美国的AI领域涌现出了一批独角兽公司,其中Inflection AI以不到50人的团队规模,在短短两年内融资超过15亿美元,估值接近40亿美...