“多模态”的搜索结果
什么样的 AGI 创业者更容易获得资本青睐?
在当前的人工智能(AGI)领域,投资逻辑的核心仍然是投人。在缺乏低成本获取用户或客户的情况下,商业竞争主要依赖于低成本资金,明星创...
无需训练,这个新方法实现了生成图像尺寸、分辨率自由
近日,香港中文大学与商汤科技联合实验室的研究者们提出了一种名为FouriScale的方法,旨在改善预训练扩散模型在生成高分辨率图像时的性...
谷歌DeepMind发布Gecko:专攻检索,与大7倍模型相抗衡
最后,机器之心还宣布将在北京海淀举办AI技术论坛,聚焦于视频生成技术、多模态大模型等前沿领域,旨在帮助企业和从业者掌握最新的技术...
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k
斯坦福大学研究人员近日推出的 Octopus v2 模型在端侧 AI 应用领域引起了广泛关注。这个拥有 20 亿参数的模型不仅在智能手机、汽车、个...
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
GPT-4V的推出标志着多模态大模型研究的新篇章,它在多模态问答、推理和交互等领域展现了卓越的能力。然而,一些研究揭示了GPT-4V在基本...
拒绝白人与亚洲人同框,Meta图像生成器的「歧视」,被人挖出来了
文章摘要 【关 键 词】 AI偏见、图像生成、种族刻板、性别歧视、技术论坛 在人工智能的世界里,AI偏见问题一直是一个备受关...
AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!宝格丽宣传片配文一绝
近日,KAUST和哈佛大学的研究团队提出了MiniGPT4-Video框架,这是一个专为视频理解设计的多模态大模型。它不仅能够理解复杂视频内容,还...
中科大等意外发现:大模型不看图也能正确回答视觉问题!
近期,中科大、香港中文大学和上海AI Lab的研究团队发现了一个有趣的现象:即使没有查看图片,一些大型语言模型和多模态模型也能在多模...
GPT-5红队测试邮件曝光,最早6月发布?网友在线逼问Altman,数十亿美元超算26年启动
新智元报道了关于OpenAI即将发布的GPT-5的最新动态。据报道,OpenAI已经向一些用户发送了红队测试的邀请邮件,这表明GPT-5可能已经进入...
让智能体像孩子一样观察别人学习动作,跨视角技能学习数据集EgoExoLearn来了
在人工智能领域,模仿人类学习能力一直是研究的热点。近期,由上海人工智能实验室、南京大学、中科院深圳先进技术研究院等机构联合发布...