“视觉信息”的搜索结果

谷歌通过数据增强、对比调优,减少多模态模型幻觉
在人工智能生成内容(AIGC)领域,多模态大语言模型(LLM)的发展和应用落地受到广泛关注。然而,这些模型在生成和识别内容时容易出现错...
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
面壁小钢炮MiniCPM-V 2.6模型以其8亿参数的规模,在端侧多模态领域取得了显著的突破。该模型在单图、多图和视频理解三个方面均达到了20...
智谱的视频模型来了,它远非Sora,但却让这家公司更像OpenAI|对话智谱AI CEO 张鹏
智谱AI旗下的“智谱清言”App于7月26日推出了AI视频生成功能“清影”,面向所有用户开放,无需预约。清影基于智谱自研的视频生成大模型CogVi...
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
智谱AI近期推出了一款名为「清影」的视频生成大模型,标志着公司在视频生成领域的重大进展。该模型能够根据用户简短的创意描述,在30秒...
大镖客里骑马,星露谷里种地,天际线里盖房,还能修图剪视频,Cradle 操控一切软件!
Cradle是一种新型的通用计算机控制框架,由昆仑万维与北京智源人工智能研究院、新加坡南洋理工大学、北京大学等机构共同提出。这一框架...
谷歌推出V2A,可为视频大模型自动匹配语音
专注于AIGC领域的专业社区,关注微软、OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC...
清华天眸芯登Nature封面!世界首个类脑互补视觉芯片问世,或开辟AGI新路
经过清华大学的施路平教授领导的团队,成功研制出了世界首个类脑互补视觉芯片“天眸芯”,并在Nature杂志上发表了相关研究论文。该芯片的...
清华「天眸芯」登Nature封面:全球首款类脑互补视觉芯片
清华大学精密仪器系类脑计算研究中心提出了一种基于视觉原语的互补双通路类脑视觉感知新范式。该团队研制的世界首款类脑互补视觉芯片「...
基于扩散模型的,开源世界模型DIAMOND
研究人员联合开源了一款名为DIAMOND的世界模型,基于扩散模型,用于智能体训练、世界建模及多模态分布建模等强化学习应用。选择扩散模型...
OpenAI泄密者,投奔马斯克
Pavel Izmailov(小P),曾是OpenAI超级对齐团队成员,因涉嫌泄露机密被开除。不久后,他迅速加入了马斯克旗下的xAI。这一事件引起了社...
1 2 3