“视觉多模态”的搜索结果

LeCun谢赛宁首发全新视觉多模态模型,等效1000张A100干翻GPT-4V
LeCun和谢赛宁团队近日推出了Cambrian-1,一种采用以视觉为中心方法设计的多模态大语言模型(MLLM),并全面开源了模型权重、代码、数据...
阿里重磅开源Qwen2-VL:能理解超20分钟视频,媲美GPT-4o!
阿里巴巴集团开源了其最新研发的视觉多模态模型Qwen2-VL,这一模型在多项性能指标上超越了OpenAI的GPT-4o和Anthropic的Claude3.5-Sonnet...
别只盯着ChatGPT版「Her」,在多模态AI拟人互动上,国内玩家也支棱起来了
第二届多模态情感识别挑战赛(MER24)在AI顶会IJCAI2024上成功举办,旨在推动利用文本、音视频等多模态数据进行AI情感识别的技术发展和...
更美图像生成、直出分钟级视频,国产自研DiT架构的越级之旅
2024年,AIGC领域特别是文生视频赛道呈现出显著的发展趋势,其中智象未来(HiDream.ai)作为国内专注于构建视觉多模态基础模型及应用的...
视觉 AI 的「Foundation Model」,已经发展到哪一步?丨CVPR 2024 现场直击
视觉Foundation Model成为会议的核心主题之一。两篇最佳论文均颁给了AIGC,图像和视频合成与生成领域的论文数量达到329篇,位居榜首。上...
中国版 Runway 新功能上线,图生视频动效更强
爱诗科技发布的视频生成工具PixVerse,最新上线了Magic Brush运动笔刷功能。该功能允许用户通过涂抹区域和绘制轨迹的方式,对视频中的多...
如何让企业把大模型用起来?零一万物的答案是 API 开放平台
大模型公司零一万物近日发布了Yi大模型API开放平台,该平台提供了三个Yi系列模型,包括Yi-34B-Chat-0205、Yi-34B-Chat-200K和Yi-VL-Plus...
一口气读完《沙丘》 ,零一万物宝藏API正式开箱!酷炫Demo实测,多模态中文图表体验超越GPT-4V
,正式向开发者开放,推出了三款强大的,以促进生态发展和模型在更多应用场景的落地。这三款模型包括:(支持通用聊天、问答、对话、写...
零一万物 API 上线,用户反馈多模态中文图表体验超过 GPT-4V
零一万物公司近日发布了Yi大模型API开放平台,为开发者提供通用Chat、200k超长上下文、多模态交互等模型。零一万物由李开复创办于2023年...
零一万物API正式上线:支持输入30万汉字,看不懂《百年孤独》的人有救了
步骤2:内容摘要零一万物正式发布了Yi大模型API开放平台,提供了三个模型:Yi-34B-Chat-0205:支持通用聊天、问答、对话、写作、翻译等功能...
1 2