标签:图像视频

超9000颗星,优于GPT-4V!国内开源多模态大模型

国内开源社区OpenBMB推出了一款新型的多模态大模型——MiniCPM-V 2.6,该模型拥有80亿参数,在图像和视频理解方面表现出色,超越了包括GPT-4V在内的多个知名模...

1.2万人朝圣CVPR,华人学者夺最佳论文!Sora舵手火爆演讲成大型追星现场

2024年的CVPR会议在美国西雅图成功举行,成为历史上规模最大、参与人数最多的一届。会议吸引了超过1.2万人参加,共提交了11532篇论文,比去年增加了2000多篇...

突发!苹果、腾讯同日公布全新大模型研究论文,中美 AI 技术竞争加速|钛媒体AGI

苹果公司近日在人工智能领域迈出重要一步,公布了自家的多模态大模型MM1。这一模型拥有高达300亿的参数规模,在预训练指标中实现SOTA,并具备密集模型和混合...