“多模态大模型”的搜索结果

斯坦福开源睡眠多模态大模型–SleepFM,
斯坦福大学研究人员开发了一款名为SleepFM的多模态大模型,专门针对医疗领域中的睡眠监测和分析。该模型能够自动识别并分类睡眠过程中的...
超9000颗星,优于GPT-4V!国内开源多模态大模型
国内开源社区OpenBMB推出了一款新型的多模态大模型——MiniCPM-V 2.6,该模型拥有80亿参数,在图像和视频理解方面表现出色,超越了包括GPT...
哈工深聂礼强:多模态大模型是具身智能发展的关键动力丨具身智能十人谈
具身智能技术,将智能系统与物理实体结合,使机器人能够感知环境、进行决策并执行动作。其核心在于“具身”,即通过物理形态与世界交互。...
揭秘:阶跃星辰万亿MoE+多模态大模型矩阵亮相
在2024年世界人工智能大会上,阶跃星辰公司展示了其最新的AI大模型技术,吸引了大量观众。一个特别受欢迎的展台提供了一种互动体验,观...
宇树科技王兴兴:与其完善多模态大模型,不如探索开发全新模型
2024年被广泛认为是人形机器人技术发展的重要年份,具身智能论坛在2024智源大会上成为焦点,吸引了众多关注。宇树科技的创始人兼CEO王兴...
多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」
近期研究表明,通过训练纯解码器生成模型,可以成功地生成包括音频、图像和状态-动作序列在内的多种模态的新序列。这些模型通常采用词汇...
港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体
多模态大模型(MLLM)在视觉任务中展现出强大的认知理解能力,但目前大多数模型局限于单向的图像理解,难以在图像上进行精确定位。这一...
中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o
在中国移动人工智能生态大会主旨论坛上,中国移动发布了自研的「九天」千亿多模态基座大模型。这一模型被誉为国内最值得信赖、最懂行业...
智子引擎发布多模态大模型 Awaker:MOE、自主更新、写真视频效果优于 Sora
这个模型采用了MOE架构,并具备了业界首个「真正」自主更新的能力。其性能在写真视频生成上超过了Sora模型,有望解决大模型在实际应用中...
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
元象公司发布了一款名为XVERSE-V的多模态大模型,该模型支持任意宽高比的图像输入,并在多项权威多模态评测中取得了领先效果。XVERSE-V...
1 2 3 19