标签:模态融合

多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」

近期研究表明,通过训练纯解码器生成模型,可以成功地生成包括音频、图像和状态-动作序列在内的多种模态的新序列。这些模型通常采用词汇扩展方法实现多模态表...