标签:多模态融合

PixVerse V2 登场!一口气生成5个“Sora”,视频生成赛道“卷”飞了

PixVerse V2是爱诗科技推出的一款基于DiT(Diffusion + Transformer)架构的视频生成产品,它在模型能力和产品化效果上都有显著提升。PixVerse V2能够单次生...

复旦邱锡鹏教授讲述MOSS 2 研发进展:如何实现世界模型?

复旦大学计算机学院教授邱锡鹏在CCF大模型论坛上,分享了复旦大学自然语言处理实验室在对话式大语言模型MOSS研发的最新进展。他指出,MOSS初代技术框架基于GP...

开源多模态SOTA再易主,19B模型比肩GPT-4v,16G显存就能跑

在最新的开源多模态SOTA模型竞争中,CogVLM2成功夺得王冠,由大模型创业公司智谱AI推出。该模型在OCRbench、TextVQA等三项关键基准测试中大幅领先于GPT-4v和G...