“CogVLM2”的搜索结果

中国的开源版 sora:4090 内单卡运行,A6000 可微调
智谱版Sora「清影」是一款商用级视频生成模型,于7月26日发布,能在30秒内将任意文图生成视频。该产品已在智谱AI助手「智谱清言」上线,...
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
张天宇在其研究中提出了一种名为视觉字幕恢复(Visual Caption Restoration, VCR)的新任务,旨在探究视觉语言模型(Vision-Language Mo...
开源多模态SOTA再易主,19B模型比肩GPT-4v,16G显存就能跑
在最新的开源多模态SOTA模型竞争中,CogVLM2成功夺得王冠,由大模型创业公司智谱AI推出。该模型在OCRbench、TextVQA等三项关键基准测试...