“多模态融合”的搜索结果

PixVerse V2 登场!一口气生成5个“Sora”,视频生成赛道“卷”飞了
PixVerse V2是爱诗科技推出的一款基于DiT(Diffusion + Transformer)架构的视频生成产品,它在模型能力和产品化效果上都有显著提升。Pi...
清华大学教授黄民烈:如何把大模型“调教”成我们放心的样子
在讨论大模型安全问题的文章中,作者褚杏娟指出OpenAI安全团队与公司高层之间存在分歧,特别是首席科学家Ilya Sutskever离职后,大模型...
中国版Sora震撼登场,原生16秒直出超清视频!国产黑马火了,世界模型签约多个大客户
我国人工智能领域迎来重大突破,国产AI视频模型“视界一粟 YiSu”以其超长时长、高性价比和端侧可用特性,引起了广泛关注。该模型由“极佳...
这家世界模型公司发布中国版Sora级视频生成大模型,走向世界模型打造新一代数据引擎
「视界一粟 YiSu」是由世界模型公司「极佳科技」与清华大学自动化系联合发布的中国首个超长时长、高性价比、端侧可用的视频生成大模型。...
复旦邱锡鹏教授讲述MOSS 2 研发进展:如何实现世界模型?
复旦大学计算机学院教授邱锡鹏在CCF大模型论坛上,分享了复旦大学自然语言处理实验室在对话式大语言模型MOSS研发的最新进展。他指出,MO...
谷歌创新框架:从非结构化数据,实现多模态学习
在数据爆炸时代,大模型学习非结构化数据如视频、音频和图片面临重大挑战。多模态学习,特别是处理多种输入和异构数据时,深度神经网络...
多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」
近期研究表明,通过训练纯解码器生成模型,可以成功地生成包括音频、图像和状态-动作序列在内的多种模态的新序列。这些模型通常采用词汇...
OpenAI与Google巨头对线后,开发者如何快速加入战局?
在OpenAI与Google之间的竞争成为热点话题的背景下,潞晨科技创始人尤洋、Zilliz技术合伙人栾小凡等专业人士齐聚一堂,共同探讨了一系列...
开源多模态SOTA再易主,19B模型比肩GPT-4v,16G显存就能跑
在最新的开源多模态SOTA模型竞争中,CogVLM2成功夺得王冠,由大模型创业公司智谱AI推出。该模型在OCRbench、TextVQA等三项关键基准测试...
兆级长文本,已是一线大模型机构标配能力丨上海AI Lab林达华
林达华是一位深度学习与计算机专家,他在大模型领域取得了重要突破。他指出,大模型的关键在于能够将海量信息串接起来做出深层次的结论...
1 2 3