“多模态融合”的搜索结果

PixVerse V2是爱诗科技推出的一款基于DiT（Diffusion + Transformer）架构的视频生成产品，它在模型能力和产品化效果上都有显著提升。Pi...

AIGC动态

2个月前

在讨论大模型安全问题的文章中，作者褚杏娟指出OpenAI安全团队与公司高层之间存在分歧，特别是首席科学家Ilya Sutskever离职后，大模型...

AI-Agent

3个月前

我国人工智能领域迎来重大突破，国产AI视频模型“视界一粟 YiSu”以其超长时长、高性价比和端侧可用特性，引起了广泛关注。该模型由“极佳...

AIGC动态

3个月前

「视界一粟 YiSu」是由世界模型公司「极佳科技」与清华大学自动化系联合发布的中国首个超长时长、高性价比、端侧可用的视频生成大模型。...

AIGC动态

3个月前

复旦大学计算机学院教授邱锡鹏在CCF大模型论坛上，分享了复旦大学自然语言处理实验室在对话式大语言模型MOSS研发的最新进展。他指出，MO...

AIGC动态

3个月前

在数据爆炸时代，大模型学习非结构化数据如视频、音频和图片面临重大挑战。多模态学习，特别是处理多种输入和异构数据时，深度神经网络...

AIGC动态

4个月前

近期研究表明，通过训练纯解码器生成模型，可以成功地生成包括音频、图像和状态-动作序列在内的多种模态的新序列。这些模型通常采用词汇...

AIGC动态

4个月前

在OpenAI与Google之间的竞争成为热点话题的背景下，潞晨科技创始人尤洋、Zilliz技术合伙人栾小凡等专业人士齐聚一堂，共同探讨了一系列...

AIGC动态

4个月前

在最新的开源多模态SOTA模型竞争中，CogVLM2成功夺得王冠，由大模型创业公司智谱AI推出。该模型在OCRbench、TextVQA等三项关键基准测试...

AIGC动态

4个月前

林达华是一位深度学习与计算机专家，他在大模型领域取得了重要突破。他指出，大模型的关键在于能够将海量信息串接起来做出深层次的结论...

AIGC动态

6个月前