“零样本”的搜索结果

文章介绍了字节跳动提出的新基础模型ViTamin，专为视觉语言时代设计。ViTamin在ImageNet零样本准确率上比ViT提高了2.0%，在多个基准任务...

AIGC动态

5个月前

这篇文章介绍了生成式AI领域中的两个主导模型：自回归模型和扩散模型。自回归模型专注于处理离散数据，如文本，通过预测下一个token来生...

AIGC动态

5个月前

这篇文章介绍了北大和字节跳动合作开发的新方法——Visual Autoregressive Modeling（VAR），旨在改进图像生成的质量和效率。VAR采用了预...

AIGC动态

5个月前

文章摘要【关键词】 VAR、图像生成、自回归模型、扩散模型、Scaling Laws 机器之心最近发布了一篇关于新一代视觉生成范...

AIGC动态

5个月前

文章摘要【关键词】 OpenAI、Sora、视频生成、AGI、技术细节前不久，OpenAI CEO Sam Altman 的一句话引发了业界对电影...

AIGC动态

5个月前

Stability AI最近推出了Stable LM 2 12B模型，这是其新模型系列的一个重要升级。该模型基于七种语言的2万亿Token进行训练，拥有120亿参...

AIGC动态

5个月前

最近，多模态大模型（LMM）在视觉-语言任务上取得了显著的进展，尤其是在视觉场景下的应用。然而，将LMM应用于计算机视觉任务，特别是图...

AIGC动态

5个月前

视频理解技术旨在准确把握视频中的时空信息，但面临着短视频片段的时空冗余和复杂时空依赖关系的双重挑战。传统的三维卷积神经网络（CNN...

AIGC动态

6个月前

文章介绍了香港大学数据智能实验室最新推出的图结构大模型HiGPT，该模型是由GraphGPT的原班人马打造而成。GraphGPT是将图数据与大模型结...

AIGC动态

6个月前

微软NaturalSpeech项目介绍微软NaturalSpeech项目介绍本文介绍了微软在文本到语音合成（TTS）领域的研究项目NaturalSpeech，该项目旨在...

AIGC动态

6个月前