标签:对比学习

谷歌通过数据增强、对比调优,减少多模态模型幻觉

在人工智能生成内容(AIGC)领域,多模态大语言模型(LLM)的发展和应用落地受到广泛关注。然而,这些模型在生成和识别内容时容易出现错误描述,即“幻觉”现象...

CVPR 2024满分论文|英伟达开源大模型FoundationPose称霸BOP排行榜

FoundationPose模型是一个用于6D物体姿态估计和跟踪的统一大模型,它能够在基于模型和无模型的设置中对新颖物体进行姿态估计和跟踪。该模型通过使用RGBD图像...

AI绘画中CLIP文本-图像预训练模型

感谢您提供的文章总结。下面是对文章中所有重要的词语或语句进行加粗处理:介绍OpenAI 在 2021 年提出了 CLIP(Contrastive Language–Image Pretraining)算...

多模态检索增强生成(Multimodal Retrieval Augmented Generation,MM-RAG)

第一部分介绍了多模态机器学习的重要性,以及MM-RAG技术的应用。对比学习用于多模态表示的方法被提出,强调了对比学习的关键要素和其在实现跨模态搜索和检索...