标签:视觉-语言任务

谷歌通过数据增强、对比调优,减少多模态模型幻觉

在人工智能生成内容(AIGC)领域,多模态大语言模型(LLM)的发展和应用落地受到广泛关注。然而,这些模型在生成和识别内容时容易出现错误描述,即“幻觉”现象...