标签：上下文学习

嚯！大语言扩散模型来了，何必只预测下一个token | 人大高瓴&蚂蚁

由中国人民大学高瓴人工智能研究院与蚂蚁集团联合研发的LLaDA模型，通过创新性引入扩散模型架构，为破解大语言模型的逆诅咒难题提供了全新解决方案。该模型在...

AIGC动态

6个月前

统一图像生成，无需繁杂插件！智源发布扩散模型框架OmniGen

智源研究院最近推出了一款名为OmniGen的新型扩散模型框架，该框架在图像生成领域具有多项创新特性。OmniGen能够天然支持多种图像生成任务，包括文生图、图像...

AIGC动态

10个月前

谷歌提出大规模ICL方法——强化和无监督

本文主要讨论了大语言模型（LLM）在自然语言处理任务中的发展，特别是在少样本学习和上下文学习（ICL）方面的进展。文章首先指出，尽管LLM在少样本学习中表现...

AIGC动态

1年前 (2024)

长文本之罪：Claude团队新越狱技术，Llama 2到GPT-4无一幸免

Anthropic公司最近发现了一种新型的“越狱”技术，这种技术能够让攻击者绕过大型语言模型（LLM）的安全限制。这种越狱技术被称为“Many-shot Jailbreaking”，它...

AIGC动态

1年前 (2024)