Pika联创参与新研究：Diffusion能抢GPT的活了！成功挑战自回归文本范式

AIGC动态1年前 (2024)发布 QbitAI

1,677 0 0

Pika联创参与新研究：Diffusion能抢GPT的活了！成功挑战自回归文本范式

文章摘要

【关键词】 生成式、模型、SEDD、扩散、文本

这篇文章介绍了生成式AI领域中的两个主导模型：自回归模型和扩散模型。自回归模型专注于处理离散数据，如文本，通过预测下一个token来生成文本。然而，作者指出自回归模型存在一些缺陷，如生成偏离数据分布、计算梯度困难等。为了克服这些问题，作者提出了一种新的模型——分数熵离散扩散模型（SEDD），旨在将扩散模型扩展到离散空间。SEDD模型通过学习具体得分和迭代去噪来生成文本，相比自回归模型，SEDD能够更好地利用全局上下文，提高生成效果。在实验中，SEDD表现出了强大的竞争力，包括在困惑度指标上的表现和控制生成质量上的优势。此外，SEDD还能够与GPT-2等自回归模型进行比较，并在零样本生成任务中展现出优势。研究团队由斯坦福大学的博士生Aaron Lou和Chenlin Meng以及导师Stefano Ermon组成。文章最后提供了论文链接，详细介绍了SEDD模型的原理和实验结果。

原文和模型

【原文链接】 阅读原文 [ 1400字 | 6分钟 ]
【原文作者】 量子位
【摘要模型】 gpt-3.5-turbo-0125
【摘要评分】 ★☆☆☆☆

OpenAI ChatGPT

ChatGPT是OpenAI公司开发的一种大型语言模型。它是一种基于Transformer架构的深度学习模型，可以对语言进行建模和生成。它可以处理问答、对话生成、文本生成等多种任务。

# AIGC动态 # GPT-GPTs # 大模型 # SEDD # 扩散 # 文本 # 模型 # 生成式

© 版权声明

文章版权归作者所有，未经允许请勿转载。

“绘蛙”

相关文章

阿里千问 3 登顶全球最强开源模型，性能超越 DeepSeek-R1、OpenAI-o1

极客公园

929

碾压DeepSeek V3！阿里开源新版Qwen-3，屠榜级断层第一

AIGC开放社区

1,461

媲美OpenAI-o3，刚刚开源模型DeepCoder，训练方法、数据集大公开

AIGC开放社区

1,100

3D版Sora来了？UMass、MIT等提出3D世界模型，具身智能机器人实现新里程碑

新智元

1,946

OpenAI：GPT-5就是All in One，集成各种产品

量子位

860

OpenAI教你做Agent：2025年，评估标准和如何产品化是Agent的重点

Founder Park

1,092

“极客训练营”

暂无评论

暂无评论...