破解36年前魔咒！Meta推出反向训练大法消除大模型「逆转诅咒」

AIGC动态1年前 (2024)发布 AIera

2,573 0 0

文章摘要

【关键词】 大语言模型、逆转诅咒、反向训练、实体映射、认知系统性

大语言模型的“逆转诅咒”问题，即模型无法理解“如果A是B，则B是A”的逻辑关系，已经被Meta FAIR的研究人员通过一种新的反向训练方法得到改进。

这个问题最初在去年9月被发现，引起了人工智能领域专家的广泛关注。

研究人员通过观察到语言模型通常是从左到右自回归地进行训练，可能是导致这一问题的原因。

因此，他们尝试了从右到左的反向训练，即逆向训练，以帮助模型从反方向上学习事实之间的逻辑关系。

研究人员考虑了四种反向类型：标记反转、单词反转、实体保留反转和随机段反转。

他们在1.4B和7B参数规模的模型上测试了这些反转类型的有效性，发现实体保留和随机分段反向训练可以减轻甚至消除逆转诅咒。

此外，与标准的从左到右训练相比，反向训练提高了模型的表现，表明它可以作为一种通用的训练方法。

逆向训练包括获取训练数据集，并构造反向样本集。

这涉及到对标准和反向示例的训练，训练token的数量因此增加了一倍。

逆向转换可以看作是模型必须学习的第二种语言，事实之间的关系在反转过程中保持不变，模型可以从语法中判断它是处于正向还是反向语言预测模式。

在实验中，研究人员首先创建了一个基于符号的数据集，以研究受控环境中的逆转诅咒。

结果表明，标准语言模型训练在这项任务上完全失败，而反向训练几乎可以解决问题。

在恢复人名的任务中，反向训练也显示出更好的性能。

此外，研究人员还训练了一个Llama-2 14亿参数模型，使用了2万亿个token的基线模型，并在从左到右和从右到左两个方向上进行训练。

他们使用了一个名人任务来测试模型对现实世界事实的反转能力，结果显示反向训练的表现更加优秀。

最后，文章提到了Fodor和Pylyshyn在1988年发表的关于思维系统性的文章，强调了理解事物之间相互关系的重要性，即使对于非语言认知生物也是如此。

这表明，Meta FAIR的研究人员通过反向训练方法取得的进展，不仅对于大语言模型的发展具有重要意义，也对于我们理解认知和思维的系统性有着深远的影响。

原文和模型

【原文链接】 阅读原文 [ 2054字 | 9分钟 ]
【原文作者】 新智元
【摘要模型】 gpt-4
【摘要评分】 ★★★★☆

OpenAI GPT-4

GPT-4是OpenAI公司开发的自然...

# AIGC动态 # 大模型 # Azure # gpt-4 # 反向训练 # 大语言模型 # 实体映射 # 新智元 # 认知系统性 # 逆转诅咒

文章版权归作者所有，未经允许请勿转载。

6人7 页PPT融资8个亿，AI在吹起资本泡沫？

admin

2,154

谷歌狂喜：JAX性能超越Pytorch、TensorFlow！或成GPU推理训练最快选择

新智元

2,105

东亚中国实现全行数据100%入湖，AI大模型谨慎探索

AI前线

1,944

AI | MO数学竞赛启动，陶哲轩力荐！50题对3道，百万大奖抱回家

新智元

1,714

月之暗面 Kimi 智能助手实现 200 万字长上下文，火山引擎提供云服务支持

AI科技评论

2,754

AI+教育丨让学习没有边界，让世界成为教材。

admin

2,129

暂无评论

暂无评论...

破解36年前魔咒！Meta推出反向训练大法消除大模型「逆转诅咒」

文章摘要

原文和模型

不牺牲算法，不挑剔芯片，这个来自中科院的团队正在加速国产AI芯片破局

AI攻克费马大定理？数学家放弃5年职业生涯，将100页证明变代码

相关文章

暂无评论

热门网址

热门文章

破解36年前魔咒！Meta推出反向训练大法消除大模型「逆转诅咒」

文章摘要

原文和模型

不牺牲算法，不挑剔芯片，这个来自中科院的团队正在加速国产AI芯片破局

AI攻克费马大定理？数学家放弃5年职业生涯，将100页证明变代码

相关文章

暂无评论

Trac-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

热门网址

热门文章