标签:自我对齐

MATRIX:社会模拟推动大模型价值自对齐,比GPT4更「体贴」

摘要总结:随着大语言模型(LLMs)的快速发展,如何确保它们与人类价值观对齐,避免社会负面影响成为一个重要议题。本文介绍了上海交通大学和上海人工智能实...