标签:偏见问题
OpenAI最新53页论文:ChatGPT看人下菜碟,对“小美”比“小帅”更友好
OpenAI的最新研究揭示了ChatGPT在与人类互动时存在潜在的偏见。研究发现,ChatGPT能够根据用户的名字推断出性别、种族等身份特征,并可能在回答中重复训练数...
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
近期,人工智能领域对于“从人类反馈中进行强化学习”(RLHF)是否属于真正的强化学习(RL)展开了激烈的讨论。这场讨论始于Andrej Karpathy发表的一系列推文,...