标签:污染检测

微软、上海交通等发布首届数据污染报告,开闭源模型皆被污染

随着大语言模型(LLM)如GPT-4和o1的出现,生成式AI产品数量激增,但数据污染问题对模型的准确性和可靠性构成挑战。数据污染指评估数据无意中包含在预训练数...