数据污染 | 学习AIGC

热议！DeepSeek V3.1惊现神秘「极」字Bug，模型故障了？

DeepSeek 最新的 V3.1 模型上线不到一周，因离奇 Bug 引发社区热议。该模型无论执行写代码还是整理物理试卷等任务，都会莫名其妙在文本中插入「极」字，甚至...

AIGC动态

4个月前

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

近期，AIME 2025 I数学竞赛中大语言模型的表现引发了广泛关注。一些顶尖模型如o3-mini和DeepSeek-R1分别取得了78%和65%的高分，而部分较小的蒸馏模型也意外...

AIGC动态

10个月前

大模型混入0.001%假数据就「中毒」，成本仅5美元！NYU新研究登Nature子刊

纽约大学的研究者在Nature Medicine上发表的研究揭示了大型语言模型（LLM）在医疗领域应用时面临的数据污染问题。研究通过模拟数据攻击，发现仅需将0.001%的...

AIGC动态

10个月前

微软、上海交通等发布首届数据污染报告，开闭源模型皆被污染

随着大语言模型（LLM）如GPT-4和o1的出现，生成式AI产品数量激增，但数据污染问题对模型的准确性和可靠性构成挑战。数据污染指评估数据无意中包含在预训练数...

AIGC动态

1年前 (2024)

Nature 重磅论文：用 AI 生成的数据训练 AI，会让大模型崩溃

最新研究揭示了使用人工智能（AI）生成的数据训练AI模型可能带来的风险。研究发现，如果AI模型使用自动生成的数据进行自我训练，可能会导致模型崩溃，即模型...

AIGC动态

1年前 (2024)

GPT-4系列模型，在文档理解中的多维度评测

Snowflake的研究人员对OpenAI的GPT-4系列模型进行了深入研究，评估了其在文本生成、图像理解、文档摘要等方面的能力。通过在DocVQA、InfographicsVQA、SlideV...

AIGC动态

2年前 (2024)

终于有人调查了小模型过拟合：三分之二都有数据污染，微软Phi-3、Mixtral 8x22B被点名

背景介绍：- 大型语言模型的推理能力提升是当前研究的重要方向。问题提出：- 许多研究使用GSM8k、MATH等测试集作为基准，但这些测试集可能受到训练数据集的污...

AIGC动态

2年前 (2024)

标签：数据污染

热议！DeepSeek V3.1惊现神秘「极」字Bug，模型故障了？

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

大模型混入0.001%假数据就「中毒」，成本仅5美元！NYU新研究登Nature子刊

微软、上海交通等发布首届数据污染报告，开闭源模型皆被污染

Nature 重磅论文：用 AI 生成的数据训练 AI，会让大模型崩溃

GPT-4系列模型，在文档理解中的多维度评测

终于有人调查了小模型过拟合：三分之二都有数据污染，微软Phi-3、Mixtral 8x22B被点名

热门网址

标签：数据污染

热议！DeepSeek V3.1惊现神秘「极」字Bug，模型故障了？

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

大模型混入0.001%假数据就「中毒」，成本仅5美元！NYU新研究登Nature子刊

微软、上海交通等发布首届数据污染报告，开闭源模型皆被污染

Nature 重磅论文：用 AI 生成的数据训练 AI，会让大模型崩溃

GPT-4系列模型，在文档理解中的多维度评测

终于有人调查了小模型过拟合：三分之二都有数据污染，微软Phi-3、Mixtral 8x22B被点名

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址