独家对话上海交大重庆AI研究院齐鹏团队：目前大模型水平只相当于一个仅懂文科的五岁孩童｜钛媒体AGI

AIGC动态1年前 (2024)发布 TMTPOSTAGI

2,956 0 0

独家对话上海交大重庆AI研究院齐鹏团队：目前大模型水平只相当于一个仅懂文科的五岁孩童｜钛媒体AGI

文章摘要

在一项测试中，12款国内外AI大模型被问及“9.11和9.9哪个更大”的简单数学问题，结果显示仅有4款模型回答正确，包括阿里通义千问、百度文心一言、Minimax和腾讯元宝，而ChatGPT-4o等8款模型给出了错误答案。这暴露了大模型在数学能力上的不足。上海交通大学重庆人工智能研究院AI大模型中心主任齐鹏博士指出，尽管大模型在处理复杂问题和学习泛化方面具有潜力，但可能由于模型架构限制，更偏向文科能力，缺乏理科能力。目前，大模型的智能水平仅相当于五岁小孩，受限于算力、文本数据、精确度和可靠性以及模型规模等问题，难以处理复杂任务。

齐鹏博士及其团队在上海交通大学重庆人工智能研究院自主研发了“兆言”大语言模型，并在SuperCLUE中文大模型智能体评测基准中取得优异成绩。此外，他们还成功复现了类Sora文生视频模型，采用Latte时空解耦注意力架构，显著提升了视频生成的性能。

在与钛媒体的对话中，齐鹏博士讨论了Sora技术的影响，认为其在视频生成、自动驾驶和物理世界模拟等领域具有广泛应用潜力。然而，大模型在行业落地方面仍面临挑战，主要原因包括数学和工程能力的不足，以及基于统计方法的本质导致的无法达到100%正确度。齐鹏博士强调，尽管当前模型尚未达到AGI（人工通用智能）标准，但未来可能成为通往AGI的关键节点。

齐鹏博士还提到，研究院的目标是实现技术的商业化落地，专注于AIGC的落地应用，特别是解决“最后一公里”问题，将研究成果转化为实际产品或服务。他指出，尽管大模型的智力可以不断提升，但需要配套的设施和工具来支持其运行和应用，这些设施在推动大模型实际应用和社会价值方面至关重要。