独家对话上海交大重庆AI研究院齐鹏团队:目前大模型水平只相当于一个仅懂文科的五岁孩童|钛媒体AGI

AIGC动态4个月前发布 TMTPOSTAGI
697 0 0
独家对话上海交大重庆AI研究院齐鹏团队:目前大模型水平只相当于一个仅懂文科的五岁孩童|钛媒体AGI

 

文章摘要


【关 键 词】 AI模型数学问题技术挑战行业应用AIGC落地

在一项测试中,12款国内外AI大模型被问及“9.11和9.9哪个更大”的简单数学问题,结果显示仅有4款模型回答正确,包括阿里通义千问、百度文心一言、Minimax和腾讯元宝,而ChatGPT-4o等8款模型给出了错误答案。这暴露了大模型在数学能力上的不足。上海交通大学重庆人工智能研究院AI大模型中心主任齐鹏博士指出,尽管大模型在处理复杂问题和学习泛化方面具有潜力,但可能由于模型架构限制,更偏向文科能力,缺乏理科能力。目前,大模型的智能水平仅相当于五岁小孩,受限于算力、文本数据、精确度和可靠性以及模型规模等问题,难以处理复杂任务。

齐鹏博士及其团队在上海交通大学重庆人工智能研究院自主研发了“兆言”大语言模型,并在SuperCLUE中文大模型智能体评测基准中取得优异成绩。此外,他们还成功复现了类Sora文生视频模型,采用Latte时空解耦注意力架构,显著提升了视频生成的性能。

在与钛媒体的对话中,齐鹏博士讨论了Sora技术的影响,认为其在视频生成、自动驾驶和物理世界模拟等领域具有广泛应用潜力。然而,大模型在行业落地方面仍面临挑战,主要原因包括数学和工程能力的不足,以及基于统计方法的本质导致的无法达到100%正确度。齐鹏博士强调,尽管当前模型尚未达到AGI(人工通用智能)标准,但未来可能成为通往AGI的关键节点。

齐鹏博士还提到,研究院的目标是实现技术的商业化落地,专注于AIGC的落地应用,特别是解决“最后一公里”问题,将研究成果转化为实际产品或服务。他指出,尽管大模型的智力可以不断提升,但需要配套的设施和工具来支持其运行和应用,这些设施在推动大模型实际应用和社会价值方面至关重要。

豆包-智能助手

原文和模型


【原文链接】 阅读原文 [ 1094字 | 5分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★☆☆☆☆

© 版权声明

相关文章

暂无评论

暂无评论...