李沐重返母校，上交大秒变追星现场，大模型趋势无保留分享

2,581 0 0

文章摘要

李沐，一位在人工智能领域享有盛誉的专家，近日在上海交通大学（上交大）的演讲吸引了大量学生和教职工的热烈追捧，现场座无虚席，甚至演讲结束后学生们仍热情不减，纷纷请求签名。李沐此次演讲的核心内容聚焦于大型语言模型（LLM）的发展趋势以及个人职业选择的思考。

李沐将LLM的构成分解为数据、算力和算法三大要素，形象地比喻为炼丹过程，其中数据收集相当于寻找炼丹材料，算力则类似于炼丹的火力，而算法则是炼丹的配方。他强调，与以往的深度学习相比，现代的LLM更注重模型的“灵魂”，即解决实际问题的能力。在硬件方面，李沐认为带宽、内存和算力是LLM发展的关键瓶颈，同时指出摩尔定律依然适用于算力的发展。他还提到，尽管存在一些芯片替代品，但在模型训练方面，传统GPU仍占据主导地位。

在模型的具体应用方面，李沐从语言、语音、音乐、图像和视频等不同模态进行了分析，认为多模态是当前的发展趋势，并对未来人机交互的流行趋势做出了预测。他还分享了自己对大模型评测的看法，认为现有的评测方法过于简单，不能准确反映模型的实际效果。

李沐还结合自己丰富的职业经历，包括在学术界和工业界的工作经验，以及最近的创业经历，分享了个人职业发展的心得。他将职业发展分为大公司、博士和创业三个阶段，并讨论了每个阶段的目标和挑战。李沐建议，无论是选择学术研究、创业还是就业，都应从个人动机出发，结合LLM的发展趋势来做出决策。

此外，李沐还提到了自己在知乎上发表的文章《创业一年，人间三年》，在这篇文章中，他详细回顾了自己创业一年的经历和心得，展现了创业过程中的挑战和收获。

李沐的演讲不仅为上交大的师生们提供了关于LLM发展趋势的深刻见解，也分享了个人职业发展的宝贵经验，受到了在场听众的高度评价和热烈响应。演讲视频已由B站网友Kimoyee上传，供感兴趣的人们进一步学习和了解。