文章摘要
【关 键 词】 人工智能、大型语言模型、多模态、职业发展、创业心得
李沐,一位在人工智能领域享有盛誉的专家,近日在上海交通大学(上交大)的演讲吸引了大量学生和教职工的热烈追捧,现场座无虚席,甚至演讲结束后学生们仍热情不减,纷纷请求签名。李沐此次演讲的核心内容聚焦于大型语言模型(LLM)的发展趋势以及个人职业选择的思考。
李沐将LLM的构成分解为数据、算力和算法三大要素,形象地比喻为炼丹过程,其中数据收集相当于寻找炼丹材料,算力则类似于炼丹的火力,而算法则是炼丹的配方。他强调,与以往的深度学习相比,现代的LLM更注重模型的“灵魂”,即解决实际问题的能力。在硬件方面,李沐认为带宽、内存和算力是LLM发展的关键瓶颈,同时指出摩尔定律依然适用于算力的发展。他还提到,尽管存在一些芯片替代品,但在模型训练方面,传统GPU仍占据主导地位。
在模型的具体应用方面,李沐从语言、语音、音乐、图像和视频等不同模态进行了分析,认为多模态是当前的发展趋势,并对未来人机交互的流行趋势做出了预测。他还分享了自己对大模型评测的看法,认为现有的评测方法过于简单,不能准确反映模型的实际效果。
李沐还结合自己丰富的职业经历,包括在学术界和工业界的工作经验,以及最近的创业经历,分享了个人职业发展的心得。他将职业发展分为大公司、博士和创业三个阶段,并讨论了每个阶段的目标和挑战。李沐建议,无论是选择学术研究、创业还是就业,都应从个人动机出发,结合LLM的发展趋势来做出决策。
此外,李沐还提到了自己在知乎上发表的文章《创业一年,人间三年》,在这篇文章中,他详细回顾了自己创业一年的经历和心得,展现了创业过程中的挑战和收获。
李沐的演讲不仅为上交大的师生们提供了关于LLM发展趋势的深刻见解,也分享了个人职业发展的宝贵经验,受到了在场听众的高度评价和热烈响应。演讲视频已由B站网友Kimoyee上传,供感兴趣的人们进一步学习和了解。
原文和模型
【原文链接】 阅读原文 [ 2339字 | 10分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★