失联大神李沐B站复更：领读Llama 3.1论文，还多讲了一点AI八卦；大模型竞技场Llama 3.1排名第三

AIGC动态1年前 (2024)发布 QbitAI

2,463 0 0

失联大神李沐B站复更：领读Llama 3.1论文，还多讲了一点AI八卦；大模型竞技场Llama 3.1排名第三

文章摘要

AI领域的知名专家李沐老师在时隔一年多后，重新回归B站，继续他的“经典论文精读系列”，这次他选择了Llama-3.1作为讲解对象。在大约18分钟的视频里，李沐老师不仅详细解读了Llama-3.1的技术论文，还透露了一些背后的趣闻轶事。他提到，在Llama团队最初训练最大模型时，他们尝试了MoE模型和稠密模型，但MoE模型最终未能成功，因此只发布了一个简化版本。

Llama-3.1-405B作为开源模型，在大模型竞技场排名中首次进入前三，仅次于GPT-4o和Claude-3.5-Sonnet，这一成绩得到了Meta官方的比较和人类评估的认可。Llama-3.1-405B不仅整体表现出色，在编码、数学、指令遵循和硬提示等单项中也稳居前三。此外，Llama-3.1-70B也取得了总榜第9的好成绩，显示了其置信水平的显著提升。

国外的网友们对Llama-3.1-405B的新成绩表示祝贺，并期待其下一次迭代将带来更加惊人的表现。发布仅一周，Llama-3.1-405B已经被网友们用于多种应用场景。例如，Open Interpreter技术社区经理展示了在树莓派上仅使用CPU运行Llama-3.1-8B的方法，尽管运行几句代码就可能耗尽CPU资源。此外，还有网友利用Llama-3.1-405B在GitHub仓库上创建聊天机器人，这一功能由Hugging Face免费提供。

尽管Groq工程师Rick Lamers对RAG管道可能存在的问题表示担忧，但这并未阻止网友们对Llama-3.1-405B的尝试和探索。更有甚者，网友Hassan宣布使用Llama-3.1-405B生成了完整的React应用程序，尽管该应用程序尚未正式开源，但已经吸引了众多网友的关注。

李沐老师的Llama3.1论文精读视频和大模型竞技场的完整数据可以通过提供的链接访问。这次回归不仅为AI爱好者带来了宝贵的学习资源，也展示了Llama-3.1-405B在实际应用中的潜力和多样性。