大语言模型 vs 大模型

AIGC动态2年前 (2024)发布 admin

5,418 0 0

作者信息

【原文作者】 前端玩转AGI
【作者简介】 旨在分享对技术的理解，包括不限于大模型，Agents、前端框架（vue/angluar）、跨端框架（Ionic、Capacitor、Electron）、工程化（webpack/vite）、分享最前沿的国内外技术文章，做技术流的搬运工
【微信号】 gh_48d79173f38d

大语言模型 vs 大模型

文章摘要

【关键词】 大模型、神经网络、大语言模型、视觉大模型、多模态大模型

本文主要介绍了大模型的概念、分类以及与大语言模型的关系。大模型是基于神经网络的一种模型，由多个神经元组成，通过权重连接形成层次结构。神经网络通过学习调整连接权重，从而能够识别模式、进行分类、回归等任务。大模型的模型参数量达到了亿的级别，近期的研究成果基本在百亿到千亿的范围。

大模型主要分为以下几类：大语言模型、视觉大模型、多模态大模型、决策大模型和行业垂直大模型。大语言模型专注于处理自然语言，能够理解、生成和处理大规模文本数据；视觉大模型专注于计算机视觉任务，如图像分类、目标检测、图像生成等；多模态大模型能够处理多种不同类型的数据，如文本、图像、音频等，并在这些数据之间建立关联；决策大模型专注于进行决策和规划，通常应用于强化学习等领域；行业垂直大模型专门设计用于特定行业或领域的任务，如医学、环境、教育等。

大语言模型只是大模型的一个分类，我们有时候简称大模型倒也没有什么问题。不过要注意提交大家一点，大语言模型和行业垂直大模型是有非常明显的区别的，他们的训练数据侧重点不一样，大语言模型更多是理解我们的话里话外的意思，主要负责和人类沟通对话的能力，行业大模型更多是基于语言大模型的基础上再进一步对某些行业的专业知识进行更加深层级的训练。

大模型和AIGC是人工智能领域中的两个重要概念。大模型是指具有大量参数的机器学习模型，通常指深度学习模型。AIGC(生成式人工智能)是指基于生成对抗网络、大型预训练模型等人工智能的技术方法，通过已有数据的学习和识别，以适当的泛化能力生成相关内容的技术。从一定意义上说，大模型是AIGC的一种表现形式，或者说，大模型是AIGC的基石。

最后，文章还提到了国内AI大模型的发展情况，表示国内的大模型发展在国际表现上一直发挥不错，「百模大战」有点像春秋战国时期「百家争鸣」的镜像。