2023，当之无愧的大模型之年

AIGC动态2年前 (2024)更新 admin

5,696 0 0

原文作者：AI大模型实验室
作者简介：关注大模型技术的创新与发展，探索大模型的实际应用，探讨 AI 未来对企业与社会发展的影响。
微信号：damoxingLab

关键词：图像生成、视频生成、文本生成、Bard、Gemini、GPT-4
文章摘要：
2023年AI领域的发展主要集中在现有技术的完善上，而非带来颠覆性创新。
图像生成方面，Adobe Firefly和Generative Fill为创造多样化视觉内容提供了强大支持，Midjourney的V5模型在效率、连贯性和分辨率上有明显提升，DALL·E 3简化了图像生成的过程，Shutterstock.AI将AI功能融入图库，提供可供授权使用的图像。
视频生成方面，Stability AI发布了Stable Video Diffusion模型，HeyGen推出了集语音克隆、嘴唇运动同步和视频语言翻译于一体的工具，Runway Gen-2允许用户轻松生成完整视频，Pika升级了AI模型，Meta的编解码器头像实现了照片级真实感的远程呈现。
文本生成方面，Google的Bard聊天机器人引入了情感和情绪，Grok是Elon Musk的新创公司推出的聊天机器人，OverflowAI提升了知识整理能力，OpenAI的GPT-4实现了重大飞跃，Mistral AI发布了Mistral 7B和Mistral 8x7B模型，01.AI发布了Yi-34B开源神经网络。其他重要进展包括Meta AI开发的SAM图像分割模型和DPO方法用于微调语言模型和文本到图像的模型。