标签:微调

清华北航博士生「强迫」Gemma-2说中文!弱智吧、角色扮演、数学问题表现惊喜

谷歌最新发布的Gemma 2模型在中文处理能力上存在不足,但清华大学和北航的两名博士生迅速推出了针对该模型的指令微调版本,显著提升了其在中文通用对话、角色...

如何从头开始编写LoRA代码,这有一份教程

本文介绍了一种名为 LoRA(Low-Rank Adaptation) 的微调技术,用于微调大语言模型(LLM)。LoRA 是一种流行的技术,通过仅更新一小部分低秩矩阵而不是整个神...

使用 Hugging Face 微调 Gemma 模型

在这篇文章中,我们将介绍 Google Deepmind 开放的 Gemma 语言模型,它现在可以通过 Hugging Face 向更广泛的开源社区开放。Gemma 提供了两个规模的版本:2B ...

碾压前辈!Meta发布“最大、性能最好”的开源Code Llama 70B,但开发者纷纷喊穷:玩不起!

Code Llama是Llama 2模型的编码专用版本,支持多种高人气编程语言。Meta发布了四种Code Llama模型版本,参数分别为7B、13B、34B和70B,各模型版本使用不同数...