大模型
LLM,VLM,模型
LLaVA-Plus:多模态大模型的新突破
LLaVA-Plus多模态大模型的重大突破,该模型具有丰富的多模态处理能力,创新的技能库概念,模块化与灵活性,以及LLM与多模态任务的融合。LLaVA-Plus的设计思路...
大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉
研究指出,预训练语言模型产生幻觉的原因是固有的统计学原因,与Transformer架构或数据质量无关。语言模型可以用于生成文本或预测下一个token,但这篇论文强...
小语言模型在企业应用中崭露头角
文章主要讨论了小型语言模型(SLMs)在企业中的崭露头角,以及它们相对于大型语言模型(LLMs)的优势和挑战。文章指出,由于其较低的计算成本、领域特定以及...
腾讯LLaMA Pro大模型:突破大模型微调的知识遗忘难题
1. 引言:大模型微调中的挑战 - 大型语言模型(LLM)的微调在提升模型性能上起着关键作用,但面临知识遗忘的挑战。 - 香港大学的研究团队联合腾讯ARC实验...
基于开源模型搭建Agent系统教程
这篇文章主要介绍了使用大型语言模型(LLMs)作为代理系统的概念,重点介绍了ReAct代理的内部工作原理和挑战。文章首先解释了LLM Agent的定义和其在任务完成...
社区供稿 | 多轮对话推理速度提升 46%,开源方案打破 LLM 多轮对话的长度限制
第二段:讲述了StreamingLLM的优势和挑战,以及其通过观察注意力模块中Softmax的输出,解决了注意力 sink 的现象,提高了生成效果。第三段:介绍了Colossal-A...
LLM排行榜更新!谷歌Bard超过GPT-4,中国玩家未进前十
这篇文章主要介绍了最新的LLMs(大型语言模型)排行榜,其中谷歌的Bard模型在Imsys的LLMs排位赛上超过了GPT-4,跃居第二名。排行榜由UC伯克利研究人员主导的L...
大模型的未来: Agent, 如何让Agent协作,处理复杂任务
这篇文章主要讨论了Docker和Kubernetes(K8s)以及人工智能领域的发展趋势。首先介绍了Docker的优势,以及K8s对Docker的影响,类比了GPT和Agent的关系。然后...
手把手系列!无需 OpenAI 即可搭建 RAG 应用
这篇文章主要介绍了如何使用不同的大语言模型(LLM)来搭建对话式RAG应用。首先,作者提到了OpenAI以外的其他LLM,包括Nebula和Hugging Face的Embedding模型...