大模型
LLM,VLM,模型
OpenAI 演讲:如何通过 API 将大模型集成到自己的应用程序中
第一部分介绍了大语言模型(LLMs)及其局限性。 LLMs 是自回归语言模型,它们接受一个 prompt,然后预测下一个单词或 token。然后,文章介绍了如何使用 GPT ...
AutoGen零代码构建⾃⼰的智能助理
总的来说,AutoGen是一个有潜力的框架,能够在多个领域提供自动化解决方案,但也需要解决一些问题,如扩大应用范围、提高自动化效果可控性和降低成本等。
LLaVA-Plus:多模态大模型的新突破
LLaVA-Plus多模态大模型的重大突破,该模型具有丰富的多模态处理能力,创新的技能库概念,模块化与灵活性,以及LLM与多模态任务的融合。LLaVA-Plus的设计思路...
大模型幻觉问题无解?理论证明校准的LM必然会出现幻觉
研究指出,预训练语言模型产生幻觉的原因是固有的统计学原因,与Transformer架构或数据质量无关。语言模型可以用于生成文本或预测下一个token,但这篇论文强...
小语言模型在企业应用中崭露头角
文章主要讨论了小型语言模型(SLMs)在企业中的崭露头角,以及它们相对于大型语言模型(LLMs)的优势和挑战。文章指出,由于其较低的计算成本、领域特定以及...
腾讯LLaMA Pro大模型:突破大模型微调的知识遗忘难题
1. 引言:大模型微调中的挑战 - 大型语言模型(LLM)的微调在提升模型性能上起着关键作用,但面临知识遗忘的挑战。 - 香港大学的研究团队联合腾讯ARC实验...
基于开源模型搭建Agent系统教程
这篇文章主要介绍了使用大型语言模型(LLMs)作为代理系统的概念,重点介绍了ReAct代理的内部工作原理和挑战。文章首先解释了LLM Agent的定义和其在任务完成...
社区供稿 | 多轮对话推理速度提升 46%,开源方案打破 LLM 多轮对话的长度限制
第二段:讲述了StreamingLLM的优势和挑战,以及其通过观察注意力模块中Softmax的输出,解决了注意力 sink 的现象,提高了生成效果。第三段:介绍了Colossal-A...
LLM排行榜更新!谷歌Bard超过GPT-4,中国玩家未进前十
这篇文章主要介绍了最新的LLMs(大型语言模型)排行榜,其中谷歌的Bard模型在Imsys的LLMs排位赛上超过了GPT-4,跃居第二名。排行榜由UC伯克利研究人员主导的L...
大模型的未来: Agent, 如何让Agent协作,处理复杂任务
这篇文章主要讨论了Docker和Kubernetes(K8s)以及人工智能领域的发展趋势。首先介绍了Docker的优势,以及K8s对Docker的影响,类比了GPT和Agent的关系。然后...