标签:大模型
Transformer的无限之路:位置编码视角下的长度外推综述
作者信息 【原文作者】 机器之心 【作者简介】 专业的人工智能媒体和产业服务平台 【微 信 号】 almosthuman2014 文章摘要 【关 键 词】 Trans...
大模型,小而美可能是更好的选择
文章主要讨论了足球比赛中的特点与成功、大模型的发展历程以及猎户星空发布的大模型。在第一部分中,作者指出了弱队可以依靠自己的特长,在与强队的比赛中获...
LLaVA-Plus:多模态大模型的新突破
LLaVA-Plus多模态大模型的重大突破,该模型具有丰富的多模态处理能力,创新的技能库概念,模块化与灵活性,以及LLM与多模态任务的融合。LLaVA-Plus的设计思路...
社区供稿 | 多轮对话推理速度提升 46%,开源方案打破 LLM 多轮对话的长度限制
第二段:讲述了StreamingLLM的优势和挑战,以及其通过观察注意力模块中Softmax的输出,解决了注意力 sink 的现象,提高了生成效果。第三段:介绍了Colossal-A...
多模态大模型,阿里通义千问能和GPT-4V掰手腕了
文章介绍了通义千问的图像推理能力的大幅提升,以及大模型领域的未来发展方向。近期,OpenAI推出了GPT-4V,使大模型具备了前所未有的图像语义理解能力。谷歌...