标签:大模型
浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!
实验结果显示,AUTOACT方法在Llama-2 13B和70B基础下训练出的Agent优于其他所有直接提示方法、CoT与Agent方法。在HotpotQA实现了3.77%的提升,在ScienceQA上...
文心、讯飞、ChatGPT大模型的横向比较
作者信息 【原文作者】 李孟聊AI 【作者简介】 独立开源软件开发者,SolidUI作者。老程序员,老扑街作者,依然奋战在开源一线,依然热爱写文章。https://ww...
实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来
第一部分介绍了科大讯飞在2024年上半年对标GPT-4的承诺,并详细描述了讯飞星火V3.5的升级情况,包括整体接近GPT-4 Turbo、语音交互能力、多模态能力等方面的...
2024风口前瞻:大模型催生AI Agent革命,开启智能实体自主决策新时代
AI Agent 的发展迅速,国内外出现了很多具有代表性的研究产品,如亚马逊的 Amazon Bedrock Agents 和阿里的 ModelScopeGPT。未来机会包括 AI智能助手、行业垂...
讯飞星火V3.5重磅发布,开源iFlytekSpark-13B!
第一段:讯飞星火V3.5于2024年1月30日14点发布,相比V3.0,在逻辑推理、文本生成、数学答题及小样本学习能力等方面有大幅提升。第二段:讯飞星火开源大模型iF...
2024年启航:多模态大模型+垂直领域
第一段介绍了技术进步对信息获取的影响,指出了搜索引擎的诞生开启了人与机器之间信息共享的时代,但技术进步也加剧了人与人之间的差距。接下来的段落讨论了...
腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法
第一段介绍了多模态大模型(MM LLMs)在通往通用人工智能(AGI)的道路上的重要性,以及谷歌 Gemini 宣传片和腾讯 AI Lab 最新综述的重要性。第二段详细介绍...
Transformer的无限之路:位置编码视角下的长度外推综述
作者信息 【原文作者】 机器之心 【作者简介】 专业的人工智能媒体和产业服务平台 【微 信 号】 almosthuman2014 文章摘要 【关 键 词】 Trans...
大模型,小而美可能是更好的选择
文章主要讨论了足球比赛中的特点与成功、大模型的发展历程以及猎户星空发布的大模型。在第一部分中,作者指出了弱队可以依靠自己的特长,在与强队的比赛中获...
LLaVA-Plus:多模态大模型的新突破
LLaVA-Plus多模态大模型的重大突破,该模型具有丰富的多模态处理能力,创新的技能库概念,模块化与灵活性,以及LLM与多模态任务的融合。LLaVA-Plus的设计思路...