标签:大模型
大语言模型 vs 大模型
本文主要介绍了大模型的概念、分类以及与大语言模型的关系。大模型是基于神经网络的一种模型,由多个神经元组成,通过权重连接形成层次结构。神经网络通过学...
OpenAI向左,Meta往右
1. Meta(前Facebook)宣布计划构建自己的AGI,强调将向大众开放技术,与OpenAI相反,Meta选择开源,通过开源LLaMA模型打破大模型的垄断,成为第三股力量。2....
大语言模型评测是怎么被玩儿烂的?我们跟知情人聊了一个下午
大模型评测面临着一些挑战,包括评测成本和时间成本高,以及数据泄露导致的过拟合问题。一些大模型公司通过刷题来提高分数,这已经成为公开的秘密。此外,评...
浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!
实验结果显示,AUTOACT方法在Llama-2 13B和70B基础下训练出的Agent优于其他所有直接提示方法、CoT与Agent方法。在HotpotQA实现了3.77%的提升,在ScienceQA上...
文心、讯飞、ChatGPT大模型的横向比较
作者信息 【原文作者】 李孟聊AI 【作者简介】 独立开源软件开发者,SolidUI作者。老程序员,老扑街作者,依然奋战在开源一线,依然热爱写文章。https://ww...
实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来
第一部分介绍了科大讯飞在2024年上半年对标GPT-4的承诺,并详细描述了讯飞星火V3.5的升级情况,包括整体接近GPT-4 Turbo、语音交互能力、多模态能力等方面的...
2024风口前瞻:大模型催生AI Agent革命,开启智能实体自主决策新时代
AI Agent 的发展迅速,国内外出现了很多具有代表性的研究产品,如亚马逊的 Amazon Bedrock Agents 和阿里的 ModelScopeGPT。未来机会包括 AI智能助手、行业垂...
讯飞星火V3.5重磅发布,开源iFlytekSpark-13B!
第一段:讯飞星火V3.5于2024年1月30日14点发布,相比V3.0,在逻辑推理、文本生成、数学答题及小样本学习能力等方面有大幅提升。第二段:讯飞星火开源大模型iF...
2024年启航:多模态大模型+垂直领域
第一段介绍了技术进步对信息获取的影响,指出了搜索引擎的诞生开启了人与机器之间信息共享的时代,但技术进步也加剧了人与人之间的差距。接下来的段落讨论了...
腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法
第一段介绍了多模态大模型(MM LLMs)在通往通用人工智能(AGI)的道路上的重要性,以及谷歌 Gemini 宣传片和腾讯 AI Lab 最新综述的重要性。第二段详细介绍...