标签:大模型
讯飞星火大模型重磅升级,对标GPT-4 Turbo!星火语音大模型发布,37个主流语种识别超OpenAI!
1月30日,科大讯飞发布了讯飞星火认知大模型V3.5,这是一个全面对标国际先进水平的全民开放大模型。它基于全国产算力平台“飞星一号”训练,实现了文本生成、语...
比肩GPT-4,商汤日日新大幅升级4.0,多模态能力领先一步
商汤科技近日发布了其大模型体系「日日新 SenseNova」的4.0版本,该版本在语言能力、文生图能力等方面进行了全面升级,并提供了低门槛的落地工具。新一代Sens...
Mixtral 8×7B模型调研
本文主要介绍了Mistral AI在2023年年底推出的以混合专家网络(MoE)为架构的大语言模型Mixtral 8x7B。该模型以其创新的网络架构和在总参数量更少的情况下性能...
大语言模型 vs 大模型
本文主要介绍了大模型的概念、分类以及与大语言模型的关系。大模型是基于神经网络的一种模型,由多个神经元组成,通过权重连接形成层次结构。神经网络通过学...
OpenAI向左,Meta往右
1. Meta(前Facebook)宣布计划构建自己的AGI,强调将向大众开放技术,与OpenAI相反,Meta选择开源,通过开源LLaMA模型打破大模型的垄断,成为第三股力量。2....
大语言模型评测是怎么被玩儿烂的?我们跟知情人聊了一个下午
大模型评测面临着一些挑战,包括评测成本和时间成本高,以及数据泄露导致的过拟合问题。一些大模型公司通过刷题来提高分数,这已经成为公开的秘密。此外,评...
浙大发布Agent学习框架,13B 模型达到 ChatGPT 水平!
实验结果显示,AUTOACT方法在Llama-2 13B和70B基础下训练出的Agent优于其他所有直接提示方法、CoT与Agent方法。在HotpotQA实现了3.77%的提升,在ScienceQA上...
文心、讯飞、ChatGPT大模型的横向比较
作者信息 【原文作者】 李孟聊AI 【作者简介】 独立开源软件开发者,SolidUI作者。老程序员,老扑街作者,依然奋战在开源一线,依然热爱写文章。https://ww...
实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来
第一部分介绍了科大讯飞在2024年上半年对标GPT-4的承诺,并详细描述了讯飞星火V3.5的升级情况,包括整体接近GPT-4 Turbo、语音交互能力、多模态能力等方面的...
2024风口前瞻:大模型催生AI Agent革命,开启智能实体自主决策新时代
AI Agent 的发展迅速,国内外出现了很多具有代表性的研究产品,如亚马逊的 Amazon Bedrock Agents 和阿里的 ModelScopeGPT。未来机会包括 AI智能助手、行业垂...