大模型
LLM,VLM,模型
Cuebric:用AI技术为内容创作者赋能,让创意工作更简单。
Cuebric是一家数字创意公司,利用其独特的AI技术为电影制作人和内容创作者带来了革命性的变革。其AI图像生成技术能够帮助创作者将创意愿景转化为生动的图像,...
机器人领域首个开源视觉-语言操作大模型,RoboFlamingo框架激发开源VLMs更大潜能
这篇文章介绍了ByteDance Research基于开源的多模态语言视觉大模型OpenFlamingo开发的RoboFlamingo机器人操作模型。RoboFlamingo通过简单微调就能适应于语言...
OpenAI出手后,GPT-4真的不懒了?网友不买账:只靠打补丁恐怕无济于事!
用户曾抱怨GPT-4在高峰期表现不佳,给出模糊答案或使用占位符,这些问题被认为是模型“学会偷懒”。社区用户jonathanallengrant和manchkiran等人对此提出了批评...
百川智能发布超千亿大模型Baichuan 3,中文评测超越GPT-4
百川智能最近发布了一个超千亿参数的大型语言模型Baichuan 3,该模型在多个通用能力评测中表现出色,尤其在中文任务上超越了GPT-4。Baichuan 3在数学、代码生...
Agent检索增强生成:突破传统RAG局限,构建更加智能、贴近事实的LLM应用!
本文介绍了一种新的检索增强生成(RAG)模式,旨在突破传统RAG模式的局限性,构建更加智能、更加贴近事实的大语言模型(LLM)应用。文章首先介绍了基本的RAG...
Transformer的无限之路:位置编码视角下的长度外推综述
作者信息 【原文作者】 机器之心 【作者简介】 专业的人工智能媒体和产业服务平台 【微 信 号】 almosthuman2014 文章摘要 【关 键 词】 Trans...
聊聊我构建SMoE模型的过程
文章首先介绍了稀疏混合专家语言模型的背景和相关概念,以及与传统 Transformer 模型的共享元素。作者指出训练稳定性是这些模型面临的主要挑战,而小规模、可...
2023年大语言模型融合技术调研与实践指南
本文介绍了大语言模型融合的新技术,包括模型合并算法、实践和配置示例。首先介绍了模型合并的流行趋势和效果,以及在OpenLLM排行榜上产生了许多最先进的模型...
小模型有大智慧,Phi-2:微软Microsoft 的小语言模型,开源!
文章介绍了微软Microsoft推出的小语言模型Phi-2,该模型虽然参数只有2.7亿,但在各种测试中展现出了卓越的推理和语言理解能力,甚至超过了规模大达25倍的模型...
清华、小米、华为、 vivo、理想等多机构联合综述,首提个人LLM智能体、划分5级智能水平
这篇文章主要介绍了一篇综述论文,该论文来自国内多所高校和企业研究所,梳理了个人 LLM 智能体所需的能力、效率和安全问题,并提出了个人 LLM 智能体的 5 级...