标签:大语言模型

具备实时数据更新能力的大语言模型——Larimar

文章介绍了一个专注于AIGC领域的专业社区,关注微软 &OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的平台。其中提到了ChatGPT、Claud...

如何从头开始编写LoRA代码,这有一份教程

本文介绍了一种名为 LoRA(Low-Rank Adaptation) 的微调技术,用于微调大语言模型(LLM)。LoRA 是一种流行的技术,通过仅更新一小部分低秩矩阵而不是整个神...

总奖金 4 万美元!亚马逊 KDD Cup 2024 大模型在线购物竞赛正式启动

亚马逊KDD Cup 2024大模型在线购物竞赛于3月18日正式启动,旨在寻找能够准确理解购物意图并实时交流的购物助手。KDD Cup作为知名的数据挖掘竞赛项目,吸引了...

英伟达引爆AI PC革命,RTX给1亿打工人送算力!40系卡秒生百张图,「黑神话:悟空」画质爆表玩家颤抖

英伟达近期推出了一系列创新产品和服务,包括新的RTX GPU、AI推理微服务NIM、AI应用和工具等,以推动AI PC时代的到来。这些新产品和服务将为1亿RTX PC用户和...

英伟达推出NIM,可优化推理以实现大规模AI模型部署

本文介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。ChatGPT的出现加速了生成式AI...

总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述

机器之心编辑部撰写的这篇文章主要讨论了大语言模型(LLMs)的知识蒸馏技术及其在研究和工业界中的应用。文章首先指出,尽管闭源LLMs如GPT-4、Gemini和Claude...

350亿参数、开放权重,Transformer作者创业后推出新大模型

Cohere公司推出了新的大语言模型Command-R,该模型具有35B的参数量,属于可扩展模型类别,平衡了高效率和高精度,适用于大规模生产工作负载。Command-R针对检...

当prompt策略遇上分治算法,南加大、微软让大模型炼成「火眼金睛」

摘要总结:本文探讨了大语言模型(LLMs)在处理复杂任务时的局限性,并提出了一种新的基于分治算法的提示策略(Divide-and-Conquer, DaC),以提高模型在面对...

国内复现Sora并开源:成本降低46%,序列扩充近百万!

本文介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。文章首先提到了OpenAI展示了...

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

摘要:本文介绍了一种名为OmniQuant的新型大语言模型(LLM)量化算法。该算法由上海人工智能实验室、香港大学和香港中文大学的研究者共同提出,旨在解决大语...
1 4 5 6 7 8 9