标签:大语言模型
首个基于SSM-Transformer混合架构,开源商业大模型Jamba
AI研究实验室AI21最近开源了其基于SSM-Transformer混合架构的商业大模型——Jamba。这个模型在传统的Transformer架构上加入了结构化状态空间模型 (SSM) 技术,...
谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力
本文主要介绍了谷歌Deepmind和南加州大学研究人员提出的一种用于大语言模型的通用框架——SELF-DISCOVER,它能自行发现任务内在的推理结构,以解决对典型提示方...
Sora最新生成的7个创意短片,太惊艳了!
OpenAI近期公布了7位视觉艺术家、设计师、创意总监和电影制作人通过其大语言模型Sora制作的创意短片。这些短片在场景切换、文本语义还原、色彩、光线与阴影、...
南洋理工发布多模态智能体 FinAgent,开启高效金融交易的创新之旅
金融市场的稳定和繁荣对经济发展至关重要,然而,随着金融市场的日益复杂化和全球化,传统的基于规则的量化交易系统因其缺乏对市场动态的适应性而日益显得力...
7人创业、1人投敌!Transformer 八子谷歌坐冷板凳5年再成老黄座上宾
在2017年,谷歌的8名研究人员联合发表了名为《你所需要的是注意力》的论文,提出了Transformer架构,这项技术彻底改变了技术发展路径。Transformer架构的诞生...
类ChatGPT平台Cohere正融资5亿美元,估值50亿美元
专注于AIGC领域的专业社区文章介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。其...
英伟达推出NeMo,极大简化自定义生成式AI开发
这篇文章介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者...
具备实时数据更新能力的大语言模型——Larimar
文章介绍了一个专注于AIGC领域的专业社区,关注微软 &OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的平台。其中提到了ChatGPT、Claud...
如何从头开始编写LoRA代码,这有一份教程
本文介绍了一种名为 LoRA(Low-Rank Adaptation) 的微调技术,用于微调大语言模型(LLM)。LoRA 是一种流行的技术,通过仅更新一小部分低秩矩阵而不是整个神...
总奖金 4 万美元!亚马逊 KDD Cup 2024 大模型在线购物竞赛正式启动
亚马逊KDD Cup 2024大模型在线购物竞赛于3月18日正式启动,旨在寻找能够准确理解购物意图并实时交流的购物助手。KDD Cup作为知名的数据挖掘竞赛项目,吸引了...