GPT-GPTs
GPT,GPTs,Prompt
破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍
谷歌DeepMind研究团队提出了一种名为JEST(多模态对比学习与联合示例选择)的新算法,旨在解决大型语言模型(LLM)训练过程中的高能耗问题。JEST算法通过优化...
阶跃星辰的100天,大模型的“后发先至”
文章讨论了人工智能大模型技术的发展及其在企业中的应用,特别关注了阶跃星辰公司在这一领域的进展。海明威的名言“逐渐地,然后突然地”被用来形象地描述技术...
WAIC 2024 闭幕,我们记录了热闹之外的10个瞬间
第七届世界人工智能大会(WAIC)在上海圆满落幕,为期三天的大会吸引了众多行业领袖和创新企业,展示了人工智能在教育、医疗、工业等领域的最新应用。大会的...
马斯克豪掷40亿训Grok-3!红杉高盛大泼冷水,AI收支鸿沟或已达5000亿美元
硅谷的人工智能(AI)行业正在经历一场激烈的军备竞赛,其中埃隆·马斯克宣布将投资近40亿美元购买10万张H100芯片来训练Grok 3。与此同时,SemiAnalysis的数据显...
英伟达GPU,警钟敲响
欧盟竞争事务负责人玛格丽特·维斯塔格警告称,英伟达公司的AI芯片供应存在“巨大瓶颈”,但监管机构仍在考虑如何解决这个问题。尽管供应紧张,但Vestager表示,...
WAIC 最具技术想象力成果发布:新架构面壁小钢炮又一次验证并加速了面壁定律
2020年,1750亿参数规模的GPT-3模型问世,其训练成本高昂,需要使用1000张英伟达A100 GPU,花费81.6万美元,耗时22天。然而,到了2024年,只需2B参数规模的大...
8 人团队的开源多模态:Moshi,效果堪比 GPT-4o,合成数据立功
法国非营利性AI研究机构Kyutai开发了一个名为Moshi的实时语音多模态模型,该模型具备听、说、看的能力,能够理解带有法国口音的英语。Moshi可以流畅地进行日...
中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑
商汤科技在世界人工智能大会上发布了国内首个流式原生多模态交互模型——日日新5.5系列中的5o。这一模型整合了文本、声音、图像和视频等多种模态,能够实现实时...
成立半年就敢踢馆 OpenAI ,首个开源模型不输 GPT-4o,LeCun 、PyTorch 之父齐声叫好!
Kyutai,一个由8人组成的非营利性AI研究实验室,在短短6个月内开发出了一种名为'Moshi'的实时原生多模态基础AI模型。Moshi能够表达70多种情绪,以不同风格说...
钛媒体AGI对话MiniMax创始人闫俊杰:至少三年后才会出现“杀手级”AI应用|直击WAIC 2024
他指出,尽管国内许多公司正在追赶ChatGPT,但目前模型的错误率在60%-70%,远高于GPT-4的30%-40%。因此,降低大模型的错误率是核心问题,而提高训练效率、研...