标签:量子位
谷歌爆改Transformer,“无限注意力”让1B小模型读完10部小说,114倍信息压缩
这篇文章介绍了谷歌最新提出的Infini-attention机制,该机制能够使Transformer架构的大模型在有限的计算资源下处理无限长的输入,并实现114倍的内存压缩比。I...
刚刚,图灵奖揭晓!史上首位数学和计算机最高奖“双料王”出现了
这篇文章介绍了计算机界最高荣誉图灵奖的获得者、复杂性理论先驱、普林斯顿高等研究院教授艾维·维格森(Avi Wigderson)的成就和影响。维格森因对计算理论的...
“梗王”大模型,靠讲笑话登上CVPR | 中山大学
这篇文章介绍了中山大学HCP实验室团队与Sea AI Lab以及哈佛大学合作的研究成果,他们提出了一种新的训练方法CLoT,旨在激发多模态大模型的创造力。首先,团队...
英特尔突袭英伟达H100,新AI芯片训练快40%,推理快50%,CEO蹦迪庆祝
这篇文章介绍了英特尔在最新发布会上推出的两款产品:Gaudi 3和第六代Xeon处理器。首先,英特尔CEO帕特·基辛格展示了Gaudi 3 AI芯片,宣称其在训练和推理大模...
谷歌最强大模型免费开放了!长音频理解功能独一份,100万上下文敞开用
Gemini 1.5 Pro是谷歌最强大的模型,现在全面对外开放,免费供开发者使用。这个版本增加了音频理解功能,可以解析各种音频内容,无需提供字幕文档。Gemini 1....
离谱!AI超市「无人」收款,1000个印度人藏在背后……
亚马逊的“Just walk out”服务,号称利用AI技术实现无人超市,顾客只需拿走商品,系统会自动识别并发送账单。然而,近期曝光的真相是,背后有一个千人规模的印...
AI算力提高,高能耗和难散热问题如何突破?
随着人工智能技术的飞速发展,AI电源芯片的需求量急剧增加。这些芯片不仅需要为AI系统提供稳定的电力供应,还要在节能减排和降低能耗方面发挥作用。但是,AI...
刚刚,又有20亿巨款砸向AI,产业场景里的AGI
特斯联,一家专注于AI+IoT领域的独角兽企业,近日宣布完成了20亿规模的新一轮融资。这轮融资由国际投资机构AL Capital和国内产业基金阳明股权投资基金领投,...
OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程
Andrej KarpathyAndrej Karpathy,一位在人工智能领域享有盛誉的大神,近期复出并带来了一项引人注目的项目:使用纯C语言实现GPT的训练,仅用1000行代码就完...
北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计
最近,AI代码生成领域迎来了一位资深玩家——aiXcoder,它推出了一款专门适用于企业软件开发场景的代码大模型——aiXcoder-7B Base版。这个模型虽然只有70亿参数...