标签:性能优化

Mooncake 分离式推理架构创新与实践

在2024年QCon全球软件开发大会(上海站)上,月之暗面推理系统负责人何蔚然分享了“Mooncake分离式推理架构创新与实践”。何蔚然从实际业务出发,探讨了在固定...

每帧都是AI实时生成的,全球首款AI游戏问世了!

谷歌GameNGen的突破性技术使得AI能够基于扩散模型实时生成可玩的游戏,这一技术的发展预示着全球游戏产业的重大变革。紧随其后,Etched和Decart AI两家初创公...

一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源

智源研究院联合多所高校发布了超长视频理解大模型Video-XL,该模型利用语言模型的原生能力对长视觉序列进行压缩,不仅保留了短视频理解的能力,还在长视频理...

7天开发一个AI Agent应用!秘密武器:一体化数据库

OceanBase最近推出了4.3.3版本,这是其首个面向实时分析处理场景的GA版本。该版本通过增强多模态数据处理能力和推出全新的向量检索功能,实现了SQL+AI一体化...

工作这么多年了,很多人连抽象是啥都没搞明白

在软件系统的重构和性能优化过程中,代码库中的抽象问题尤为突出。虽然整洁有序的模块化代码看似理想,但实际上可能只是层层间接调用,导致性能下降和调试困...

Meta版o1来了!田渊栋团队整合快慢思考,能走迷宫推箱子

Meta FAIR的研究团队最近推出了一款名为Dualformer的新型人工智能模型,该模型能够将快速和慢速思考无缝结合,以提升性能并降低成本。Dualformer在推理轨迹和...

手机 AI 2.0 时代,OriginOS 5 找到了哪些「成功密码」?

智能手机系统正迈入AI浪潮的2.0时代,厂商们在推出AI功能手机的同时,面临如何将AI大模型能力融入手机的挑战。vivo在2024开发者大会上推出的OriginOS 5系统,...

开源软件Gradio上新5大功能,几行Python代码,构建Web应用程序

Gradio 5,一个由Hugging Face推出的开源Python软件包,已正式发布其稳定版本。这个工具旨在帮助用户快速构建机器学习模型、API或任何Python函数的演示或Web...

LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作

最新研究揭示了大型语言模型(LLM)之间合作的潜力,特别是在提升数学问题解决能力方面。蒙特利尔大学、剑桥大学、普林斯顿大学和谷歌DeepMind的研究人员发现...

中国最大开源MoE模型,255B参数无条件免费商用,元象发布

元象XVERSE发布了中国最大的MoE(Mixture of Experts)开源模型XVERSE-MoE-A36B,该模型拥有255B的总参数和36B的激活参数,实现了在不显著增加训练和推理计算...
1 2 3 4