标签:性能优化
CUDA护城河,有多深?
Nvidia正面临来自英特尔和AMD的新加速器的激烈竞争,这些加速器在内存容量、性能和价格方面对Nvidia的最佳芯片构成挑战。Nvidia通过其CUDA运行时在开发者社区...
重磅!OpenAI开放满血o1模型API,成本暴降60%
OpenAI在技术分享直播中发布了o1模型的API,并进行了实时API的大升级,支持WebRTC技术。o1模型API相较于预览版本,思考成本降低了60%,并新增了高级视觉功能...
Sora发布!这次的惊艳居然不在模型,而是产品设计和制作流
OpenAI在发布会上推出了备受期待的视频生成模型Sora Turbo,这是对2月份Sora预览版的高端加强版,提升了速度并保留了“世界模拟”能力。Sora Turbo支持从文本和...
LeCun团队新作:在世界模型中导航
近期,AI领域的研究热点之一是世界模型(World Models),其中Meta FAIR的Yann LeCun团队发布了导航世界模型(Navigation World Models,NWM),这一模型能够...
智源发布心脏模型!超实时仿真人体生理功能,速度提升180倍
智源研究院开发了一种实时心脏电生理仿真系统,该系统能够实现心脏3D电活动的实时模拟,并深入探讨不同生理、病理因素对心脏功能的影响。这一系统在医学基础...
Mooncake 分离式推理架构创新与实践
在2024年QCon全球软件开发大会(上海站)上,月之暗面推理系统负责人何蔚然分享了“Mooncake分离式推理架构创新与实践”。何蔚然从实际业务出发,探讨了在固定...
每帧都是AI实时生成的,全球首款AI游戏问世了!
谷歌GameNGen的突破性技术使得AI能够基于扩散模型实时生成可玩的游戏,这一技术的发展预示着全球游戏产业的重大变革。紧随其后,Etched和Decart AI两家初创公...
一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源
智源研究院联合多所高校发布了超长视频理解大模型Video-XL,该模型利用语言模型的原生能力对长视觉序列进行压缩,不仅保留了短视频理解的能力,还在长视频理...
7天开发一个AI Agent应用!秘密武器:一体化数据库
OceanBase最近推出了4.3.3版本,这是其首个面向实时分析处理场景的GA版本。该版本通过增强多模态数据处理能力和推出全新的向量检索功能,实现了SQL+AI一体化...
工作这么多年了,很多人连抽象是啥都没搞明白
在软件系统的重构和性能优化过程中,代码库中的抽象问题尤为突出。虽然整洁有序的模块化代码看似理想,但实际上可能只是层层间接调用,导致性能下降和调试困...