标签:计算

微软再放LLM量化大招!原生4bit量化,成本暴减,性能几乎0损失

微软亚研院的研究团队近期发布了原生1bit精度的大模型BitNet b1.58 2B4T的升级版本——BitNet v2。这一新版本在性能几乎无损失的情况下,显著降低了内存占用和...

50年僵局打破!MIT最新证明:对于算法少量内存胜过大量时间

计算中的时间和空间是两种最基本的资源,任何算法在执行时都需要一定的时间,并占用一定的空间来存储数据。长期以来,研究人员普遍认为某些任务的算法所需的...

微软CEO和奥特曼失了和,OpenAI被“断粮”

奥特曼和纳德拉的关系逐渐变得紧张,OpenAI与微软的合作也出现了微妙的变化。尽管双方曾被视为科技界最佳合作伙伴,但近年来在计算资源、模型访问权限以及通...

AI也要007?Letta、伯克利提出「睡眠时间计算」,推理效率翻倍还不加钱

AI 初创公司 Letta 和 UC 伯克利的研究人员提出了一种名为“睡眠时间计算”的新方法,旨在通过利用大型语言模型(LLM)在空闲时间的“思考”来提高推理效率并降低...

又一个芯片架构,走向消亡?

2000年,索尼电脑娱乐公司的久多良木健提出了“Cell处理器”的概念,旨在打破传统计算架构的局限。他通过与IBM和东芝的合作,共同开发了这一处理器,目标是实现...

黄仁勋,碰到大麻烦

在Nvidia GTC大会上,首席执行官黄仁勋详细展示了公司未来的技术路线图,揭示了计算扩展、电力需求和数据中心设计等方面的重大挑战。Nvidia计划推出下一代Bla...

英伟达软硬件“双拳出击”:Blackwell Ultra、Rubin 芯片炸场,开源Dynamo让R1 token生成暴涨40倍

英伟达 GTC 2025 大会在加利福尼亚州圣何塞会议中心盛大开幕,吸引了全球科技界的广泛关注。作为人工智能和计算机图形学领域的顶级峰会,GTC 大会被视为行业...

老黄 5090 都被初创公司虐了?印度 CEO 用 20 人团队让芯片快10 倍、功耗大砍近 80%!网友:等英伟达收购

在GPU领域,英伟达、AMD和英特尔长期占据主导地位,而美国初创公司Bolt Graphics近期发布的Zeus GPU平台,试图在高端GPU计算领域开辟新的道路。Zeus GPU专为...

GPU,一统天下

本文详细回顾了图形处理单元(GPU)的发展历程,从最初仅用于加速2D图形绘制的辅助设备,到成为当今高性能计算和机器学习领域不可或缺的核心技术。文章从20世...