标签:效率提升

Stability AI开源3B代码生成模型:可补全,还能Debug

本文报道了Stability AI 公司开源的小体量预训练模型 Stable Code Instruct 3B,该模型是一个基于 Stable Code 3B 的指令调整编码语言模型,能够处理各种任务...

清华姚班本科生连发两作,十年来最大改进:矩阵乘法接近理论最优

通过消除「隐藏的低效」问题,计算机科学家提出了一种比以往更快的大型矩阵相乘新方法。这一进展是在矩阵乘法领域中的重要突破,矩阵乘法不仅是高性能计算中...

微软、国科大开启1Bit时代:大模型转三进制,速度快4倍能耗降至1/41

摘要:近期,微软研究院、国科大等机构的研究者提出了一种革命性的1-bit大模型,这一技术在AI领域引起了广泛关注。该研究通过将大模型的权重改为三元表示,实...

打入AI底层!NUS尤洋团队用扩散模型构建神经网络参数,LeCun点赞

新加坡国立大学尤洋教授团队联合UCB、Meta AI实验室等机构开源了一项研究成果,提出了一种用于生成神经网络参数的扩散模型p(arameter)-diff。该模型能够显著...