标签:深度学习
Scaling Law百度最早提出?!OpenAI/Claude都受它启发,Ilya出现在致谢名单中
在深度学习领域,Scaling Law的概念最早由百度在2017年提出,而非后来的OpenAI。这项研究由吴恩达领导的百度硅谷人工智能实验室(SVAIL)系统团队进行,探讨...
英伟达RISC-V,鲜为人知
英伟达在RISC-V领域的深耕已久,自2015年选择RISC-V作为其专有Falcon MCU的继任架构以来,英伟达已累计量产约30亿颗基于RISC-V内核的芯片,并预计到2024年将...
AI不能设计芯片?谷歌发文回击!
谷歌DeepMind近期发表研究论文,回应对其AI芯片设计系统AlphaChip的质疑。AlphaChip是一种利用深度强化学习设计芯片布局的方法,最初于2020年宣布,并在2021...
谷歌 AlphaChip 论文再被质疑,DeepMind 驳斥都没做与训练,顺带还揪出了“内鬼”?
DeepMind在2020年发布了AlphaChip项目,这是一种深度强化学习方法,用于生成超越人类能力的芯片布局设计。该项目在《自然》杂志上发表,并在GitHub上开源,激...
阿里开源Qwen2.5-Coder,最强开源代码模型来了
阿里巴巴研究人员开源了Qwen2.5-Coder代码生成模型,包含0.5B、3B、14B和32B四个版本,适用于不同开发环境。测试数据显示,32B指令微调模型在多个测试中性能...
著名 AI 学者、天工智能首席科学家颜水成离开昆仑万维,去年 9 月入职
AI领域国际顶尖学者颜水成已离开昆仑万维。颜水成拥有丰富的学术和工作经历,包括在北京大学数学系学习、微软亚洲研究院实习、香港中文大学从事人脸识别研究...
奥特曼专访自曝OpenAI掌握AGI密钥,2025年降临!1人1万块GPU缔造十亿独角兽
OpenAI的CEO奥特曼在最近访谈中分享了他对AGI(人工通用智能)和ASI(人工超级智能)的看法。他预测ASI可能在“几千天内”到来,并认为现在是创办科技公司的最...
教授何恺明在MIT的第二门课——《深度生成模型》,讲座PPT陆续已出
何恺明,残差网络(ResNet)的发明者,自今年2月起在麻省理工学院(MIT)担任副教授,并已开始教授《深度生成模型》(6.S978: Deep Generative Models)课程...
苹果发布高效双EMA梯度优化方法,适配Transformer、Mamba模型
在深度学习模型训练中,优化非凸损失函数是一个挑战,尤其是当使用依赖于指数移动平均(EMA)的优化器如Adam和AdamW时。这些优化器可能在处理超大规模数据集...
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
最近,谷歌DeepMind的一篇论文《Grandmaster-Level Chess Without Search》引发了广泛关注。该论文介绍了一个参数量为2.7亿的Transformer模型,该模型无需依...