标签:深度学习

被拒稿11年后翻盘获时间检验奖,DSN作者谢赛宁:拒稿≠学术死刑

谢赛宁的论文《Deeply-Supervised Nets》(DSN)在十一年后获得了AISTATS 2025年度时间检验奖,这一成就标志着该研究在深度学习领域的长期影响力。DSN提出了...

8/8/7分被NeurIPS拒稿,谢赛宁读博投的首篇论文,10年后获AISTATS 2025时间检验奖

第28届国际人工智能与统计学会议(AISTATS)于5月3日至5日在泰国举办,作为人工智能、机器学习与统计学交叉领域的重要国际会议,AISTATS致力于促进这些领域研...

从游戏少女到AI女神!她用物理驯服AI,让飓风预测快1000倍

10岁的Rose Yu在25年前收到一台电脑,这份礼物彻底改变了她的命运。从最初的电脑游戏到网页设计,再到计算机科学的学习,她的兴趣逐渐转向了人工智能(AI)领...

颠覆传统RAG,创新大模型检索增强—Insight-RAG

Megagon实验室的研究人员提出了一种创新框架Insight-RAG,旨在解决传统RAG方法在检索深度和多源信息整合方面的不足。传统RAG方法依赖表面相关性检索文档,容...

OpenAI、谷歌等一线大模型科学家公开课,斯坦福CS 25春季上新!

斯坦福大学的CS25课程专注于Transformer架构,吸引了众多AI领域的顶尖研究者参与。这门课程的最新版本「CS25: Transformers United V5」邀请了Google DeepMin...

抖音公开了他们的推荐算法原理,强烈推荐一读

抖音最近公开了其推荐算法的逻辑,揭示了如何通过机器学习预测用户行为,并实现高效的信息匹配。推荐算法的本质是一个信息过滤系统,通过分析用户的历史行为...

清华系具身智能公司「千寻智能」获 5.28 亿元 Pre-A 轮融资

具身智能领域近期迎来重要进展,清华系公司千寻智能完成5.28亿元Pre-A轮融资,由阿美风险投资旗下Prosperity7 Ventures领投,招商局创投、广发信德等多家资本...

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

近年来,Transformer架构在自然语言处理领域取得了显著成就,但其计算复杂度和内存占用问题逐渐成为瓶颈。与此同时,Mamba作为一种新兴的状态空间模型(SSM)...

13年后,AlexNet源代码终于公开:带注释的原版

谷歌首席科学家 Jeff Dean 宣布,谷歌与计算机历史博物馆(CHM)合作,共同发布了 AlexNet 的源代码,并将长期保存这些代码。AlexNet 是一个由多伦多大学研究...

团队“DeepSeek”化!字节 Seed Edge启动不足两月,冲刺AGI再发新作,训练成本再节省40%

字节跳动正式设立了代号为“Seed Edge”的研究项目,旨在探索通用人工智能(AGI)的新方法。该项目团队近期发布了一项名为Comet的关键优化技术,该技术针对MoE...
1 2 3 13