标签:计算机视觉
329篇图像、视频生成论文,今年CVPR最火的研究主题是这些
计算机视觉和模式识别会议(CVPR)2024年的录用结果显示,共有2719篇论文被接收,录用率为23.6%。当前计算机视觉领域的研究热点分布广泛,涵盖36个主题领域,...
原作者带队,LSTM卷土重来之Vision-LSTM出世
近期,由 LSTM之父Sepp Hochreiter领衔的研究团队推出了一种新的计算机视觉骨干网络——Vision-LSTM(ViL)。该网络基于扩展长短期记忆(xLSTM)模型,实现了在...
Yann LeCun:ViT慢且效率低,实时图像处理还得看卷积
在当前的计算机视觉领域,Vision Transformer(ViT)与传统的卷积神经网络(CNN)之争正日益激烈。近期,图灵奖得主、Meta首席科学家Yann LeCun对这场争论发...
斯坦福李飞飞首次创业:学术休假两年,瞄准「空间智能」
李飞飞,被誉为“人工智能教母”,因其在计算机科学领域的卓越成就而闻名。她最著名的贡献是开发了ImageNet,这是一个大规模的图像数据集,为第一代能够可靠识...
李飞飞主讲,斯坦福2024 CS231n开课,依旧座无虚席
李飞飞教授的计算机视觉课程CS231n在斯坦福大学再次开课,迎来了第九个年头。这门课程自2015年以来已成为计算机视觉专业学生的必修课,并见证了人工智能和计...
Stable Video 3D震撼上线,视频扩散模型史诗级提升!4090可跑,权重已开放
Stability AI最近发布了新的3D生成模型SV3D,该模型基于视频扩散模型,能够通过一张图生成对应的高质量3D模型。与之前的Stable Zero123相比,SV3D在模型质量...
专访上海大学方昱春教授:数据驱动的手语识别研究,如何破解数据之困?|GAIR live
本文主要讲述了上海大学的方昱春教授如何将计算机视觉技术与手语研究相融合,开辟出一片新的研究天地。方教授的研究重点在于利用计算机视觉技术(CV)探索手...
AI图片橡皮擦来了,清华&阿里合作推出「概念半透膜」模型,还能改头换面
清华大学丁贵广教授团队和阿里安全联合发布了概念半透膜模型(SPM模型),该模型可以在AI作图模型中精准、可控地擦除各类具象或抽象概念,并对无关概念几乎完...
教授何恺明在MIT的第一堂课
这篇文章报道了麻省理工学院(MIT)计算机视觉课《Advances in Computer Vision》6.8300 在 2024 新学期的盛况,教室座无虚虚,吸引了众多学生。其中,新晋教...
如何利用大模型简化开发过程提高开发效率?
在这篇文章中,作者探讨了大型语言模型(LLM)在软件开发中的潜力,特别是它们如何帮助开发者提高工作效率。文章首先引用了史蒂夫·乔布斯将计算机比作“心灵之...
1
2