图像生成

图像,绘画

揭秘大模型技术在快手搜索的应用

快手搜索部门技术专家许坤在QCon 2024北京的分享中,深入探讨了大模型技术在快手搜索领域的应用,特别是多模态理解和生成方面的最新科研进展。许坤介绍了快手...

何恺明新作再战AI生成:入职MIT后首次带队,奥赛双料金牌得主邓明扬参与

何恺明在加入麻省理工学院(MIT)担任副教授后,首次独立带队完成了一项新的研究工作,提出了一种新的图像生成方法。该方法通过让自回归模型抛弃传统的矢量量...

谷歌推出基于Transformer的创新技术——无限注意力

随着生成式AI产品如ChatGPT和Sora等的流行,Transformer架构已成为处理文本、图像、视频和音频等数据的大型语言模型(LLM)的基础。谷歌提出了一种名为Infini...

华为要把智能时代的命运,掌握在自己手里

华为在智能时代不断深化其战略和基础设施布局,发布了包括算力、模型、操作系统在内的AI基础设施全家桶。在2024年华为开发者大会(HDC)上,华为云推出了盘古...

导师爆料:这篇CVPR最佳学生论文,从想法到成稿只用一个月,源自业余灵感

CVPR 2024 公布了最佳论文和最佳学生论文奖项,其中最佳学生论文由图宾根大学的 Zehao Yu 及其团队完成。这篇名为 'Mip-Splatting: Alias-free 3D Gaussian S...

华为盘古 5.0 强势登场:参数跃升万亿级,理解能力突破至感应 level,团队亲述幕后黑科技!

华为开发者大会于6月21日召开,会上华为云盘古大模型5.0正式发布。盘古5.0在全系列、多模态和强思维三个方面进行了全新升级,推出了多种参数规格模型以适应不...

Claude 3.5 Sonnet发布,不仅超过了GPT-4o,还在交互上有大更新

Anthropic公司发布了其下一代旗舰大模型Claude 3.5 Sonnet,标志着该公司在人工智能领域的最新进展。作为Claude 3.5系列的首个版本,Sonnet在智能水准上已领...

鹅厂大模型人才扩招50%!面向全球顶尖天才少年:薪资算力数据管够

随着毕业季的到来,大型企业和初创公司纷纷重金争夺大模型领域的人才。腾讯公司也宣布了其大模型人才计划,计划到2025年在全球范围内扩招50%的大模型人才,并...

超越CVPR 2024方法,DynRefer在区域级多模态识别任务上,多项SOTA

DynRefer是一种新型的区域级多模态理解模型,由中国科学院大学LAMP实验室的研究人员开发,旨在通过模拟人类视觉认知过程,提高区域级多模态任务的识别能力。...

CVPR现场直击|1.2万人涌入的AI顶会,华人主导的最佳论文,和彻底被“Sora”改造的CV

2024年的CVPR(计算机视觉模式识别会议)在美国西雅图召开,吸引了超过1.2万名来自全球的参与者,创下了参会人数的新高。这一年度盛会不仅展示了计算机视觉领...
1 2 3 55