图像生成

专访上海大学方昱春教授：数据驱动的手语识别研究，如何破解数据之困？｜GAIR live

本文主要讲述了上海大学的方昱春教授如何将计算机视觉技术与手语研究相融合，开辟出一片新的研究天地。方教授的研究重点在于利用计算机视觉技术（CV）探索手...

AIGC动态

10个月前

AIGC动态

10个月前

DeepMind最近推出了一款名为SIMA（Scalable Instructable Multiworld Agent）的通用游戏AI智能体，它能够理解和执行自然语言指令，并在多个3D虚拟世界中自如...

AI-Agent

10个月前

这篇文章介绍了腾讯混元、清华大学和香港科技大学联合推出的新图像到视频生成模型Follow-Your-Click。这个模型可以通过点击图片中的特定区域并输入简短提示词...

AIGC动态

10个月前

这篇文章介绍了MIT新晋副教授何恺明与刘壮合作完成的研究，针对AI发展中长期存在的数据集偏差问题展开探讨。过去十多年来，尽管业界努力构建更大、更多样化、...

AIGC动态

10个月前

苹果公司近日在人工智能领域迈出重要一步，公布了自家的多模态大模型MM1。这一模型拥有高达300亿的参数规模，在预训练指标中实现SOTA，并具备密集模型和混合...

AIGC动态

10个月前

是由华为诺亚方舟实验室、大连理工大学和香港大学的研究人员推出的一款文本生成4K超高清图像的模型。与上一代PixArt-α相比，在图像质量、细节、训练效率以及...

AIGC动态

10个月前

这篇文章介绍了苹果公司在多模态大模型（MLLMs）领域的研究成果，通过一篇名为《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》的研...

AIGC动态

10个月前

以下是根据文章内容撰写的详细、分段的摘要总结，其中重点词语和句子已使用HTML标签进行加粗显示：一、引言1. 从CES、MWC到AWE 2024，科技行业精彩不断。2. A...

AIGC动态

10个月前

OpenAI的首席技术官Mira Murati在最近的一次采访中透露了更多关于其新推出的文生视频工具Sora的细节。采访主要围绕以下几个方面展开:Sora的工作原理。作为一...

AIGC动态

10个月前