“多模态”的搜索结果

Vidu模型的发布：「Vidu」能够一键生成长达16秒、分辨率达1080p的高清视频内容，其画面效果非常接近Sora，表现出色在多镜头语言、时间和...

AIGC动态

7个月前

本文介绍了由生数科技联合清华大学最新发布的视频大模型「Vidu」，该模型在视频生成领域取得了显著的技术突破。以下是对文章内容的详细...

AIGC动态

7个月前

抖音追不上Sora

在AI文生视频领域，抖音旗下的剪映正面临来自OpenAI的Sora的激烈竞争。Adobe公司宣布将在其视频编辑软件Premiere Pro的新版本中集成包括...

AIGC动态

7个月前

文章介绍了字节跳动提出的新基础模型ViTamin，专为视觉语言时代设计。ViTamin在ImageNet零样本准确率上比ViT提高了2.0%，在多个基准任务...

AIGC动态

7个月前

新智元报道了国产全自研新一代AI机器人Astribot S1的诞生，这款机器人在操作力上足以媲美人类，并已接入LLM测试，预计今年完成商业化。A...

AIGC动态

7个月前

该论文在人工智能顶级期刊IEEE TPAMI上发表，对鲁棒视觉问答方法与测评数据集进行了深入探讨与梳理，并对该方向未来的研究重点进行了凝...

AIGC动态

7个月前

文章介绍了商汤科技在AIGC领域的最新动态。商汤科技在多地举办技术交流日活动，发布了行业首个“云、端、边”全栈大模型产品矩阵，其中包...

AIGC动态

7个月前

随着人工智能技术的不断进步，我们见证了许多创新的AI模型的诞生。最近，Nexa AI团队推出了一款名为OctopusV3的端侧模型，这款模型被设...

AIGC动态

7个月前

在最近的报道中，Elon Musk 领导的初创公司 xAI 正在进行一轮新的融资，金额高达60亿美元，投资方包括知名的红杉资本等。这轮融资预计将...

AIGC动态

7个月前

在2024年北京车展期间，商汤科技联合创始人兼首席科学家王晓刚提出了关于自动驾驶技术演进的新观点。他认为，随着AI技术的不断发展，传...

AIGC动态

7个月前