“多模态”的搜索结果

清华团队国产“Sora”火了!画面效果对标OpenAI,长度可达16秒,还能读懂物理规律
Vidu模型的发布:「Vidu」能够一键生成长达16秒、分辨率达1080p的高清视频内容,其画面效果非常接近Sora,表现出色在多镜头语言、时间和...
当前最强国产Sora!清华团队突破16秒长视频,懂多镜头语言,会模拟物理规律
本文介绍了由生数科技联合清华大学最新发布的视频大模型「Vidu」,该模型在视频生成领域取得了显著的技术突破。以下是对文章内容的详细...
抖音追不上Sora
在AI文生视频领域,抖音旗下的剪映正面临来自OpenAI的Sora的激烈竞争。Adobe公司宣布将在其视频编辑软件Premiere Pro的新版本中集成包括...
字节发布视觉基础模型ViTamin,多项任务实现SOTA,入选CVPR2024
文章介绍了字节跳动提出的新基础模型ViTamin,专为视觉语言时代设计。ViTamin在ImageNet零样本准确率上比ViT提高了2.0%,在多个基准任务...
前鹅厂实验室1号员工,要让十亿人用上家务机器人!颠锅书法街舞震惊网友
新智元报道了国产全自研新一代AI机器人Astribot S1的诞生,这款机器人在操作力上足以媲美人类,并已接入LLM测试,预计今年完成商业化。A...
西安交大发表鲁棒视觉问答综述,揭秘AI视觉问答的“超强大脑”丨IEEE TPAMI
该论文在人工智能顶级期刊IEEE TPAMI上发表,对鲁棒视觉问答方法与测评数据集进行了深入探讨与梳理,并对该方向未来的研究重点进行了凝...
商汤发布“日日新SenseNova 5.0”大模型,性能对标GPT-4 Turbo
文章介绍了商汤科技在AIGC领域的最新动态。商汤科技在多地举办技术交流日活动,发布了行业首个“云、端、边”全栈大模型产品矩阵,其中包...
端侧模型 OctopusV3 发布:手机上的超级助理,性能媲美 GPT-4V 和 GPT-4 的组合?
随着人工智能技术的不断进步,我们见证了许多创新的AI模型的诞生。最近,Nexa AI团队推出了一款名为OctopusV3的端侧模型,这款模型被设...
马斯克AI公司或将完成60亿美元融资,投前估值1300亿;其宿敌扬言GPT-5将更强大|钛媒体AGI
在最近的报道中,Elon Musk 领导的初创公司 xAI 正在进行一轮新的融资,金额高达60亿美元,投资方包括知名的红杉资本等。这轮融资预计将...
商汤CVPR「最佳论文」上车!数千行代码实现端到端智驾,“留给传统自动驾驶公司时间不多了”
在2024年北京车展期间,商汤科技联合创始人兼首席科学家王晓刚提出了关于自动驾驶技术演进的新观点。他认为,随着AI技术的不断发展,传...
1 55 56 57 58 59 85