标签:多模态

Vidu直逼Sora,生数科技:还说“中国sora”就太没想象力了【内附Vidu逐帧拆解】

在2024年4月27日的中关村论坛上,生数科技与清华大学联合发布了中国首个长时长、高一致性、高动态性的视频大模型——Vidu。Vidu能够一键生成16秒、1080P分辨率...

商汤发布“日日新SenseNova 5.0”大模型,性能对标GPT-4 Turbo

文章介绍了商汤科技在AIGC领域的最新动态。商汤科技在多地举办技术交流日活动,发布了行业首个“云、端、边”全栈大模型产品矩阵,其中包括了全新发布的“日日新...

端侧模型 OctopusV3 发布:手机上的超级助理,性能媲美 GPT-4V 和 GPT-4 的组合?

随着人工智能技术的不断进步,我们见证了许多创新的AI模型的诞生。最近,Nexa AI团队推出了一款名为OctopusV3的端侧模型,这款模型被设计为一款手机上的超级...

GPT-4现场被端侧小模型“暴打”,商汤日日新5.0:全面对标GPT-4 Turbo

SenseChat Lite:轻量级端侧大模型1. 性能对比:在《街头霸王》游戏中,SenseChat Lite与GPT-4进行了一场PK,展示了其快速反应能力。尽管GPT-4还在决策中,Se...

性能超越GPT-4 Turbo!6000亿商汤多模态大模型登场,35万元一体机能自动生成代码|钛媒体AGI

商汤科技近日发布了“日日新SenseNova”5.0多模态大模型系列,这一系列模型采用了混合专家(MoE)架构,并支持高达10T Tokens的中英文训练数据。这一技术升级使...

轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便

这篇文章介绍了上海AI Lab和香港中文大学等研究机构提出的InternLM-XComposer2-4KHD(IXC2-4KHD)模型,这是一个可以自动分析PDF、网页、海报、Excel图表内容...

突发!Stable Diffusion 3,可通过API使用啦

4月18日,Stability.ai宣布其最新文生图模型Stable Diffusion 3(SD3)和SD3 Turbo已经可以在API中使用,由知名API管理平台Fireworks AI提供服务。相比前两代...

梗图理解“天花板”!港中文终身教授贾佳亚团队推出多模态模型:GPT-4+DALL-E 3,王炸组合刷爆榜单

近日,港中文终身教授贾佳亚团队推出了一款名为 Mini-Gemini 的多模态模型,包括 2B 小杯到 34B 的超大杯,一经发布便登上了 PaperWithCode 热榜。Mini-Gemin...

DeepMind前员工创立的AI公司发布新模型,能理解音频与视频,推理性能超过Gemini

Reka是一家总部位于旧金山的AI初创公司,由来自DeepMind、Google和Meta的研究人员联合创立,最近推出了一款名为Reka Core的全新多模态语言模型。这款模型被誉...

贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!读懂梗图刷爆榜单,代码复现数学函数

这篇文章介绍了贾佳亚团队提出的超强视觉语言模型Mini-Gemini,该模型在多模态任务中表现出色,被称为开源社区版的GPT-4+DALL-E组合。Mini-Gemini提供了2B小...
1 22 23 24 25 26 31