“多模态”的搜索结果

国产「小钢炮」一夜干翻巨无霸GPT-4V、Gemini Pro!稳坐端侧多模态铁王座
在人工智能领域,一款仅用8B参数的端侧多模态模型引发了广泛关注。这款名为MiniCPM-Llama3-V 2.5的模型,以其卓越的性能击败了多模态巨...
国产端侧小模型超越 GPT-4V,「多模态」能力飞升
在近日的机器人学术会议ICRA 2024上,具身智能成为了热议话题,其中具身智能的应用,特别是AI大模型在消费级机器人领域的应用,引发了一...
GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
在OpenAI发布GPT-4o后,外界评价从最初失望迅速转变为惊艳。在多项基准测试中,GPT-4o展现出了SOTA(当前最佳)的实力。在LMSys聊天机器...
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
Chameleon模型挑战了OpenAI的GPT-4o,成为首个敢于与之一较高下的新模型。Chameleon采用统一的Transformer架构,能够在单一神经网络中无...
一线创业者圆桌讨论:多模态 AI 的创业机会在于「有用」
产品人的AI观点:1. 用户在使用AI图像/视频生成产品时,更关注可控性和成本。专业用户倾向于使用SD WebUI/ComfyUI工作流,而普通用户则...
CVPR 2024|多模态场景感知,小红书高保真人体运动预测方法来了!
< strong >SIF3D(Sense-Informed Forecasting of 3D human motion)是一种由小红书创作发布团队提出的先进场景感知运动预测技术,已被...
谷歌最新发布Med-Gemini多模态医学大模型,科研与临床诊疗落地的鸿沟
Med-Gemini是基于Gemini 1.0和1.5模型的进一步发展,它在10项基准测试中取得了最先进的性能。研究人员使用了自我训练与网络搜索集成、多...
智子引擎发布多模态大模型 Awaker:MOE、自主更新、写真视频效果优于 Sora
这个模型采用了MOE架构,并具备了业界首个「真正」自主更新的能力。其性能在写真视频生成上超过了Sora模型,有望解决大模型在实际应用中...
全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT
智子引擎公司在中关村论坛通用人工智能平行论坛上发布了全新的多模态大模型Awaker 1.0,标志着向通用人工智能(AGI)迈出了重要一步。Aw...
人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora
在4月27日的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎发布了全新的多模态大模型Awaker 1.0,标志着向通用人工智能(AG...
1 4 5 6 7 8 84