“多模态”的搜索结果

谷歌最新发布Med-Gemini多模态医学大模型,科研与临床诊疗落地的鸿沟
Med-Gemini是基于Gemini 1.0和1.5模型的进一步发展,它在10项基准测试中取得了最先进的性能。研究人员使用了自我训练与网络搜索集成、多...
智子引擎发布多模态大模型 Awaker:MOE、自主更新、写真视频效果优于 Sora
这个模型采用了MOE架构,并具备了业界首个「真正」自主更新的能力。其性能在写真视频生成上超过了Sora模型,有望解决大模型在实际应用中...
全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT
智子引擎公司在中关村论坛通用人工智能平行论坛上发布了全新的多模态大模型Awaker 1.0,标志着向通用人工智能(AGI)迈出了重要一步。Aw...
人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora
在4月27日的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎发布了全新的多模态大模型Awaker 1.0,标志着向通用人工智能(AG...
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
元象公司发布了一款名为XVERSE-V的多模态大模型,该模型支持任意宽高比的图像输入,并在多项权威多模态评测中取得了领先效果。XVERSE-V...
Meta 眼镜支持多模态 Llama 3,实时翻译、物体识别,AI 眼镜的机会来了!
Meta官方宣布,其智能眼镜产品现已支持多模态版的Llama 3,这一功能在开源版本中尚未实现。这款眼镜具备音乐播放、语言翻译、发送语音信...
性能超越GPT-4 Turbo!6000亿商汤多模态大模型登场,35万元一体机能自动生成代码|钛媒体AGI
商汤科技近日发布了“日日新SenseNova”5.0多模态大模型系列,这一系列模型采用了混合专家(MoE)架构,并支持高达10T Tokens的中英文训练...
对话联想创投宋春雨:相信万亿参数、多模态是通往 AGI 的最佳路径
AI投资与技术创新访谈本文是一篇关于人工智能(AI)领域投资和技术创新的深度访谈,主要访谈对象是联想创投的合伙人宋春雨。宋春雨是一...
轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便
这篇文章介绍了上海AI Lab和香港中文大学等研究机构提出的InternLM-XComposer2-4KHD(IXC2-4KHD)模型,这是一个可以自动分析PDF、网页...
荐书丨中山大学 HCP 实验室专著《多模态大模型》重磅发布
这篇文章介绍了新一代人工智能技术的发展趋势和重要性,以及围绕多模态大模型的相关内容。2023年,人工智能技术如大语言模型、AIGC、世...
1 3 4 5 6 7 73