“多模态”的搜索结果
从 YC W24 看硅谷 AI 创业新趋势:AI Agent、垂直领域、多模态和 AI 安全
2024年4月4日,Y Combinator(YC)W2024批次Demo Day成功举办,共有260个项目亮相。从2.7万份申请中脱颖而出,通过率低于1%,成为历史上...
超越GPT-4V,苹果多模态大模型上新!
苹果发布了最新的多模态大语言模型(MLLM)Ferret-UI,该模型在理解和与屏幕信息交互方面表现出卓越性能,超越了GPT-4V。Ferret-UI专为...
苹果发布多模态模型 Ferret-UI,部分手机 UI 任务超越 GPT-4V
随着大模型的兴起,科技巨头和创业公司都在新一轮的技术竞赛中寻求优势。苹果公司,尽管长期处于行业领先地位,却在大模型领域显得稍有...
香港大模型公司Weitu AI首秀,打造多模态Native的技术和产品
香港的Weitu AI公司近期推出了一款具有150亿参数的多模态大模型WeituAI 1.0,该模型在多个国际权威评测榜单上取得了显著成绩,不仅超越...
【最后一天报名】Sora爆火50天,中国如何发力多模态大模型?|钛媒体AGI沙龙
美国OpenAI公司于今年2月15日发布了一款名为Sora的人工智能视频生成大模型产品,它能够根据用户输入的文字提示生成一分钟内的视频,展现...
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源
最近,多模态大模型(LMM)在视觉-语言任务上取得了显著的进展,尤其是在视觉场景下的应用。然而,将LMM应用于计算机视觉任务,特别是图...
钛媒体AGI沙龙报名|Sora爆火50天,中国如何发力多模态大模型?
Sora,美国OpenAI公司最新发布的人工智能视频生成大模型,已经在短时间内引起了广泛关注,并在社交媒体上取得了显著的成功。Sora的推出...
阿里7B多模态文档理解大模型拿下新SOTA|开源
阿里巴巴的mPLUG团队发布了最新的开源工作mPLUG-DocOwl 1.5,这是一个针对多模态文档理解的大模型,它在处理高分辨率图片文字识别、通用...
谷歌推出多模态视频模型,自动生成丰富动作视频
文章摘要 【关 键 词】 AIGC、多模态模型、VLOGGER、视频生成、技术创新 随着数字化经济的蓬勃发展,虚拟数字人的需求在各...
a16z 对话 Poe 创始人:大模型幻觉是创业公司的机会;AI 的未来是多模型、多模态
Adam D'Angelo,Meta的前CTO和Quora的CEO,目前还是OpenAI的董事会成员。他最近推出了Poe,这是一个集成了多个大型语言模型(LLMs)的聊...