标签:多模态

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

苹果公司即将举行的发布会备受期待,但更引人注目的是苹果在端侧AI领域的新进展,即Apple Intelligence。端侧AI正成为科技巨头的新战场,谷歌、苹果和OpenAI...

惊了!中国企业研发的类GPT-4o视频通话功能率先开放上线,比OpenAI还领先,但却把智谱官网错认|钛媒体AGI

智谱AI在KDD 2024大会上发布了新一代基础模型GLM-4-Plus系列,包括语言模型GLM-4-Plus、文生图模型CogView-3-Plus、图像/视频理解模型GLM-4V-Plus和视频生成...

李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享

李沐,一位在人工智能领域享有盛誉的专家,近日在上海交通大学(上交大)的演讲吸引了大量学生和教职工的热烈追捧,现场座无虚席,甚至演讲结束后学生们仍热...

微软发布Phi-3.5系列模型,性能超越Gemini 1.5 Flash与GPT-4o

微软公司在大模型领域的最新发展中取得了显著成果,宣布推出了三款全新的Phi-3.5模型,旨在加强其在多语言和多模态人工智能领域的领导地位。这些模型分别是Ph...

谷歌发布Gemini Live:对标GPT-4o,让每一个人都有贾维斯

在2024年的“Made by Google”大会上,谷歌公司发布了一款名为Gemini Live的智能语音助手。这款助手具备多模态能力,能够理解自然语言提问,识别图像、视频和语...

实时视频理解首次上端!面壁小钢炮2.6 携单图、多图、视频理解3 SOTA,全面对标 GPT-4V 最强多模态

面壁智能于8月6日推出了MiniCPM-V 2.6模型,这是一款具有8B参数的端侧多模态模型,它首次集成了实时视频理解、多图联合理解等能力。MiniCPM-V 2.6以其小尺寸...

让「GPT-4V」跑在手机上,这家中国大模型公司做到了​

面壁公司最新发布的MiniCPM-V 2.6在端侧视频理解方面取得了重大突破,成功实现了与GPT-4V相媲美的性能。MiniCPM-V 2.6首次在端侧实现了单图、多图、视频理解...

手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态

面壁小钢炮MiniCPM-V 2.6模型以其8亿参数的规模,在端侧多模态领域取得了显著的突破。该模型在单图、多图和视频理解三个方面均达到了20亿参数以下的最佳性能...

“清华系Sora”全球上线,生成一段视频需30秒,每月支付58元|钛媒体AGI

7月30日,北京生数科技有限公司联合清华大学发布了国内首个自研的AI生成视频大模型Vidu,并向全球用户开放使用。Vidu具备文生视频和图生视频两大核心功能,提...

视频生成赛道再添「猛将」,智谱清影正式上线

智谱公司在视频生成领域取得了显著进展,成为国内估值超过200亿的大模型公司中首家发布视频生成成果的团队。该公司推出的AI视频生成功能“清影”(Ying)正式上...
1 16 17 18 19 20 29