标签:多模态
端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前
苹果公司即将举行的发布会备受期待,但更引人注目的是苹果在端侧AI领域的新进展,即Apple Intelligence。端侧AI正成为科技巨头的新战场,谷歌、苹果和OpenAI...
惊了!中国企业研发的类GPT-4o视频通话功能率先开放上线,比OpenAI还领先,但却把智谱官网错认|钛媒体AGI
智谱AI在KDD 2024大会上发布了新一代基础模型GLM-4-Plus系列,包括语言模型GLM-4-Plus、文生图模型CogView-3-Plus、图像/视频理解模型GLM-4V-Plus和视频生成...
李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享
李沐,一位在人工智能领域享有盛誉的专家,近日在上海交通大学(上交大)的演讲吸引了大量学生和教职工的热烈追捧,现场座无虚席,甚至演讲结束后学生们仍热...
微软发布Phi-3.5系列模型,性能超越Gemini 1.5 Flash与GPT-4o
微软公司在大模型领域的最新发展中取得了显著成果,宣布推出了三款全新的Phi-3.5模型,旨在加强其在多语言和多模态人工智能领域的领导地位。这些模型分别是Ph...
谷歌发布Gemini Live:对标GPT-4o,让每一个人都有贾维斯
在2024年的“Made by Google”大会上,谷歌公司发布了一款名为Gemini Live的智能语音助手。这款助手具备多模态能力,能够理解自然语言提问,识别图像、视频和语...
实时视频理解首次上端!面壁小钢炮2.6 携单图、多图、视频理解3 SOTA,全面对标 GPT-4V 最强多模态
面壁智能于8月6日推出了MiniCPM-V 2.6模型,这是一款具有8B参数的端侧多模态模型,它首次集成了实时视频理解、多图联合理解等能力。MiniCPM-V 2.6以其小尺寸...
让「GPT-4V」跑在手机上,这家中国大模型公司做到了
面壁公司最新发布的MiniCPM-V 2.6在端侧视频理解方面取得了重大突破,成功实现了与GPT-4V相媲美的性能。MiniCPM-V 2.6首次在端侧实现了单图、多图、视频理解...
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
面壁小钢炮MiniCPM-V 2.6模型以其8亿参数的规模,在端侧多模态领域取得了显著的突破。该模型在单图、多图和视频理解三个方面均达到了20亿参数以下的最佳性能...
“清华系Sora”全球上线,生成一段视频需30秒,每月支付58元|钛媒体AGI
7月30日,北京生数科技有限公司联合清华大学发布了国内首个自研的AI生成视频大模型Vidu,并向全球用户开放使用。Vidu具备文生视频和图生视频两大核心功能,提...
视频生成赛道再添「猛将」,智谱清影正式上线
智谱公司在视频生成领域取得了显著进展,成为国内估值超过200亿的大模型公司中首家发布视频生成成果的团队。该公司推出的AI视频生成功能“清影”(Ying)正式上...