标签:多模态

全新GPT-4o mini发布!大模型杀疯了!

OpenAI近期发布了GPT-4o,这是继GPT-4之后的新一代多模态AI模型,标志着人工智能技术的又一次重大进步。这一发展强调了掌握大模型、多模态、LangChain、Fine-...

商汤生成式AI收入超10亿元,同比增长256%

商汤科技集团在2024年上半年的财报中显示,公司总营收达到17.4亿人民币,同比增长21.4%。其中,生成式AI业务收入显著增长,达到10.5亿元,同比增长256%,占总...

端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前

苹果公司即将举行的发布会备受期待,但更引人注目的是苹果在端侧AI领域的新进展,即Apple Intelligence。端侧AI正成为科技巨头的新战场,谷歌、苹果和OpenAI...

惊了!中国企业研发的类GPT-4o视频通话功能率先开放上线,比OpenAI还领先,但却把智谱官网错认|钛媒体AGI

智谱AI在KDD 2024大会上发布了新一代基础模型GLM-4-Plus系列,包括语言模型GLM-4-Plus、文生图模型CogView-3-Plus、图像/视频理解模型GLM-4V-Plus和视频生成...

李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享

李沐,一位在人工智能领域享有盛誉的专家,近日在上海交通大学(上交大)的演讲吸引了大量学生和教职工的热烈追捧,现场座无虚席,甚至演讲结束后学生们仍热...

微软发布Phi-3.5系列模型,性能超越Gemini 1.5 Flash与GPT-4o

微软公司在大模型领域的最新发展中取得了显著成果,宣布推出了三款全新的Phi-3.5模型,旨在加强其在多语言和多模态人工智能领域的领导地位。这些模型分别是Ph...

谷歌发布Gemini Live:对标GPT-4o,让每一个人都有贾维斯

在2024年的“Made by Google”大会上,谷歌公司发布了一款名为Gemini Live的智能语音助手。这款助手具备多模态能力,能够理解自然语言提问,识别图像、视频和语...

实时视频理解首次上端!面壁小钢炮2.6 携单图、多图、视频理解3 SOTA,全面对标 GPT-4V 最强多模态

面壁智能于8月6日推出了MiniCPM-V 2.6模型,这是一款具有8B参数的端侧多模态模型,它首次集成了实时视频理解、多图联合理解等能力。MiniCPM-V 2.6以其小尺寸...

让「GPT-4V」跑在手机上,这家中国大模型公司做到了​

面壁公司最新发布的MiniCPM-V 2.6在端侧视频理解方面取得了重大突破,成功实现了与GPT-4V相媲美的性能。MiniCPM-V 2.6首次在端侧实现了单图、多图、视频理解...

手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态

面壁小钢炮MiniCPM-V 2.6模型以其8亿参数的规模,在端侧多模态领域取得了显著的突破。该模型在单图、多图和视频理解三个方面均达到了20亿参数以下的最佳性能...
1 4 5 6 7 8 17