多模态 | 第 10 页

OpenAI语音智能体诞生，怼脸实拍语气狂到飞起！API降到每分钟0.3美分

OpenAI最新发布的音频模型标志着语音智能体时代的正式开启。此次发布的三款模型——gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts，分别专注于...

AIGC动态

5个月前

英伟达开源通用机器人大模型—GR00T N1

全球AI领导者英伟达在“GTC 2025”开发者大会上宣布开源人形机器人通用大模型GR00T N1，该模型能够处理多模态数据，包括语言、图像和视频，适用于家务、工厂等...

AIGC动态

5个月前

240元打造擅长数学的多模态版R1，基于DeepSeek核心思想，两阶段训练提升推理能力至工业级应用标准

多模态大模型在视觉理解方面表现出色，但在深度数学推理任务上往往表现不佳，尤其是参数量较小的模型。为了解决这一问题，东南大学、香港中文大学、蚂蚁集团...

AIGC动态

5个月前

多模态也做到了强推理！工业界首个开源的R1V，让视觉思考进入o1时代

昆仑万维近期发布了Skywork R1V系列模型，这一多模态思维链推理模型在视觉推理和通用推理能力上达到了SOTA级别，成为国内首家开源多模态思维链推理模型的企业...

AIGC动态

5个月前

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

法国AI创企Mistral AI最近开源了一款名为Mistral Small 3.1的多模态小模型，该模型在多个基准测试中表现优异，超越了Gemma 3和GPT-4o Mini等同类模型。Mistra...

AIGC动态

5个月前

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

昆仑万维近日发布了全球首个开源的多模态推理大模型Skywork R1V（简称R1V），该模型拥有38B参数，性能直逼DeepSeek-R1，并在多项基准测试中取得了领先的成绩...

AIGC动态

5个月前

招生信息 | 人大信院 AIM3 实验室招收人工智能方向学生！

AIM3实验室隶属于中国人民大学信息学院计算机系的感知与交互智能计算研究室，专注于多模态智能计算领域的研究。实验室当前的研究方向包括大语言模型、多模态...

AIGC动态

5个月前

一手实测文心X1/4.5：又强又全面！歪果网友疯求英文版

百度在文心一言两周年之际，推出了两款新模型——文心大模型4.5和文心大模型X1，并宣布免费向用户开放。这一消息迅速在海外社交媒体上引发热议，尤其是关于是否...

AIGC动态

5个月前

免费使用！百度重磅发布文心4.5、X1，视频解读+深度思考

百度近日发布了两款大模型——文心4.5和X1，均已上线并免费向用户开放。文心4.5是一款多模态模型，能够对文字、图片、视频、音频等多种内容进行综合解读，其能...

AIGC动态

6个月前

海外热议！百度双模型免费上线，实测可帮没看“3.15”的打工人避雷

百度在3月16日发布了文心大模型X1和文心大模型4.5，标志着其在人工智能领域的进一步突破。文心大模型X1不仅具备深度思考能力，还能自主调用多种工具，展现出...

AIGC动态

6个月前

标签：多模态

OpenAI语音智能体诞生，怼脸实拍语气狂到飞起！API降到每分钟0.3美分

英伟达开源通用机器人大模型—GR00T N1

240元打造擅长数学的多模态版R1，基于DeepSeek核心思想，两阶段训练提升推理能力至工业级应用标准

多模态也做到了强推理！工业界首个开源的R1V，让视觉思考进入o1时代

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

招生信息 | 人大信院 AIM3 实验室招收人工智能方向学生！

一手实测文心X1/4.5：又强又全面！歪果网友疯求英文版

免费使用！百度重磅发布文心4.5、X1，视频解读+深度思考

海外热议！百度双模型免费上线，实测可帮没看“3.15”的打工人避雷

热门网址

标签：多模态

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址