标签:多模态处理

钛媒体AGI独家|大模型独角兽MiniMax将于11月发布首款对标GPT-4o的端到端实时语音对话API产品

AI大模型领域的独角兽MiniMax计划于11月推出一款Realtime API服务,旨在提升端到端实时多模态处理能力,提供更低延时、更自然、更沉浸的实时语音对话体验。这...

视觉错觉也能识别?被忽略的 Gemini 1.5 Flash 有哪些神奇表现?|AI 鲜测

在2024年的谷歌I/O大会上,推出了名为Gemini 1.5 Flash的AI模型,该模型以其轻量级、高效率和强大的多模态处理能力著称,能够同时处理文本、图像、音频和视频...