“多模态”的搜索结果

a16z 发布 AI 语音 Agent 图谱:重塑通话的时机到了
AI语音助手的机遇: - AI语音助手通过重新定义电话,为企业节省成本,降低风险,为消费者提供低成本服务。 - 成功的语音助手需要关...
视觉错觉也能识别?被忽略的 Gemini 1.5 Flash 有哪些神奇表现?|AI 鲜测
在2024年的谷歌I/O大会上,推出了名为Gemini 1.5 Flash的AI模型,该模型以其轻量级、高效率和强大的多模态处理能力著称,能够同时处理文...
OpenAI与普华永道合作,为10万员工提供ChatGPT
全球四大会计事务所之一的普华永道近日宣布与OpenAI达成技术、市场双向合作,成为其最大客户和首家产品经销商。此次合作内容主要包括向...
大模型的 5 月:热闹的 30 天和鸿沟边缘
根据文章内容,以下是详细的分段摘要总结:技术进步放缓近期,大模型行业似乎出现了技术进步放缓的现象。OpenAI新发布的GPT-4o在文本处...
独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元
杨红霞,一位在AI领域享有盛誉的技术专家,近期从字节跳动离职,投身AI创业。她的新项目并未追随传统的“大”模型路线,而是转向端侧模型...
半年涨粉1000万!揭秘快意大模型在短视频互动场景中的大规模应用实践
在QCon北京2024大会上,快手大模型与多媒体技术部智能交互团队负责人刘澈分享了快意大模型在短视频互动场景的应用探索。快手推出了自研...
基于扩散模型的,开源世界模型DIAMOND
研究人员联合开源了一款名为DIAMOND的世界模型,基于扩散模型,用于智能体训练、世界建模及多模态分布建模等强化学习应用。选择扩散模型...
清华、华为等提出iVideoGPT:专攻交互式世界模型
近年来,生成模型在视频生成领域取得了显著进展,尤其在无监督方式学习以构建预测世界模型方面。这些模型能积累关于世界如何运作的常识...
最难方言温州话被攻克!中国电信语音大模型支持30种方言,这题GPT-4o可不会做啊
中国电信人工智能研究院发布了一款能够识别和理解多达30种方言的语音大模型——“星辰语音大模型”。这一模型的核心功能主要体现在语音识别...
AI智能体的炒作与现实:GPT-4都撑不起,现实任务成功率不到15%
尽管大型语言模型(LLM)在性能、准确度和稳定性方面取得了显著进步,但在现实世界中的应用,特别是作为AI智能体,仍面临重大挑战。AI智...
1 46 47 48 49 50 85