标签:多模态交互

真把自己「当个人」的AI,扫去了我的社交贫困

快手推出的虚拟社交App“飞船”通过其超拟人策略,为用户带来了全新的社交体验。该应用中的智能体不仅能够进行文本回复,还能主动发送图像和语音消息,模拟真实...

别只盯着ChatGPT版「Her」,在多模态AI拟人互动上,国内玩家也支棱起来了

第二届多模态情感识别挑战赛(MER24)在AI顶会IJCAI2024上成功举办,旨在推动利用文本、音视频等多模态数据进行AI情感识别的技术发展和真实人机交互场景中的...

中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑

商汤科技在世界人工智能大会上发布了国内首个流式原生多模态交互模型——日日新5.5系列中的5o。这一模型整合了文本、声音、图像和视频等多种模态,能够实现实时...

ChatGPT-4o,OpenAI的一小步,人类「AI助理」的一大步

OpenAI在5月13日的春季发布会上推出了一款名为ChatGPT-4o的新型AI产品,这款产品在多模态交互方面取得了显著进步,使得AI技术更接近于科幻电影《Her》中所描...

挑战拯救痴心“舔狗”,我和大模型都尽力了

< 机器之心编辑部报道了一款名为“拯救舔狗”的大模型原生小游戏,游戏的核心挑战是通过对话说服一个痴情的大模型放弃追求一个对他并无青睐的女神。这款游戏的...

开源模型越来越落后?Llama 3 说李总你真幽默

Llama 3 正式发布,被 Meta 宣称为迄今为止最强大的开源大模型。这一版本推出了两种规模的预训练语言模型,分别拥有 80 亿和 700 亿参数,以支持更广泛的应用...