标签:多模态交互

ChatGPT版Her能视频通话和共享屏幕了,附赠一个限时圣诞老人

OpenAI的ChatGPT推出了高级语音模式的新功能,其中包括视频对话和实时屏幕共享,以及节日特别活动“圣诞老人”音色。用户现在可以通过点击对话框中的高级语音模...

o1满血版泄露!奥数题图片推理手拿把掐,奥特曼上线剧透o2

近期,OpenAI的完整版o1模型意外泄露,允许用户直接体验其功能。泄露的模型展现出了强大的图像推理能力,能够处理上传的附件并进行多模态交互。在测试中,o1...

OpenAI董事会主席新AI Agent公司获12亿元,估值320亿

Sierra AI,由OpenAI董事会主席Bret Taylor和前谷歌AI实验室负责人Clay Bavor共同创立,已完成1.75亿美元融资,公司估值达到45亿美元。该公司专注于利用OpenA...

讯飞星火4.0 Turbo、超拟人数字人等11个首发,科大讯飞如何深入大模型国产化“无人区”

在第七届世界声博会暨2024科大讯飞全球1024开发者节上,科大讯飞董事长刘庆峰宣布了讯飞星火大模型4.0 Turbo的发布,该模型在七大核心能力上全面超越了GPT-4 ...

真把自己「当个人」的AI,扫去了我的社交贫困

快手推出的虚拟社交App“飞船”通过其超拟人策略,为用户带来了全新的社交体验。该应用中的智能体不仅能够进行文本回复,还能主动发送图像和语音消息,模拟真实...

别只盯着ChatGPT版「Her」,在多模态AI拟人互动上,国内玩家也支棱起来了

第二届多模态情感识别挑战赛(MER24)在AI顶会IJCAI2024上成功举办,旨在推动利用文本、音视频等多模态数据进行AI情感识别的技术发展和真实人机交互场景中的...

中国版GPT-4o炸场:国内首个流式多模态交互模型,现场实时且丝滑

商汤科技在世界人工智能大会上发布了国内首个流式原生多模态交互模型——日日新5.5系列中的5o。这一模型整合了文本、声音、图像和视频等多种模态,能够实现实时...

ChatGPT-4o,OpenAI的一小步,人类「AI助理」的一大步

OpenAI在5月13日的春季发布会上推出了一款名为ChatGPT-4o的新型AI产品,这款产品在多模态交互方面取得了显著进步,使得AI技术更接近于科幻电影《Her》中所描...

挑战拯救痴心“舔狗”,我和大模型都尽力了

< 机器之心编辑部报道了一款名为“拯救舔狗”的大模型原生小游戏,游戏的核心挑战是通过对话说服一个痴情的大模型放弃追求一个对他并无青睐的女神。这款游戏的...

开源模型越来越落后?Llama 3 说李总你真幽默

Llama 3 正式发布,被 Meta 宣称为迄今为止最强大的开源大模型。这一版本推出了两种规模的预训练语言模型,分别拥有 80 亿和 700 亿参数,以支持更广泛的应用...