实时交互 | 学习AIGC

三星国行 Bixby 更新“语聊视界”，我们的生活离《Her》更近了一步？

三星 Galaxy S25 系列国行版本的 Bixby 语音助手于 3 月 26 日正式推出了“语聊视界”功能，这一功能基于多模态大模型，旨在提供超拟人的实时语音和视频聊天体...

AIGC动态

6个月前

面壁、智谱，卷上新赛道

OpenAI去年推出的“4o”模型具备实时语音交互能力，被视为模型“长出了耳朵和嘴巴”。去年12月，该模型增加了视频通话和屏幕共享功能，相当于“长出了眼睛”，使得...

AI-Agent

8个月前

Gemini 2.0发布了，可惜的是关注的人很少

谷歌近日宣布推出其人工智能大模型系列的最新作品——Gemini 2.0，其中Gemini 2.0 Flash实验版本率先亮相。这款模型能够生成文本、图像和语音，并处理多种格式...

AIGC动态

9个月前

WebRTC创建者加入了OpenAI，他如何思考语音AI的未来？

WebRTC的联合创始人Justin Uberti，同时也是Fixie.ai的联合创始人兼CTO，宣布加入OpenAI领导实时AI项目。Uberti在Google时期参与创建并领导了WebRTC项目，并...

AI-Agent

9个月前

工作坊报名｜使用 TEN Framework 与 Azure，探索你的多模态交互新场景

GPT-4o Realtime API的发布标志着语音AI领域的新突破，带来了实时音频交互、自然语音生成、多语言能力和快速响应时间等创新特性。这些技术进步为全球企业在客...

AI-Agent

10个月前

在RTE2024，窥见实时AGI的未来

AI技术的进步正在改变人机交互的方式，特别是在实时交互（RTE）领域。OpenAI的GPT-4o模型通过Realtime API为开发者提供了低延迟、自然流畅的对话能力，使得智...

AIGC动态

11个月前

谷歌展示首个大模型实时游戏模拟引擎，重塑游戏开发流程

谷歌研究人员利用开源扩散模型Stable Diffusion 1.4开发了实时游戏模拟引擎GameNGen，该引擎能在单个TPU上以超过20帧每秒的速度交互式模拟经典射击游戏《DOOM...

AIGC动态

11个月前

成本降低98%！OpenAI开发者大会4大新功能，处理量爆增50倍！

在最近于美国旧金山举行的第二届开发者大会上，OpenAI推出了四项新的API功能，旨在简化模型调用、微调和蒸馏流程，实现高效开发。这些新功能包括实时API、视...

AIGC动态

11个月前

完蛋，我被数字同事包围了！小冰AI数字员工再升级，零样本定制，即时上岗

小冰公司最新推出了一项名为“零样本”数字人（Zero-shot Xiaoice Neural Rendering，Zero-XNR）的技术创新，该技术基于超千亿大模型基座，能够实现数字人的极...

AI-Agent

1年前 (2024)

商汤大模型的「5o」交互，普通人如何和 AI 过一天？

在2024年世界人工智能大会上，商汤科技推出了国内首个'流式交互'多模态大模型——'日日新5o'，标志着AI 2.0时代超级时刻和应用的爆发。该模型具备实时视觉能力...

AIGC动态

1年前 (2024)

标签：实时交互

三星国行 Bixby 更新“语聊视界”，我们的生活离《Her》更近了一步？

面壁、智谱，卷上新赛道

Gemini 2.0发布了，可惜的是关注的人很少

WebRTC创建者加入了OpenAI，他如何思考语音AI的未来？

工作坊报名｜使用 TEN Framework 与 Azure，探索你的多模态交互新场景

在RTE2024，窥见实时AGI的未来

谷歌展示首个大模型实时游戏模拟引擎，重塑游戏开发流程

成本降低98%！OpenAI开发者大会4大新功能，处理量爆增50倍！

完蛋，我被数字同事包围了！小冰AI数字员工再升级，零样本定制，即时上岗

商汤大模型的「5o」交互，普通人如何和 AI 过一天？

热门网址

标签：实时交互

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址