标签:实时交互

在RTE2024,窥见实时AGI的未来

AI技术的进步正在改变人机交互的方式,特别是在实时交互(RTE)领域。OpenAI的GPT-4o模型通过Realtime API为开发者提供了低延迟、自然流畅的对话能力,使得智...

谷歌展示首个大模型实时游戏模拟引擎,重塑游戏开发流程

谷歌研究人员利用开源扩散模型Stable Diffusion 1.4开发了实时游戏模拟引擎GameNGen,该引擎能在单个TPU上以超过20帧每秒的速度交互式模拟经典射击游戏《DOOM...

成本降低98%!OpenAI开发者大会4大新功能,处理量爆增50倍!

在最近于美国旧金山举行的第二届开发者大会上,OpenAI推出了四项新的API功能,旨在简化模型调用、微调和蒸馏流程,实现高效开发。这些新功能包括实时API、视...

完蛋,我被数字同事包围了!小冰AI数字员工再升级,零样本定制,即时上岗

小冰公司最新推出了一项名为“零样本”数字人(Zero-shot Xiaoice Neural Rendering,Zero-XNR)的技术创新,该技术基于超千亿大模型基座,能够实现数字人的极...

商汤大模型的「5o」交互,普通人如何和 AI 过一天?

在2024年世界人工智能大会上,商汤科技推出了国内首个'流式交互'多模态大模型——'日日新5o',标志着AI 2.0时代超级时刻和应用的爆发。该模型具备实时视觉能力...

通用世界模型问世:不学习就能生成新领域视频,可实时控制

在人工智能领域,世界模型作为一种通过预测未来来理解数字和物理世界的方式,被视为实现通用人工智能(AGI)的关键路径之一。最新的研究进展中,Pandora模型...

视觉语音交互毫无延迟,都成精了居然还不是GPT-5?

OpenAI于2024年5月14日举行了一场名为“春季功能更新”的发布会,推出了新的人工智能模型GPT-4o。这个模型虽然不是GPT-5,但其展示的功能已经令人印象深刻。Ope...

AI程序员Devin卧底工作群修bug!和CTO聊技术,网友:顶级码农水平

Devin是首个AI程序员,出现在明星创业公司内部群中。在解决技术问题时,Devin借用其创造者的账号与客户公司的CTO进行交流,并根据回复调整了代码方案。这一过...