视频生成

视频,video

ElevenLabs举办了一场全球黑客松,这些AI Voice产品得奖了

ElevenLabs举办的全球Hackathon活动吸引了来自世界各地的数百名开发者,共同打造了超过300个AI Agent。活动展示了语音AI技术的广泛应用,涵盖了从通信协议到...

亚马逊开源5级通用AI Agent:自动查询航班、天气,超4000颗星

亚马逊云(AWS)近期开源了名为Multi-Agent Orchestrator的5级通用AI Agent框架,旨在通过多层级AI Agent处理复杂任务,并确保交互过程中的上下文一致性和连...

英伟达团队发布最新具身模型 Cosmos-Reason1,在物理世界推理中碾压 Qwen、GPT-4o 等多个 VLM 模型

英伟达团队在GTC大会上发布了新的物理世界大模型Cosmos-Reason1,该模型专注于提升AI系统与物理世界交互的推理能力。作为Cosmos系列的一部分,Cosmos-Reason1...

视频可以精准控制了!一句话给熊戴眼镜的那种,扩散模型立功,浙大悉尼科技大学出品 | ICLR 2025

随着视频生成技术的快速发展,视频编辑作为其中的一个重要方向,逐渐成为研究热点。然而,传统的视频编辑方法通常局限于风格转换或单一目标的编辑,难以满足...

前字节跳动AI技术专家加盟千寻智能,出任具身智能部负责人

前字节跳动AI技术专家解浚源近日宣布加入具身智能创业公司千寻智能,并担任具身智能部负责人,全面负责具身大模型的研发工作。解浚源拥有丰富的AI领域经验,...

OpenAI语音智能体诞生,怼脸实拍语气狂到飞起!API降到每分钟0.3美分

OpenAI最新发布的音频模型标志着语音智能体时代的正式开启。此次发布的三款模型——gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts,分别专注于...

独家 | 前 TikTok 算法负责人陈志杰创立新公司「言创万物」,聚焦 AI Coding

陈志杰,前TikTok算法负责人,离职后创立了新公司“言创万物”,专注于AI Coding领域。该公司由陈志杰和原百度电商研发负责人刘晓春共同创立,陈志杰持股52.5%...

华为的新折叠屏 Pura X,可能是第一代 AI 原生手机

华为在3月20日的发布会上推出了全新的折叠屏手机Pura X,这款手机以其独特的屏幕设计和创新的功能成为焦点。Pura X采用了16:10比例的6.3英寸内屏和3.5英寸正...

波士顿动力真「翻」不过宇树、众擎!一觉醒来,全世界的机器人都在侧空翻

宇树机器人发布了一段视频,首次展示了人形机器人完成侧空翻的动作,引发了广泛关注。不到12小时后,波士顿动力也发布了一段视频,展示了其Atlas机器人不仅完...

被谷歌点名感谢!杭州六小龙开源黑科技,让机器人瞬间「悟透」3D世界

群核科技近期开源了空间理解模型SpatialLM,该模型通过视频理解物理世界的几何关系,并将其转化为机器能读懂的指令,相当于教会机器用人类直觉感知世界。Spat...
1 2 3 4 5 6 165