视频生成

视频,video

OpenAI发布Voice Engine,15秒克隆任何语音,霉霉说中文就靠它

OpenAI近期发布了一个新的语音合成模型Voice Engine,这个模型仅需文本输入和一个15秒的音频样本,就能生成与原始说话者声音极其相似的自然语音。这项技术最...

Suno证明了当Rapper是真没门槛|AI 鲜测

随着人工智能技术的发展,音乐创作领域也迎来了革命性的变化。对于普通人而言,传统的音乐创作过程包括作词、作曲、编曲和录制等多个环节,这不仅需要丰富的...

恐怖谷!哥大华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真

哥伦比亚大学华人团队近期开发了一款名为Emo的机器人,这款机器人具备了预测和模拟人类表情的能力,甚至能够在人微笑前840毫秒进行预测并同步微笑,从而实现...

CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

北京大学的研究团队针对基于视频的三维人体姿态估计领域中Video Pose Transformer(VPT)的高计算成本问题,提出了一种新的高效三维人体姿态估计框架——沙漏To...

统一角色、百变场景,视频生成神器PixVerse被网友玩出了花,超强一致性成「杀招」

  文章摘要 【关 键 词】 AI换背景、视频生成、角色一致性、PixVerse、AIGC工具 机器之心最近报道了一个新的AI生成工具PixVerse的更新,该工具推出...

文本直接生成2分钟视频,即将开源模型StreamingT2V

  文章摘要 【关 键 词】 AIGC、大语言模型、视频生成、技术创新、StreamingT2V 近年来,人工智能生成内容(AIGC)领域取得了显著进展,特别是在大...

全日程发布|Sora之后的视频生成技术与应用

  文章摘要 【关 键 词】 Sora、视频生成、AI技术、技术论坛、机器之心 机器之心近期策划了一场名为「视频生成技术与应用 — Sora 时代」的技术论坛...

今年 Q1 “神仙打架”:Sora惊艳、马斯克“找茬”,微软谷歌接连翻车 |文末好礼

2024年第一季度人工智能领域重大事件摘要以下是2024年第一季度人工智能领域发生的一系列重大事件的摘要总结:GPT Store上线:1月11日,OpenAI推出了基于GPT-4...

微软、OpenAI投资1000亿美元,打造“Stargate”超级计算机

随着人工智能技术的飞速发展,AIGC(人工智能生成内容)领域的专业社区对大型语言模型(LLM)如微软 & OpenAI、百度文心一言、讯飞星火等的发展和应用落地给...

OpenAI藏了1年多的技术正式公开!15秒素材克隆声音,HeyGen也在用

OpenAI最近正式揭幕了一款新的语音合成引擎Voice Engine,这项技术令人瞩目的特点在于,它能够仅凭15秒的语音样本克隆出一个人的声音,并且能够跨越不同语言...
1 131 132 133 134 135 174