音频生成

音频,audio

机器人再度大幅进化!阿西莫夫三法则还有效吗?| 大模型一周大事

在本周的大模型行业动态中,InfoQ 研究中心为我们带来了一系列令人兴奋的进展。英国 Engineered Arts 的 Ameca、特斯拉的 Optimus 和 Sanctuary AI 的 Phoeni...

周鸿祎首堂AI课引争议,专业性错误遭质疑;智联招聘被“挤崩”,网友:找工作更焦虑了;马斯克起诉OpenAI,要求开源 | Q资讯

阿里云“疯狂星期四”:阿里云全线下调云产品官网售价,平均降价幅度超过20%,最高降幅达55%。涉及100多款产品、500多个产品规格,覆盖计算、存储、数据库等所...

实测英伟达AI游戏引擎:与NPC实时聊天,中文流畅爆了

在CES展会上,英伟达展示了其智能引擎Avatar Cloud Engine (ACE),使得游戏中的NPC能够与玩家进行自然的中英双语对话,并展现出相应的表情和肢体动作。这一技...

大模型的发展方向,Chatgpt?AI Agent?两万字深度思考!

本文是李博杰在知乎分享的关于AI Agent的全面介绍和总结。文章首先回顾了ChatGPT发布两年来的发展,特别是大模型从文字对话扩展到文生视频的能力。作者分享了...

阿里最新图生视频模型效果好得可比肩 Sora,但 0 代码“假”开源让国内外网友骂翻了天?

阿里巴巴集团智能计算研究院推出了一款名为EMO的AI图生视频模型。这个模型能够根据用户提供的一张照片和音频文件生成具有丰富面部表情和头部姿态的视频。EMO...

DeepMind CEO Demis Hassabis 专访:2030年有望达到AGI、AI会带来革命性的全民普惠

在《纽约时报》的专访中,Google DeepMind的CEO Demis Hassabis讨论了他对大模型、开源以及通往人工通用智能(AGI)的看法。他提到,Google最近发布了性能更...

全球AI大事记 · 疯狂二月|钛媒体AGI

2024年2月,全球人工智能(AI)领域迎来了一系列重大进展和新闻。OpenAI、谷歌、微软等科技巨头纷纷发布重要AI消息,包括视频生成模型Sora的推出、AI芯片的自...

阿里最新图生视频模型效果好得可比肩Sora,但0代码“假”开源让国内外网友骂翻了天?

摘要:阿里巴巴集团智能计算研究院推出了一款名为EMO(Emote Portrait Alive)的AI图生视频模型。EMO能够根据用户提供的一张照片和音频文件生成具有丰富面部...

轻松让张国荣、赫本唱歌,阿里推出创新视频模型EMO

本文介绍了阿里巴巴集团AI研究院推出的创新性视频模型——EMO。该模型能够通过用户提供的图像和音频生成表情丰富的视频,如让张国荣唱歌或让赫本唱《Perfect》...

让Sora东京女郎唱歌、高启强变声罗翔,阿里人物口型视频生成绝了

摘要:机器之心报道了阿里巴巴智能计算研究院的EMO(Emote Portrait Alive)框架,这是一个音频-视频合成方法,用于生成表现力强、真实度高的说话人头部视频...
1 17 18 19 20 21 23