音频生成

音频,audio

AGI万字长文:2023回顾与反思

2023年对于人工智能(AI)的发展来说,是一个充满惊喜和挑战的一年。本文作者Lian,MK通过深入分析,为我们描绘了一个关于通用人工智能(AGI)和大模型发展的...

马克.扎克伯格谈空间计算、Meta 的雷朋智能眼镜和 Quest 3

本文主要讨论了作者在上海和硅谷生活的最大区别,即消费观念的差异。作者表示,当手上有300美金闲钱时,他会选择购买不同的物品,如天猫包包或最新电子设备。...

机器人再度大幅进化!阿西莫夫三法则还有效吗?| 大模型一周大事

在本周的大模型行业动态中,InfoQ 研究中心为我们带来了一系列令人兴奋的进展。英国 Engineered Arts 的 Ameca、特斯拉的 Optimus 和 Sanctuary AI 的 Phoeni...

周鸿祎首堂AI课引争议,专业性错误遭质疑;智联招聘被“挤崩”,网友:找工作更焦虑了;马斯克起诉OpenAI,要求开源 | Q资讯

阿里云“疯狂星期四”:阿里云全线下调云产品官网售价,平均降价幅度超过20%,最高降幅达55%。涉及100多款产品、500多个产品规格,覆盖计算、存储、数据库等所...

实测英伟达AI游戏引擎:与NPC实时聊天,中文流畅爆了

在CES展会上,英伟达展示了其智能引擎Avatar Cloud Engine (ACE),使得游戏中的NPC能够与玩家进行自然的中英双语对话,并展现出相应的表情和肢体动作。这一技...

大模型的发展方向,Chatgpt?AI Agent?两万字深度思考!

本文是李博杰在知乎分享的关于AI Agent的全面介绍和总结。文章首先回顾了ChatGPT发布两年来的发展,特别是大模型从文字对话扩展到文生视频的能力。作者分享了...

阿里最新图生视频模型效果好得可比肩 Sora,但 0 代码“假”开源让国内外网友骂翻了天?

阿里巴巴集团智能计算研究院推出了一款名为EMO的AI图生视频模型。这个模型能够根据用户提供的一张照片和音频文件生成具有丰富面部表情和头部姿态的视频。EMO...

DeepMind CEO Demis Hassabis 专访:2030年有望达到AGI、AI会带来革命性的全民普惠

在《纽约时报》的专访中,Google DeepMind的CEO Demis Hassabis讨论了他对大模型、开源以及通往人工通用智能(AGI)的看法。他提到,Google最近发布了性能更...

全球AI大事记 · 疯狂二月|钛媒体AGI

2024年2月,全球人工智能(AI)领域迎来了一系列重大进展和新闻。OpenAI、谷歌、微软等科技巨头纷纷发布重要AI消息,包括视频生成模型Sora的推出、AI芯片的自...

阿里最新图生视频模型效果好得可比肩Sora,但0代码“假”开源让国内外网友骂翻了天?

摘要:阿里巴巴集团智能计算研究院推出了一款名为EMO(Emote Portrait Alive)的AI图生视频模型。EMO能够根据用户提供的一张照片和音频文件生成具有丰富面部...
1 24 25 26 27 28 31