音频生成

专访AI.Talk赵汗青 – 我不是一个创作者。

AI虚拟偶像YURI的爆火标志着AI内容创作进入新阶段。这个由AI.Talk团队打造的虚拟IP，通过单曲《Surreal》获得700万播放量后，又以出道视频引发全网热议，获得...

AIGC动态

2个月前

Founder Park 与 Google 合作推出的「从模型到行动」系列 AI 工作坊，旨在帮助开发者将顶尖 AI 模型的能力转化为实际商业价值。该系列工作坊将在深圳、上海和...

AIGC动态

2个月前

Step-Audio团队近期开源了一个端到端的语音大模型Step-Audio-AQAA，该模型能够直接理解音频输入并生成自然流畅的语音回答，而无需先将语音转换为文本。这一技...

AIGC动态

2个月前

阿里通义语音团队最新开源的泛音频生成模型ThinkSound，首次将CoT思维链推理引入音频领域，解决了传统视频配乐技术难以捕捉画面动态细节和空间关系的难题。Th...

AIGC动态

2个月前

Roy Lee，一位曾先后被哈佛大学和哥伦比亚大学开除的创业者，如今因其初创公司Cluely在AI技术应用领域的突破而备受关注。Cluely是一款AI桌面助手，能够通过透...

AIGC动态

2个月前

6月26日晚，小米在「人车家」全品类新品发布会上推出了首款AI眼镜，标志着其在智能穿戴设备领域的正式入局。这款产品承载了小米对未来智能穿戴设备的期待，并...

AIGC动态

2个月前

可灵AI推出的Kling-Foley模型标志着生成式AI在音视频同步领域的重要突破。该模型能够通过多模态控制，自动生成与视频内容同步的高质量立体声音频，涵盖音效、...

AIGC动态

2个月前

谷歌正式发布了Gemma 3n完整版，这是一款面向开发者的开源大模型，具备输入图像、音频和视频的能力，并支持文本输出。Gemma 3n的设计亮点在于其天生多模态和...

AIGC动态

2个月前

边缘AI技术自去年以来进入爆发式增长阶段，预计到2025年，全球边缘AI市场价值将达到250亿美元，硬件设备总量突破20亿台，芯片市场规模达730亿美元。2025年至2...

AIGC动态

2个月前

出门问问最新发布的AI硬件产品TicNote，是一款集录音、转录、总结、思维导图生成等功能于一体的智能设备，彻底改变了传统录音笔的使用体验。TicNote的核心优...

AIGC动态

2个月前