音频生成
音频,audio
a16z 年度预测:2026 年,AI 创业的新机会都在垂直行业,AI 产品会走向定制化
2026年的AI行业将迎来从工具属性到原生环境的根本性转变,彻底重塑工业制造、企业软件和个人体验的各个维度。 a16z集结各领域投资人形成的预测报告显示,AI发...
哈萨比斯:DeepMind才是Scaling Law发现者,现在也没看到瓶颈
Scaling Law在AI发展中的核心地位得到哈萨比斯的强力支持。尽管此前有人认为Scaling面临瓶颈,但谷歌DeepMind通过Gemini 3的成功证明了其持续有效性。哈萨比...
造梦次元:每天30万人在这里,不求AI陪伴,只做上帝愉悦自己
造梦次元APP通过AI技术为用户提供了扮演“上帝”的机会,让他们在虚拟世界中创造并消费内容,从而获得掌控感。该平台的核心特点是高度互动性,用户不仅可以消费...
YC F25 Demo Day:83个AI项目完整盘点
2025年标志着生成式AI从概念验证阶段迈向规模化落地的关键转折点。在Y Combinator(YC)最新一期F25 Demo Day中,AI公司占比高达53%(83家/156家),较2021年...
VLA、世界模型与一副AI眼镜:理想在押注怎样的未来?
理想汽车正式推出AI眼镜Livis,标志着其从汽车制造商向人工智能终端公司的战略拓展。这款售价1699元起的穿戴设备并非简单的智能配饰,而是被定位为'穿戴机器...
百万人围观的「萌娃教训小狗」视频火了,结果都是AI生成的|附教程
萌娃与宠物互动的AI生成视频近期在社交平台掀起热潮,这些15秒以内的短视频通过温馨场景精准触达用户情感需求。视频内容包含小孩训斥狗狗、亲昵互动等生活化...
在拉斯维加斯,我看到了体育的未来
拉斯维加斯re:Invent大会新增的体育论坛(Sports Forum)标志着科技与体育的深度融合。与传统技术展区的硬核风格不同,该区域以互动体验设施为载体,背后却隐...
PixVerse V5.5 的震撼,做 AI 视频的人都知道这次更新的可贵之处
PixVerse V5.5模型的发布标志着国内AI视频生成技术迈入新阶段。作为首个具备Sora2级分镜能力的本土模型,其多镜头配置与音频原生直出的特性显著降低了专业级...
多人会话视频生成新突破:香港科技大学,浙江大学用单人数据实现多人交互视频生成
AnyTalker框架通过创新的音频-人脸交叉注意力机制(AFCA)和两阶段训练策略,实现了高质量、可扩展的多人对话视频生成。该技术由香港科技大学、浙江大学等机...
五年,终于等来Transformers v5
Hugging Face发布了Transformers v5的首个候选版本v5.0.0rc0,标志着这一全球最流行的AI基础设施库正式跨越了从v4到v5长达五年的技术周期。自2020年11月v4版...





