音频生成
音频,audio
来了!纳芯微汽车电子技术研讨会·重庆站,报名通道已开启
在智能化、电动化重塑汽车产业的背景下,芯片成为技术核心与系统演进的驱动力。9月25日13:30 - 18:00,纳芯微将在重庆市渝北区金州大道116号金科大酒店举办【...
字节跳动发布OmniHuman-1.5,数字人界的“影帝”诞生了
想象与能“眉来眼去”、进行情绪交流的AI虚拟人聊天并非科幻,字节跳动智能创作实验室推出的OmniHuman - 1.5宣告“数字人新王”登基。此前市面上的AI数字人多是“...
长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman
随着内容创作智能化需求增长,长时长、高质量数字人视频生成成为行业痛点。字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型...
实测“AI界Netflix” Showrunner:5分钟拍一集《南方公园》,但问题是给谁看
Fable是一家由资深人士创立的旧金山初创公司,试图用AI技术改革娱乐业。其Showrunner平台已上线,号称“AI界的Netflix”,获亚马逊旗下Alexa基金投资。Showrunn...
语音界Sora!微软刚开源新模型,一次生成90分钟语音、3200倍压缩率
微软研究院于今日凌晨开源创新音频模型VibeVoice - 1.5B,该模型在语音合成领域取得多项重大突破。它可一次性连续合成90分钟超长逼真语音,最多支持4名发言人...
微信悄悄上线AI播客,新闻主播们的活儿可能真要被抢了。
微信正在灰度内测AI播客功能,入口在“快讯”处。若不常打开公众号,“快讯”会出现在公众号页面顶部;若常打开,则需在搜索栏搜“快讯”进入合集页。在该页面右上...
马斯克开源新模型:能实时抓取社交平台数据,20万块H100训练
马斯克宣布旗下大模型平台xAI开源去年最佳模型Grok - 2.5,并将在6个月内开源旗舰模型Grok 3。与其他同类大模型相比,Grok - 2.5的最强功能是可实时抓取社交...
影石 Insta360 GO Ultra 上手:视频博主的“第三只眼”
Insta360 GO Ultra是Insta360 GO系列中最接近专业级设备性能的产品,带来全方位的Ultra体验。设计与配件方面:继承磁吸设计,新增Sticky Tab随心贴配件,可粘...
谷歌手机十年最狠升级,全家桶AI宣战苹果!一句话P图,100倍变焦
谷歌在Made by Google 2025新品发布会上推出Pixel 10「全家桶」,包含Pixel 10、10 Pro、10 Pro XL、10 Pro Fold四款手机,正面狙击未发布的苹果iPhone 17。...
对话小米 AI 眼镜负责人:20 天卖光库存,但属于产品的「长跑」才刚开始
小米AI眼镜以1999元的定价复刻初代小米手机的策略,承载着普及智能眼镜品类的雄心。这款产品的推出及市场反馈,为小米在智能眼镜领域的发展带来了新的机遇和...