音频生成

音频,audio

6小时,200美元,0人类代码:Anthropic把AI编程推过了临界点

Anthropic在最新实验中验证了AI从“生成内容”向“完整项目交付”的跃迁能力。面对“开发一套复古游戏编辑器”的模糊需求,传统单智能体模式仅20分钟产出一个功能不...

京东卷出新高度!硬刚「复杂指令」长时长、自由态数字人直播终于丝滑了

京东在2026年GTC大会上正式迈入AI智能体应用的新阶段,其核心突破在于解决了长期困扰行业的数字人“躯壳”问题——即如何让AI智能体实现高表现力、长时长、自由态...

实测拿215项SOTA的Qwen3.5-Omni:摄像头一开,AI给我现场讲论文、撸代码

Qwen3.5-Omni作为通义实验室最新推出的多模态大模型,实现了从输入到输出的全流程原生全模态支持,能够无缝处理文本、图片、音频及音视频混合输入,并生成带...

开源音视频同步SOTA基座:极简的单流架构,2秒出片

daVinci-MagiHuman是由上海创智学院(SII)生成式人工智能研究实验室(GAIR)与Sand.ai联合发布的开源音视频生成基础模型,旨在解决当前开源生态中生成质量、...

AWE 2026 探展回顾:30人大佬团,0距离对话明星企业CXO

此次AWE2026探展活动中,雷峰网·硬创邦组织30位来自科技金融、产业决策与专业研究等领域的资深人士,深度探访20家核心企业展台,聚焦AI硬件产业化前沿动态。...

龙虾也能当导演了!LibTV解锁全自动拍片,一句话从剧本干到成片

LibTV作为LiblibAI推出的首款AI视频产品,标志着AI内容创作进入“人+Agent”双视角协同的新阶段。该平台以一块无限画布为核心,整合文本、图片、视频、音频与脚...

改造 100 多年的影视行业,需要的不止是好模型

LibTV 作为一款新型 AI 视频创作平台,核心突破在于将技术能力与影视工业流程深度整合,而非仅聚焦于单镜头生成质量。其底层集成 Lib Nano Pro、Kling 3.0 等...

人跑光了,AI视频炸了!马斯克狂发推:Grok Imagine三金封神

Grok Imagine在DesignArena平台的三项核心视频任务中斩获Elo评分第一,分别以1337分、1298分和1291分领先视频生成竞技场、图像转视频及视频编辑类别,显著超...

什么样的龙虾,才是「一人公司」的心头好?

面壁智能推出的EdgeClaw Box是面向OPC(一人公司)群体的专用硬件产品,旨在解决当前开源Agent架构在实际落地中面临的部署复杂、数据安全与使用成本高等核心...

刚刚,国产视频模型登顶全球第一!给谷歌Veo上了一课,还把钱给挣了

SkyReels V4凭借在文本生成视频(含音频)任务中获得第三方机构Artificial Analysis盲评全球第一的成绩,标志着国产AI视频模型首次站上世界顶端,其表现超越...
1 2 3 58