标签:模型创新

耳朵没错,是声音太真了,字节豆包语音合成成果Seed-TTS技术揭秘

字节跳动豆包大模型团队近期发布了名为Seed-TTS的语音生成大模型,该模型在生成与真人相似度极高的语音方面取得了显著成果。Seed-TTS能够根据文本生成具有原...

Adobe推出超分辨率,细节丰富视频模型VideoGigaGAN

视频超分辨率技术致力于将低分辨率视频转化为高分辨率,面临两大挑战:一是保持视频帧的时间连贯性,避免闪烁或抖动;二是放大视频帧时重建高频细节,以呈现...

ChatGPT和Sora其实限制了我们对大模型的想象?

近期,一份关于OpenAI部署Sora所需硬件资源的美国市场研究报告引起了广泛关注。报告指出,在峰值时期,Sora需要高达72万张英伟达H100显卡来支持,对应成本高...

Sora为何没能诞生在中国?

硅谷AI初创公司Pika lab推出自研视频生成模型的新功能,可同时生成画面和声音,这是AI生成视频的一次重要突破。OpenAI发布的大模型Sora,能根据简单的文本提...