标签:情感表达
8 人团队的开源多模态:Moshi,效果堪比 GPT-4o,合成数据立功
法国非营利性AI研究机构Kyutai开发了一个名为Moshi的实时语音多模态模型,该模型具备听、说、看的能力,能够理解带有法国口音的英语。Moshi可以流畅地进行日...
快手「可灵」再进化!视频续写可达3分钟让全球网友炸锅
可灵AI的图生视频和视频续写功能在全球范围内引发了视频创作的热潮。一位网友使用该技术将爷爷的两张老照片还原成视频,不仅为即将接受手术的父亲加油鼓劲,...
ChatTTS 深度体验:AI能精准表达人类的七情六欲了?| AI鲜测
ChatTTS,一个专为对话场景设计的文本生成语音模型,近日在GitHub上备受关注,仅用6天时间便获得了18.9千个星标。该模型支持多种语言,包括英语和中文,其中...
OpenAI Sora背后的秘密与潜力
OpenAI发布了其首个文生视频模型Sora,这一创新预计将推动人工智能领域的快速发展。Sora的核心特点包括:1. 60秒超长视频长度:Sora能够生成长达一分钟的视频...