音频生成

音频,audio

2025英伟达奖学金名单公布,7位华人入选!中科大浙大校友在列,人均6万美元

英伟达2025-2026年度博士奖学金名单公布,共有10位博士研究生入选,其中7位为华人学者。该奖学金计划已持续二十多年,旨在支持与英伟达技术相关的杰出研究生...

苹果正与腾讯、字节跳动洽谈,在iPhone集成类ChatGPT

苹果公司正在与中国科技巨头腾讯和字节跳动探讨合作,旨在将类ChatGPT功能集成到iPhone、Siri等产品中。由于ChatGPT在中国无法使用,苹果寻求本土技术平台以...

历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物

CMU联合20多所研究实验室开源发布了名为Genesis的生成式物理引擎,标志着我们向构建一个综合生成文本、图像、音频、视频和3D对象的世界迈出了重要一步。Genes...

潘乱对谈小宇宙 CEO Kyth:播客是在饱和时代,提供稀缺价值

中文播客在过去两年中经历了快速的发展,越来越多的明星、喜剧演员、品牌机构和企业家投资人参与其中,内容覆盖影视、科技、商业等多个领域。在极客公园IF202...

李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

斯坦福大学的研究团队在多模态语言模型领域取得了新进展,提出了一种能够同时处理语音、文本和动作生成任务的模型。该模型能够理解并生成富有表现力的人类动...

重磅!OpenAI开放满血o1模型API,成本暴降60%

OpenAI在技术分享直播中发布了o1模型的API,并进行了实时API的大升级,支持WebRTC技术。o1模型API相较于预览版本,思考成本降低了60%,并新增了高级视觉功能...

OpenAI狂打“骨折价”的一天:暴降成本开放全新o1,实时 API 全面降价 60%

近期,OpenAI和谷歌在人工智能领域展开了激烈的竞争。OpenAI推出了一系列针对开发者的新功能和升级,包括API中的OpenAI o1模型,该模型支持函数调用、开发人...

突破性功能!OpenAI发布ChatGPT Projects,万能工具箱上线!

OpenAI在技术直播中推出了ChatGPT Projects,标志着ChatGPT从单一AI对话工具转变为高效率协作平台。Projects集成了文件与指令上传、自定义对话、Canvas、网络...

细节表现超Sora,网友:真正的国产之光!MiniMax视频模型再上新

MiniMax近期推出了图生视频模型I2V-01-Live,专门优化了二次元效果,能够将静态二次元图片转化为流畅自然的动态视频,标志着其正式进入动漫领域。这一新模型...

谷歌发布Gemini2.0,开启Agent新时代

谷歌近日发布了其最新的AI模型Gemini 2.0,标志着公司在AI领域的重大进步。Gemini 2.0是首个实现原生多模态输入输出的模型,性能全面升级,速度是前代1.5 Pro...
1 2 3 31