音频生成

2025英伟达奖学金名单公布，7位华人入选！中科大浙大校友在列，人均6万美元

英伟达2025-2026年度博士奖学金名单公布，共有10位博士研究生入选，其中7位为华人学者。该奖学金计划已持续二十多年，旨在支持与英伟达技术相关的杰出研究生...

AIGC动态

8个月前

苹果公司正在与中国科技巨头腾讯和字节跳动探讨合作，旨在将类ChatGPT功能集成到iPhone、Siri等产品中。由于ChatGPT在中国无法使用，苹果寻求本土技术平台以...

AIGC动态

8个月前

CMU联合20多所研究实验室开源发布了名为Genesis的生成式物理引擎，标志着我们向构建一个综合生成文本、图像、音频、视频和3D对象的世界迈出了重要一步。Genes...

AIGC动态

8个月前

中文播客在过去两年中经历了快速的发展，越来越多的明星、喜剧演员、品牌机构和企业家投资人参与其中，内容覆盖影视、科技、商业等多个领域。在极客公园IF202...

AIGC动态

8个月前

斯坦福大学的研究团队在多模态语言模型领域取得了新进展，提出了一种能够同时处理语音、文本和动作生成任务的模型。该模型能够理解并生成富有表现力的人类动...

AIGC动态

8个月前

OpenAI在技术分享直播中发布了o1模型的API，并进行了实时API的大升级，支持WebRTC技术。o1模型API相较于预览版本，思考成本降低了60%，并新增了高级视觉功能...

AIGC动态

8个月前

近期，OpenAI和谷歌在人工智能领域展开了激烈的竞争。OpenAI推出了一系列针对开发者的新功能和升级，包括API中的OpenAI o1模型，该模型支持函数调用、开发人...

AIGC动态

8个月前

OpenAI在技术直播中推出了ChatGPT Projects，标志着ChatGPT从单一AI对话工具转变为高效率协作平台。Projects集成了文件与指令上传、自定义对话、Canvas、网络...

AIGC动态

9个月前

MiniMax近期推出了图生视频模型I2V-01-Live，专门优化了二次元效果，能够将静态二次元图片转化为流畅自然的动态视频，标志着其正式进入动漫领域。这一新模型...

AIGC动态

9个月前

谷歌近日发布了其最新的AI模型Gemini 2.0，标志着公司在AI领域的重大进步。Gemini 2.0是首个实现原生多模态输入输出的模型，性能全面升级，速度是前代1.5 Pro...

AI-Agent

9个月前