音频生成
音频,audio
生成式AI迎来窗口期,阶跃星辰加速冲刺|钛媒体AGI
生成式AI领域的竞争日益激烈,各大公司纷纷推出新模型。OpenAI发布了Sora、GPT-4o、o1系列等模型,Runway发布了Framer图像模型,Midjourney准备发布V7版本,C...
OpenAI 在亚洲的首届黑客松,这三个作品获奖了
OpenAI在新加坡与GovTech合作举办了亚洲首届黑客马拉松,主题为“为新加坡和世界公共利益的AI”。参赛者需将OpenAI API应用于公共利益实例。经过评审,三个项目...
如今的智能体,已经像人一样「浏览」视频了,国内就有
英伟达推出的NVIDIA AI Blueprint是一款预训练的、可自定义的AI工作流,旨在帮助开发者构建和部署生成式AI应用程序。它通过为视频配置“双眼与大脑”,提高了搜...
视觉模型智能涌现后, Scaling Law 不会到头
近期,哈佛大学的一篇论文《Scaling Laws for Precision》引发了关于自然语言处理领域Scaling Law可能达到瓶颈的讨论。该论文指出,当前语言模型在大量数据上...
AI创作真正All in One的大模型产品竟然是它?
百度在2024年百度世界大会上发布了名为“自由画布”的AI创作新物种,由百度文库和百度网盘联合出品,旨在打造一个智能生产力的All in One平台。自由画布是行业...
语音AI赛道全解析:市场规模超 50 亿,最有机会的场景在哪里?
Bessemer Venture Partners 的报告指出,语音 AI 在企业应用领域取得了显著进展,市场规模超过 50 亿美元。尽管传统电话客服系统效率低下,语音 AI 的研究、...
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
斯坦福大学李飞飞和吴佳俊团队推出了HourVideo,一个旨在评估多模态模型对长达一小时视频理解能力的基准数据集。HourVideo包含500个来自Ego4D数据集的第一人...
Meta 的智能眼镜,除了不太智能,哪儿哪儿都挺好
Meta与RayBan联名款智能眼镜RayBan Meta因其独特的功能和时尚外观在大陆市场受到关注。这款智能眼镜不仅支持语音交互,还配备了1200万像素高清摄像头,实现拍...
苹果地表最强AI PC诞生,M4 Max猛兽加持性能暴涨!顶配6万,续航飙至24小时
苹果公司推出了全新的MacBook Pro系列,标志着M4芯片家族的诞生。这些笔记本电脑搭载了M4、M4 Pro和M4 Max芯片,采用第二代3nm工艺制造,提供了显著的性能提...
实时音视频领域拓荒者的十年
实时对话式AI的机遇正在被业界广泛讨论和探索。RTE(实时互联网)大会自2015年引入中国以来,已发展成为全球规模最大的音视频行业峰会,吸引了众多行业专家和...