音频生成

音频,audio

如今的智能体,已经像人一样「浏览」视频了,国内就有

英伟达推出的NVIDIA AI Blueprint是一款预训练的、可自定义的AI工作流,旨在帮助开发者构建和部署生成式AI应用程序。它通过为视频配置“双眼与大脑”,提高了搜...

视觉模型智能涌现后, Scaling Law 不会到头

近期,哈佛大学的一篇论文《Scaling Laws for Precision》引发了关于自然语言处理领域Scaling Law可能达到瓶颈的讨论。该论文指出,当前语言模型在大量数据上...

AI创作真正All in One的大模型产品竟然是它?

百度在2024年百度世界大会上发布了名为“自由画布”的AI创作新物种,由百度文库和百度网盘联合出品,旨在打造一个智能生产力的All in One平台。自由画布是行业...

语音AI赛道全解析:市场规模超 50 亿,最有机会的场景在哪里?

Bessemer Venture Partners 的报告指出,语音 AI 在企业应用领域取得了显著进展,市场规模超过 50 亿美元。尽管传统电话客服系统效率低下,语音 AI 的研究、...

空间智能版ImageNet来了!李飞飞吴佳俊团队出品

斯坦福大学李飞飞和吴佳俊团队推出了HourVideo,一个旨在评估多模态模型对长达一小时视频理解能力的基准数据集。HourVideo包含500个来自Ego4D数据集的第一人...

Meta 的智能眼镜,除了不太智能,哪儿哪儿都挺好

Meta与RayBan联名款智能眼镜RayBan Meta因其独特的功能和时尚外观在大陆市场受到关注。这款智能眼镜不仅支持语音交互,还配备了1200万像素高清摄像头,实现拍...

苹果地表最强AI PC诞生,M4 Max猛兽加持性能暴涨!顶配6万,续航飙至24小时

苹果公司推出了全新的MacBook Pro系列,标志着M4芯片家族的诞生。这些笔记本电脑搭载了M4、M4 Pro和M4 Max芯片,采用第二代3nm工艺制造,提供了显著的性能提...

实时音视频领域拓荒者的十年

实时对话式AI的机遇正在被业界广泛讨论和探索。RTE(实时互联网)大会自2015年引入中国以来,已发展成为全球规模最大的音视频行业峰会,吸引了众多行业专家和...

对话小宇宙 Kyth:AI 时代,如何重新理解播客的价值

在上海上生·新所举办的播客线下活动中,小宇宙CEO Kyth分享了对播客行业的看法和未来展望。小宇宙作为国内最大的播客平台,其创立初衷是填补中文播客产品的空...

o1之后,GitHub又接入Claude、Gemini,网友:也杀不死Cursor

GitHub Copilot 近期引入了多个新的AI模型,以增强其代码生成和辅助功能。这些新模型包括Anthropic的Claude 3.5 Sonnet、Google的Gemini 1.5 Pro以及OpenAI的...
1 2 3 4 5 6 31