音频生成
音频,audio
如今的智能体,已经像人一样「浏览」视频了,国内就有
英伟达推出的NVIDIA AI Blueprint是一款预训练的、可自定义的AI工作流,旨在帮助开发者构建和部署生成式AI应用程序。它通过为视频配置“双眼与大脑”,提高了搜...
视觉模型智能涌现后, Scaling Law 不会到头
近期,哈佛大学的一篇论文《Scaling Laws for Precision》引发了关于自然语言处理领域Scaling Law可能达到瓶颈的讨论。该论文指出,当前语言模型在大量数据上...
AI创作真正All in One的大模型产品竟然是它?
百度在2024年百度世界大会上发布了名为“自由画布”的AI创作新物种,由百度文库和百度网盘联合出品,旨在打造一个智能生产力的All in One平台。自由画布是行业...
语音AI赛道全解析:市场规模超 50 亿,最有机会的场景在哪里?
Bessemer Venture Partners 的报告指出,语音 AI 在企业应用领域取得了显著进展,市场规模超过 50 亿美元。尽管传统电话客服系统效率低下,语音 AI 的研究、...
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
斯坦福大学李飞飞和吴佳俊团队推出了HourVideo,一个旨在评估多模态模型对长达一小时视频理解能力的基准数据集。HourVideo包含500个来自Ego4D数据集的第一人...
Meta 的智能眼镜,除了不太智能,哪儿哪儿都挺好
Meta与RayBan联名款智能眼镜RayBan Meta因其独特的功能和时尚外观在大陆市场受到关注。这款智能眼镜不仅支持语音交互,还配备了1200万像素高清摄像头,实现拍...
苹果地表最强AI PC诞生,M4 Max猛兽加持性能暴涨!顶配6万,续航飙至24小时
苹果公司推出了全新的MacBook Pro系列,标志着M4芯片家族的诞生。这些笔记本电脑搭载了M4、M4 Pro和M4 Max芯片,采用第二代3nm工艺制造,提供了显著的性能提...
实时音视频领域拓荒者的十年
实时对话式AI的机遇正在被业界广泛讨论和探索。RTE(实时互联网)大会自2015年引入中国以来,已发展成为全球规模最大的音视频行业峰会,吸引了众多行业专家和...
对话小宇宙 Kyth:AI 时代,如何重新理解播客的价值
在上海上生·新所举办的播客线下活动中,小宇宙CEO Kyth分享了对播客行业的看法和未来展望。小宇宙作为国内最大的播客平台,其创立初衷是填补中文播客产品的空...
o1之后,GitHub又接入Claude、Gemini,网友:也杀不死Cursor
GitHub Copilot 近期引入了多个新的AI模型,以增强其代码生成和辅助功能。这些新模型包括Anthropic的Claude 3.5 Sonnet、Google的Gemini 1.5 Pro以及OpenAI的...