音频生成
音频,audio
商汤破解世界模型秘诀,「日日新」实现AI大一统!原生融合模型破纪录双冠王
商汤科技在人工智能领域取得了重大突破,推出了「日日新」原生融合大模型,实现了多模态融合,标志着AI从大语言模型和多模态模型分立的现状迈向了「大一统」...
RAG 的未来,走向繁荣、重塑还是消亡?
检索增强生成(RAG)技术通过整合外部知识库与生成模型,提升了内容生成的时效性和准确性,降低了幻觉率,对多个行业产生了显著影响。然而,在企业实际应用中...
一篇推文看一年!Jim Fan力荐2025必读清单:50篇论文,扫盲「全领域AI实战」
AI领域的发展日新月异,为了成为AI工程专家,更新论文清单至关重要。目前AI工程技术可分为十个领域,每个领域都有其代表作和相关工作。在前沿大模型领域,Ope...
雷鸟V3,可能是 Meta 智能眼镜史上最有竞争力的挑战者
在CES 2025上,雷鸟创新发布了RayNeo V3 AI拍摄眼镜,挑战海外品牌Meta的智能眼镜。V3是雷鸟首款不带有显示功能的产品,主打AI拍摄功能。为了实现“无感佩戴”...
机器人ChatGPT时刻!英伟达开源世界大模型,完美模拟物理世界!
NVIDIA在2025年CES展会上开源了NVIDIA Cosmos,这是一个全新的世界大模型,旨在从数据整合、训练到定制开发阶段,为大规模模拟和构建物理世界的基础模型提供...
AI 医疗赛道最受关注的独角兽:5000万ARR、25亿估值,AI Scribe场景PMF已验证
在LLM技术应用领域,医疗行业尤其是AI scribe产品展现出较高的应用确定性,有效解决了临床文档记录的痛点。Abridge公司凭借其专用于临床文档的ASR和文本生成...
全面打破GPT-4垄断、DeepSeek打下训练成本…2024年大模型领域进展全复盘
2024年是生成式人工智能(AI)取得显著进步的一年,特别是在大型语言模型(LLM)领域。英国独立研究员Simon Willison回顾了过去一年中的关键发展和主题。以下...
我用AI做了一个新年视频,女朋友感动哭了
PixVerse V3.5是最新发布的AI视频生成工具,以其快速的视频制作能力和高清视频输出而受到关注。用户只需不到10秒即可完成视频制作,且视频首尾帧过渡流畅稳定...
亲测!豆包+PC,解锁生产力「神器」
豆包电脑版以其便捷、实用、高效的AI工具特性,满足了用户对AI的核心诉求。它通过将AI功能嵌入日常办公流程,实现了工作效率的提升、创作辅助和沟通协作。豆...
围猎Suno!国产AI音乐三巨头:华语创作称雄,MV一键生成全球首创
谷歌的新一代视频生成模型Veo2以其高分辨率和电影拍摄技巧在视频生成领域取得了显著进步,尽管生成的视频仍是默片。与此同时,国内互联网公司通过音乐大模型...