音频生成
音频,audio
原生融合多模态上的突破,让商汤大模型打破Scaling Laws撞墙「魔咒」
下一代AI发展遭遇瓶颈,大型语言模型竞赛中各实验室似乎同时撞墙。OpenAI的GPT-5模型发布多次延迟,至今仍未达到可发布水平。大型模型训练成本高昂,耗时数月...
大模型商用格局雏形初现:Tokens用量决高下,火山引擎问鼎2024
2024年下半年,国内大模型商用落地的日均Tokens消耗量激增,从1000亿级增长至10000亿规模,月复合增长率达到45%。火山引擎在这一领域表现突出,其商用Tokens...
几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的
MiniMax公司推出的海螺语音AI工具以其卓越的语音生成能力在市场中占据领先地位。该工具基于升级的T2A-01系列语音大模型,能够快速稳定地生成语音,具备音质清...
一年卖超 500 万副耳机的韶音,杀入「AI 眼镜」赛道
韶音在CES 2025后宣布入局智能眼镜市场,展示了其第一代智能眼镜工程样机,标志着这家国内蓝牙耳机龙头企业的业务范围进一步扩展。韶音在开放式耳机领域保持...
端侧 GPT-4o来了! 面壁发布全新端侧模型,全模态、端到端,支持实时流式音视频通话!
面壁智能最近发布了全新一代小钢炮MiniCPM-o 2.6,这是一款端到端模型,参数规模为8B,在视觉、语音和多模态方面与GPT-4o-202405性能相当。MiniCPM-o 2.6支持...
全球首次!国产AI开源端侧GPT-4o海外爆火,8B参数iPad就能跑
面壁智能最新推出的AI模型MiniCPM-o 2.6因其在多模态能力上的卓越表现而受到广泛关注。该模型仅8B的体量,就能在多模态任务中与GPT-4o相媲美,且能在iPad等移...
CES提前上演百镜大战,AI眼镜这2个方向4大技术最火
在2025年的CES展会上,AI眼镜成为了备受瞩目的焦点,尤其是中国品牌的表现尤为突出。AI眼镜产品主要分为AI拍摄眼镜和AI+AR眼镜两大类,其中Halliday Glasses...
商汤破解世界模型秘诀,「日日新」实现AI大一统!原生融合模型破纪录双冠王
商汤科技在人工智能领域取得了重大突破,推出了「日日新」原生融合大模型,实现了多模态融合,标志着AI从大语言模型和多模态模型分立的现状迈向了「大一统」...
RAG 的未来,走向繁荣、重塑还是消亡?
检索增强生成(RAG)技术通过整合外部知识库与生成模型,提升了内容生成的时效性和准确性,降低了幻觉率,对多个行业产生了显著影响。然而,在企业实际应用中...
一篇推文看一年!Jim Fan力荐2025必读清单:50篇论文,扫盲「全领域AI实战」
AI领域的发展日新月异,为了成为AI工程专家,更新论文清单至关重要。目前AI工程技术可分为十个领域,每个领域都有其代表作和相关工作。在前沿大模型领域,Ope...