音频生成
音频,audio
是别针还是耳机?OpenAI首款AI硬件形态成谜
OpenAI正加速推进商业化进程,首款AI硬件设备预计将于2024年下半年面世。在达沃斯论坛上,首席全球事务官克里斯·莱恩透露设备开发是公司年度重点,但未披露具...
击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了
模思智能发布的多说话人自动语音识别模型MOSS-Transcribe-Diarize在语音识别与分析领域取得突破性进展。该模型由复旦邱锡鹏团队研发,能够同时完成语音转文字...
好的AI硬件都是“为创始人自己做的”|硅谷对话Omi,Looki和Bondu
硅谷与中国AI硬件创业公司Omi、Looki和Bondu的创始人在GenAI Assembling Meetup上展开了一场关于AI硬件未来的深度对话。这些公司虽然产品形态各异,但都聚焦...
3 个月达成 5 亿平台播放量,Wispr Flow 分享如何做好红人营销
Wispr Flow作为语音输入领域的代表性产品,其增长策略与运营模式展现出独特亮点。用户数据表现尤为突出:年环比多个月份增速超50%,付费转化率约20%,活跃用...
有人提前五年,预判了 OpenAI 的预判。
Sam Altman在访谈中将现代手机使用体验比作置身纽约时代广场,充斥着各种干扰和注意力争夺。他认为当前手机形态本质上是一个不断打断用户的设备,每个应用都...
火爆全网的《卢浮宫小猫》AI视频万字创作心得分享,这可能是他们最毫无保留的一次。
数字艺术家海辛和阿文在直播中详细分享了他们为浦东美术馆创作的AI视频作品《卢浮宫小猫》的全流程制作经验。作为曾创作过《故宫猫上班记》《文明小猫游浦东...
顶级视频模型半衰期只有 30 天,但生成式媒体 infra 公司的收入却在一年增长了 60 倍
在生成式媒体领域,算力需求呈现出指数级增长的特点。处理一个大型语言模型(LLM)的单个Prompt(约200 Token)所需的算力若定义为1个单位,生成一张高质量图...
我所知道的闫俊杰
MiniMax创始人闫俊杰的创业历程展现了一条以技术信仰驱动的独特路径。作为商汤时期被称为'大神'的顶尖人才,闫俊杰在算法与工程领域展现出罕见的双重天赋,这...
边看边创造,在 PixVerse R1 的实时世界模型里,你真是上帝
爱诗科技发布的PixVerse R1被定位为'全球首个通用实时世界模型',其核心突破在于彻底改变了视频生成的交互范式。传统视频生成是单向的指令-等待-输出流程,而...
比iPhone更疯狂!乔布斯去世15年后,「最像他的人」操刀首款AI硬件
2026年1月,硅谷因OpenAI首款硬件设备「Sweetpea」的泄露路线图而震动。这款代号为「甜豌豆」的音频设备,由前苹果设计总监Jony Ive操刀,计划于同年9月发布...




