音频生成
音频,audio
DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩
本文报道了基于Diffusion Transformer(DiT)的新模型Flag-DiT,该模型由上海AI Lab、港中文和英伟达的研究者联合推出,旨在通过流(Flow-based)的大型扩散T...
OpenAI重磅更新定档下周一,奥特曼暗示会有「魔法」!
OpenAI即将在下周一(13日)上午10点(太平洋时间)进行线上直播,届时将展示全新的ChatGPT demo演示和GPT-4升级更新。尽管之前有关于GPT-5和搜索引擎的传闻...
生成式AI,苹果倾巢出动
苹果公司即将与OpenAI签署协议,将ChatGPT相关技术整合到iPhone中,这将是Siri自2009年发布以来的最大升级。根据彭博社的报道,苹果计划在iOS 18中使用ChatGP...
OpenAI大招要来了!AI语音助手狙击谷歌苹果,官宣下周二上新,GPT-5年前见
OpenAI宣布将在直播中展示ChatGPT和GPT-4的更新内容,同时外媒报道OpenAI正在开发具备音频和视觉理解能力的AI语音助手,部分功能已向客户展示。OpenAI可能在...
媲美Suno、Udio!AI铁了心,要砸音乐人的饭碗
ElevenLabs,一家专注于语音生成式AI的平台,近期在社交媒体上宣布推出了一款名为ElevenLabs Music的文本生成歌曲产品。该产品能够通过文本描述生成具有节奏...
首发 M4 芯片,苹果正准备将 iPad 进化为“Ai Pad”
苹果公司在最近的新品发布会上对iPad系列产品进行了重大更新,特别是iPad Pro系列,它们直接搭载了新的M4芯片,跳过了M3芯片。苹果声称M4芯片的性能超越了市...
苹果发布M4芯片:每秒38万亿次,最强神经引擎
< strong >苹果公司于5月8日在其官网宣布推出最新的M4芯片,这是迄今为止苹果最强的芯片。< / strong >M4芯片采用第二代3纳米制程工艺制造,集成了SoC架构和...
OpenAI推出DALL·E 3识别器、媒体管理器
OpenAI公司近日宣布推出两款新工具:DALL·E 3的内容识别器和媒体管理器。DALL·E 3是一款文生图模型,其生成的图片质量极高,以至于难以区分AI生成与人类创作...
2万块钱买平板:苹果新一代iPad Pro直接上M4芯片,最强也最贵
苹果公司在其春季新品发布特别活动中,引入了备受期待的M4芯片,首次搭载于新一代iPad Pro上。新款iPad Pro的亮点在于其强大的M4芯片,该芯片基于第二代3nm技...
让 Altman 也玩上瘾的「语音 Twitter」,在硅谷彻底火了
在后移动互联网时代,创新型社交媒体应用程序的出现变得越来越少。然而,Airchat,一款仅限邀请注册的应用程序,似乎为这一领域带来了新鲜的空气。Airchat 被...