音频生成
音频,audio
全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻
昆仑万维发布了全球首款音乐推理大模型Mureka O1,标志着AI音乐进入了“会思考”的时代。该模型基于Mureka V6基座模型,并引入了CoT(Chain of Thought)技术,...
凌晨“激战”!谷歌亮相新模型,OpenAI 紧急甩出 GPT-4o 动动嘴就能 P 图,网友:又要感谢 DeepSeek 了
OpenAI 近期发布了 GPT-4o 图像生成技术,该技术被直接集成到 ChatGPT 中,标志着图像生成功能成为其原生能力。这一新功能允许用户通过自然语言指令生成图像...
刚刚,OpenAI发布新文生图模型,免费、逼真到难以分辨
OpenAI在技术直播中发布了GPT-4和Sora的重大更新,重点介绍了全新的文生图模型。该模型不仅支持文本生成图像,还具备自定义操作、连续发问、风格转换、图像PP...
蓝牙,何去何从?
蓝牙是一种广泛应用的无线连接标准,用于将耳机、扬声器、智能手表等设备与手机、笔记本电脑等设备连接。它使用高频无线电波在2.4 GHz频段进行通信,并通过自...
刚3月,已有9家AI企业融资超1亿美元
2025年3月,9家AI企业已获得超过1亿美元的融资,显示出资本市场对AI领域的持续青睐。Anthropic在E轮融资中筹集了35亿美元,估值达到615亿美元,其核心产品Cla...
OpenAI语音智能体诞生,怼脸实拍语气狂到飞起!API降到每分钟0.3美分
OpenAI最新发布的音频模型标志着语音智能体时代的正式开启。此次发布的三款模型——gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts,分别专注于...
刚刚,OpenAI首发语音Agent,智能体实现重大突破
OpenAI在凌晨的技术直播中发布了三款全新的语音模型,分别是GPT-40 Transcribe、GPT-4 Mini Transcribe和GPT-40 Mini TTS。这些模型专注于语音AI Agent的开发...
OpenAI深夜发布3个全新的语音模型,一手实测都在这了。
OpenAI近期发布了一系列新的语音和文本处理模型,包括两个语音转文本(STT)模型和一个文本生成语音(TTS)模型。这些模型通过API提供接入方式,旨在提升语音...
一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版
百度在文心一言两周年之际,推出了两款新模型——文心大模型4.5和文心大模型X1,并宣布免费向用户开放。这一消息迅速在海外社交媒体上引发热议,尤其是关于是否...
免费使用!百度重磅发布文心4.5、X1,视频解读+深度思考
百度近日发布了两款大模型——文心4.5和X1,均已上线并免费向用户开放。文心4.5是一款多模态模型,能够对文字、图片、视频、音频等多种内容进行综合解读,其能...