音频生成
音频,audio
百度周末发布文心4.5和推理模型X1,已经两周年了啊。
百度最新发布的文心4.5和推理模型X1引起了广泛关注。文心4.5是一个原生多模态模型,能够理解音频、视频和图片,但不具备输出能力。相比之下,X1是一个推理模...
提前免费!百度连发两款模型,我们实测:能听歌看电影,还会蛐蛐人
百度近日发布了两款全新的大模型——文心大模型 X1 和文心大模型 4.5,标志着其在 AI 领域的进一步突破。这两款模型不仅在功能上各有侧重,还通过技术创新和优...
蔡浩宇的“AI版米哈游”,预告了一款神秘游戏
米哈游创始人蔡浩宇在离开公司后,于硅谷创立了新公司Anuttacon,并推出了首款AI驱动的游戏《Whispers from the Star》。这款游戏于3月15日发布了首支预告片...
语音模型平台Cartesia获6400万美元,只需3秒克隆语音
语音模型平台Cartesia宣布获得6400万美元A轮融资,由Kleiner Perkins领投。同时,Cartesia推出了最新语音模型Sonic 2.0和Sonic Turbo,其中Sonic 2.0的语音克...
苹果的“传感器战略”,能否将用户拉进未来生活方式?
自2014年苹果发布Apple Watch和2016年推出AirPods以来,苹果在智能穿戴领域的创新一直备受关注。Apple Watch经过十代迭代,已从一款简单的智能手表发展为功能...
DeepSeek同款GRPO训练大提速!魔搭开源全流程方案,支持多模态训练、训练加速和评测全链路
GRPO训练作为一种基于PPO算法的改进方法,近年来在强化学习领域引起了广泛关注。GRPO通过采样替代value model的方式,简化了训练过程,提升了稳定性和可维护...
机器人到来前,智能汽车可能是更早服务人类的 AI Agent
在智能化转型的浪潮下,汽车行业正逐步深入AI领域,探索如何将AI技术与汽车产品深度融合。2025年被视为一个关键节点,众多车企纷纷接入DeepSeek等AI模型,宣...
接入DeepSeek后的自由画布,做PPT还真的有点强。
百度文库最新上线的自由画布功能通过创新的多模态交互设计,显著提升了非演讲类PPT的制作效率。与传统AI工具的单线程问答模式不同,该工具采用白板式界面,支...
当AI遇上心理学:如何让AI的眼神更像人?|AAAI 2025
高瓴人工智能学院宋睿华团队与跨学科研究者合作开发的EyEar技术,成功实现了对人类视听同步场景下注视轨迹的预测。该模型通过结合物理启发的动力系统和多模态...
16G显存4499元起香爆!AMD RX 9070系列显卡震撼发布,游戏、AI性能狂飙
AMD在最新发布会上正式推出基于RDNA 4图形架构的Radeon RX 9000系列显卡,包含RX 9070和RX 9070 XT两款型号。这两款产品均搭载16GB GDDR6显存,配备重新设计...