视频生成

视频,video

百度周末发布文心4.5和推理模型X1,已经两周年了啊。

百度最新发布的文心4.5和推理模型X1引起了广泛关注。文心4.5是一个原生多模态模型,能够理解音频、视频和图片,但不具备输出能力。相比之下,X1是一个推理模...

提前免费!百度连发两款模型,我们实测:能听歌看电影,还会蛐蛐人

百度近日发布了两款全新的大模型——文心大模型 X1 和文心大模型 4.5,标志着其在 AI 领域的进一步突破。这两款模型不仅在功能上各有侧重,还通过技术创新和优...

夸克你要这么变,我可真得说说你了

夸克最近推出了全面升级的AI超级框,标志着其在AI应用领域的进一步深化。这一功能不仅延续了传统搜索引擎的核心能力,还通过集成多种AI工具,实现了从单一搜...

蔡浩宇的“AI版米哈游”,预告了一款神秘游戏

米哈游创始人蔡浩宇在离开公司后,于硅谷创立了新公司Anuttacon,并推出了首款AI驱动的游戏《Whispers from the Star》。这款游戏于3月15日发布了首支预告片...

逐字生成非最优?试试逐「块」生成!Block Diffusion打通了自回归与扩散

扩散模型在生成图像和视频方面取得了显著进展,并在处理离散数据(如文本或生物序列)方面展现出潜力。与自回归模型相比,扩散模型具有加速生成和提高输出可...

CVPR 2025:长Prompt对齐问题也能评估了!当前最大AIGC评估数据集,模型评分超越当前SOTA

CVPR 2023年共收到13008份有效投稿,最终录用2878篇,录用率为22.1%。多模态相关内容仍然是今年研究的重点。上海交通大学-美团计算与智能联合实验室的论文被...

国产人形机器人破全球纪录!连续空翻一镜到底,量产3.99w起售

国产人形机器人N2展示了全球首个在室内外多场景下连续空翻的“一镜到底”视频,突破了以往单个镜头内仅能呈现一次空翻的限制。即便在复杂的户外环境中,N2依然...

出海应用也能享受高速稳定的DeepSeek-R1?亚马逊云科技出手了

DeepSeek-R1 作为生成式 AI 技术的核心,推动了新一轮 AI 技术的爆发,其强大的自然语言处理与推理能力为开发者提供了高性能、低成本的解决方案。然而,由于...

体验完夸克的AI超级框,我觉得他们有AI超级应用的雏形了。

阿里新推出的“新夸克”引发了广泛关注,其核心亮点在于深度思考模式和意图识别功能的引入。深度思考模式采用了阿里自研的Qwen大模型,而非市场上常见的DeepSee...

语音模型平台Cartesia获6400万美元,只需3秒克隆语音

语音模型平台Cartesia宣布获得6400万美元A轮融资,由Kleiner Perkins领投。同时,Cartesia推出了最新语音模型Sonic 2.0和Sonic Turbo,其中Sonic 2.0的语音克...
1 4 5 6 7 8 165