图像生成
图像,绘画
首个GPT-5视频Agent一句话即出整片!全流程代劳,0门槛当导演
一句话生成爆款AI视频的时代已经来临,全球首个接入GPT - 5的视频智能体Video Ocean正颠覆创作领域。在软件领域,Vibe Coding追求效率与创意的双重突破,这种...
AI智能体加持,爆款视频产出速度提升了10倍,全民导演时代已来
Vibe Coding 追求效率与创意的双重突破,这种范式正迁移到影像创作领域,形成 Vibe Filmmaking。Video Ocean 便是这一领域的创新应用,它带来了全新的影视创...
马斯克开源新模型:能实时抓取社交平台数据,20万块H100训练
马斯克宣布旗下大模型平台xAI开源去年最佳模型Grok - 2.5,并将在6个月内开源旗舰模型Grok 3。与其他同类大模型相比,Grok - 2.5的最强功能是可实时抓取社交...
谷歌手机十年最狠升级,全家桶AI宣战苹果!一句话P图,100倍变焦
谷歌在Made by Google 2025新品发布会上推出Pixel 10「全家桶」,包含Pixel 10、10 Pro、10 Pro XL、10 Pro Fold四款手机,正面狙击未发布的苹果iPhone 17。...
DiT在数学和形式上是错的?谢赛宁回应:不要在脑子里做科学
近期,一篇在 X 上的帖子引发了关于 DiT 模型的讨论。博主称 DiT 存在架构缺陷,并附上论文截图,图中展示了 TREAD 方法在提升基于 token 的扩散模型骨干网络...
图生视频新玩法刷爆外网:图上画两笔就能动起来,终于告别文本提示
Higgsfield AI是一家专注于AI视频生成的初创公司,曾与Meta探讨过潜在收购事宜但谈判已停止。该公司擅长电影级镜头控制技术,不断推出新功能和新模板,还整合...
AI 创业,小团队、第一天就出海,如何做到 500 万 ARR?
AI浪潮下,创业格局正发生深刻变革,小团队创业展现出强大的生命力和竞争力。「顶尖精益AI Native公司排行榜」罗列了40多家团队规模不大但营收可观的初创公司...
港大、哈工大、浙大发布可解耦创意3D模型
当前专注AIGC领域,聚焦大语言模型发展、应用落地、市场研究及开发者生态。主流3D生成模型如DreamFusion、TRELLIS等虽能创建逼真整体形状,但产出的是缺乏内...
长上下文不再难:KV Cache 全生命周期优化实战
长上下文大语言模型推动下游应用发展的同时,也带来计算和内存效率挑战。为应对这些挑战,围绕 KV 缓存的长上下文推理优化方法应运而生。1. 长文本大语言模型...
CoRL 2025|隐空间扩散世界模型LaDi-WM大幅提升机器人操作策略的成功率和跨场景泛化能力
预测性策略在机器人操作任务中能提升性能,但让世界模型预测机器人与物体交互的精确未来状态仍是挑战。国防科大、北京大学、深圳大学团队提出 LaDi - WM 模型...