图像生成

DiT在数学和形式上是错的？谢赛宁回应：不要在脑子里做科学

近期，一篇在 X 上的帖子引发了关于 DiT 模型的讨论。博主称 DiT 存在架构缺陷，并附上论文截图，图中展示了 TREAD 方法在提升基于 token 的扩散模型骨干网络...

AIGC动态

4周前

Higgsfield AI是一家专注于AI视频生成的初创公司，曾与Meta探讨过潜在收购事宜但谈判已停止。该公司擅长电影级镜头控制技术，不断推出新功能和新模板，还整合...

AIGC动态

4周前

AI浪潮下，创业格局正发生深刻变革，小团队创业展现出强大的生命力和竞争力。「顶尖精益AI Native公司排行榜」罗列了40多家团队规模不大但营收可观的初创公司...

AI-Agent

4周前

当前专注AIGC领域，聚焦大语言模型发展、应用落地、市场研究及开发者生态。主流3D生成模型如DreamFusion、TRELLIS等虽能创建逼真整体形状，但产出的是缺乏内...

AIGC动态

4周前

长上下文大语言模型推动下游应用发展的同时，也带来计算和内存效率挑战。为应对这些挑战，围绕 KV 缓存的长上下文推理优化方法应运而生。1. 长文本大语言模型...

AI-Agent

4周前

预测性策略在机器人操作任务中能提升性能，但让世界模型预测机器人与物体交互的精确未来状态仍是挑战。国防科大、北京大学、深圳大学团队提出 LaDi - WM 模型...

AIGC动态

4周前

Figma在其设计平台集成AI，带来诸多变革与创新。非技术人员借助其AI功能，能在数小时内构建原型，部分代码精确到可让工程师直接投入生产，且设计师始终掌控最...

AIGC动态

1个月前

智谱AI与清华大学联合开源最新视觉大模型GLM - 4.5V，其在多个领域表现卓越。测试数据显示，GLM - 4.5V在42项主流测试中创造41项新记录，尤其在视觉智能体方...

AIGC动态

1个月前

Meta训练出70亿参数的「视觉巨兽」DINOv3，通过自监督学习（SSL）训练可生成强大且高分辨率的图像特征，在多个密集预测任务中超越专用解决方案，重新定义计算...

AIGC动态

1个月前

今天凌晨，全球社交、科技巨头Meta开源了最新视觉大模型DINOv3，其主要创新在于使用自我监督学习，无需标注数据，能大幅降低训练所需时间和算力资源。- 模型...

AIGC动态

1个月前