标签:视觉数据
扩散模型训练方法一直错了!谢赛宁:Representation matters
纽约大学的研究者谢赛宁及其团队提出了一种名为REPresentation Alignment(REPA)的表征对齐技术,旨在简化训练扩散Transformer的过程。该技术通过将预训练自...
想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速
摘要总结:Sora的创新:2024年,Sora的出现为文生视频研究者设立了新目标。其核心技术之一是将视觉数据转化为统一表征形式,结合Transformer和扩散模型,展现...