标签:深度扩展

强化学习也涌现?自监督RL扩展到1000层网络,机器人任务提升50倍

普林斯顿大学与华沙理工的研究表明,将对比强化学习(CRL)扩展到1000层可以显著提升性能,在某些机器人任务中性能提升高达50倍。这一发现挑战了传统观点,即...