标签:强化学习

刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习

新智元报道了一种新型强化学习框架StepCoder,由复旦大学、华中科技大学和皇家理工学院的研究人员共同提出。StepCoder旨在解决大型语言模型(LLMsCCCS);2) ...

Fine-tuning在垂直领域的最佳实践指南

摘要总结:本文介绍了深度学习和机器学习中的一个重要概念——Fine-tuning(模型微调)。Fine-tuning通常在预训练模型的基础上进行,通过在特定任务的数据集上...

机器狗界变形金刚来了:“人”狗之间灵活切换,可用前肢开门取物,瑞士团队出品

瑞士苏黎世联邦理工学院(ETH)推出了一款全新的机器狗,被誉为“机器狗界的变形金刚”。这款机器狗可以在爬行和直立两种模式之间灵活转换,具有很高的机动性和...

与人类贴身热舞!人形机器人进阶到街头耍宝,6华人组团出品

本文介绍了加州大学圣地亚哥分校(UCSD)全华人团队的最新研究成果,他们提出了一种名为ExBody的全身控制策略,用于人形机器人的全身控制。该策略主要训练机...

南大俞扬深度解读:什么是「世界模型」?

本文主要探讨了世界模型(world models)的概念及其在人工智能领域的重要性。世界模型是智能体对环境的内部表征,它在认知、推理和决策过程中起着关键作用。...

创新性3D数据合成模型,微软推出EgoGen

本文介绍了微软和苏黎世联邦理工学院研究人员共同开发的EgoGen模型,这是一个用于生成第一视角训练数据的工具,旨在解决AR/VR等设备在第一人称应用开发中遇到...
1 4 5 6