标签:RL

强化学习之于 AI Agent,是灵魂、还是包袱?

自主决策能力被视为AI时代“新基建”的核心,而Workflow技术似乎无法实现真正的通用Agent。AlphaGo的问世标志着AI首次展示出非模板化、非规则驱动的智能行为,...