“概念表征”的搜索结果

可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案
本文由张俊鹏、任启涵、张拳石撰写,基于等效交互可解释性理论体系,深入探讨了神经网络在训练过程中概念表征及其泛化性的动力学变化。...
AI黑盒研究的突破性进展:Anthropic详解大模型的「思维」特征
Anthropic团队在理解人工智能模型内部运作机制方面取得了突破性进展。他们首次详细表征了大型语言模型Claude Sonnet中的数百万个概念,...