Nature 子刊发表稳定学习新进展:面向多中心、大队列异质数据的「稳定」生存分析方法

Nature 子刊发表稳定学习新进展:面向多中心、大队列异质数据的「稳定」生存分析方法

 

文章摘要


【关 键 词】 Stable Cox生存分析多中心数据预后标志物泛化能力

崔鹏团队与国家蛋白质科学中心(北京)常乘团队在Nature Machine Intelligence期刊上发表了题为“Stable Cox Regression for Survival Analysis under Distribution Shifts”的研究论文,提出了一种新的Stable Cox模型,旨在发现稳定的预后标志物,以提高生存分析模型在多中心异质数据下的泛化性。该模型基于稳定学习理论,专注于学习协变量与输出之间的稳定因果关系,而非易变的相关性,从而在分布偏移场景下展现出强大的泛化性、可解释性和公平性。

生存分析领域面临的主要挑战之一是如何在多中心异质数据中找到稳定的生物标志物。现有的生存分析方法,如Cox回归模型,通常假设训练和测试数据具有相似的分布,但现实中这种假设往往不成立,导致模型泛化性和可靠性受到挑战。Stable Cox模型通过两阶段方法——独立性驱动的样本加权和加权Cox回归——来消除不稳定协变量与生存结果之间的虚假相关性,从而识别出稳定的预后标志物。

研究团队在肝癌、乳腺癌、黑色素瘤等癌症组学数据集以及肺癌、乳腺癌的临床生存数据上进行了广泛实验,证明了Stable Cox模型相较于其他方法在多个独立测试群体和子群体上的平均提升6.5%-13.9%的泛化能力。此外,Stable Cox学习得出的权重系数有助于发现潜在的组合标志物,并区分生存风险显著不同的亚型,对指导治疗决策和靶向药物研发具有重要意义。

该研究强调了在异质性数据中精确识别并具有高泛化能力的生物标志物的重要性,这对于实现疾病的早期准确诊断和满足社会对健康保障的需求至关重要。Stable Cox模型的提出,不仅提高了生存分析模型的泛化性,也为机器学习方法在医疗等关键领域的应用提供了稳定性和可靠性的新视角。

“极客训练营”

原文和模型


【原文链接】 阅读原文 [ 1956字 | 8分钟 ]
【原文作者】 AI科技评论
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

© 版权声明
“绘蛙”

相关文章

暂无评论

暂无评论...