成果发表|研究院王菲菲副教授团队在Computational Statistics & Data Analysis期刊发表论文
发布时间:2025-06-03浏览量:中国人民大学健康大数据研究院王菲菲副教授团队研究成果“Testing Sufficiency for Transfer Learning”在 Computational Statistics & Data Analysis接收发表。
现实数据中常常面临维度很高而样本量很小的问题。此时可以利用迁移学习的方法,借用另一个大数据集(源数据)的信息来帮助估计目标模型。本文提出了一种测试迁移学习充分性的方法,用于检验源数据中特征提取函数是否足够帮助目标模型,使得目标数据的特征信息已经被充分提取,不需要进一步探索。如果拒绝原假设,说明还有有用信息未被利用,需要进一步分析。本文在一定假设下推导了该统计量在原假设成立时的渐近分布,并在模拟数据和实际数据上说明了该方法的有效性。