(通讯员:李婉君)7月16日(星期三)上午11:00,厦门大学方匡南教授应邀在我校北湖东校区数学与统计学院新楼216室作了题为“High-dimensional Covariate-aware Personalized Federated PU Learning”的学术讲座。本次讲座由数学与统计学院研究生院主办,数学与统计学院副院长杨凯教授主持报告会。数学与统计学院研究生和部分教师参加了此次报告。

报告人简介:方匡南,厦门大学经济学院统计学与数据科学系教授、博士生导师、耶鲁大学博士后,厦门大学统计学与数据科学系副主任、厦门大学信用大数据与智能风控研究中心主任。入选了国家高层次青年人才、福建省高层次人才A类等。兼任全国工业统计教学研究会副会长、中国商业统计学会市场调查与教学研究分会副会长、中国现场统计研究会大数据统计分会副理事长等。主要研究方向为经济管理统计、统计机器学习、金融大数据、健康医疗大数据等。共发表学术论文100多篇,其中在统计学和数据科学期刊Journal of the American Statistical Association, Journal of Machine Learning Research, Biometrics, Statistica Sinica, Bioinformatics, Journal of Computational and Graphical Statistics等发表论文50多篇,在经济管理期刊Journal of Econometrics, Journal of Business & Economic Statistics, INFORMS Journal on Computing (UTD24), International Journal of Forecasting,《经济研究》《统计研究》《管理科学学报》《数量经济技术经济研究》《世界经济》等发表论文50多篇。多份研究成果被中办、国办等采用或获领导批示。著有学术专著和教材等6部。主持了国家社科基金重大项目1项,国家自然科学基金项目4项,企事业横向课题30多项。获省部级以上科研成果奖9项,其中一等奖2项,二等奖2项。
报告题目:High-dimensional Covariate-aware Personalized Federated PU Learning
摘要:Customer records include only customers in default (positive samples) and rejected customers (unlabeled samples), or positive and unlabeled (PU) data, which is a common scenario in emerging financial institutions. However, building credit scoring models using multiple small sample PU datasets with high dimensionality poses significant challenges, especially in light of the privacy constraints associated with transferring raw data. To tackle these challenges, this paper introduces a novel methodology called Covariate-aware Personalized federated PU learning. This approach utilizes a fused penalty function to automatically divide coefficients into multiple clusters, while an efficient proximal gradient descent algorithm is introduced for model training, relying solely on gradients from local servers. Theoretical analysis establishes the oracle property of our proposed estimator. The simulation results show that, in terms of variable selection, parameter estimation, and prediction performance, our method is close to the Oracle estimator and outperforms the other alternatives. Empirical results indicate that our method can improve prediction performance and facilitate the identification of heterogeneity across datasets.

方匡南教授聚焦于解决联邦学习(Federated Learning)中高维数据、协变量依赖、个性化建模及正负无标签数据(PU Learning)的联合挑战。本次报告吸引了众多研究生参与,现场座无虚席,学术氛围浓厚。
方匡南教授的学术报告主题为高维协变量感知建模提供了新的思路,为帮助听众更好地理解,用信用风险管理的例子进行了解释。首先阐述了信用风险。信用评级、信用评分等基本概念,在数据维度,信用评分聚焦两类关键数据:不良客户(Bad customers)与优质客户(Good customers)数据。技术方法上,研究引入逻辑回归、支持向量机、深度学习等。方匡南教授的讲座带给了听众深深的震撼。在互动环节,朱教授还就研究生提出的专业问题进行了细致解答,现场交流热烈。
报告最后,方教授结合自身科研经验,为在座研究生提供了宝贵的学习建议。与会研究生纷纷表示,通过此次报告,不仅加深了对联邦学习重要性的认识,更对高维数据领域的理论基础有了更全面的理解。
初审:关迪
复审:杨凯
终审:王丹、王纯杰
数学与统计学院
2025年7月17日