科学研究

学术讲座

当前位置: 首页 >> 科学研究 >> 学术讲座 >> 正文

数学与统计学院2025年系列学术活动第二十九场

发布日期:2025-10-22    作者:     点击:

(通讯员:刘文姝)20251021日下午1330,北京师范大学李高荣教授莅临长春工业大学数学与统计学院,针对大规模多重假设检验和错误发现率控制的问题,开展了一场专业且富有启发性的学术报告。本次报告由数学与统计学院承办,在北湖东校区数统新楼216进行,会议由数学与统计学院副院长杨凯教授主持,学院部分老师及研究生参加了本次学术报告会。

会议开始之际,由杨凯教授作为代表对李教授的到来表示感谢,并对李教授及其研究内容做了简单的介绍。

报告人简介:李高荣,北京师范大学统计学院教授,博士生导师,北京师范大学第十二届“最受本科生欢迎的十佳教师”。主要研究方向是非参数统计、高维统计、统计学习、纵向数据、测量误差数据和因果推断等。迄今为止,在Annals of Statistics, Journal of the American Statistical Association, Journal of Business & Economic Statistics, Statistics and Computing, 《中国科学:数学》和《统计研究》等学术期刊上发表学术论文120多篇。出版4部著作:《纵向数据半参数模型》、《现代测量误差模型》(入选“现代数学基础丛书”系列)、《多元统计分析》(入选“统计与数据科学丛书”系列,2023年荣获北京高校优质本科教材课件奖)和《统计学习(R语言版)》。主持国家自然科学基金、北京市自然科学基金和北京市教委科技计划面上项目等国家和省部级科研项目10多项。

报告题目:高维数据的统计建模以及多重假设检验和FDR控制

报告摘要:随着现代科学技术的迅猛发展,研究人员能够收集和分析前所未有的大规模高维数据集,如DNA和蛋白质结构的测试数据、气象和环境数据、经济金融数据等。近年来, 高维数据的统计建模和分析、以及多重假设检验问题已经成为统计学研究的重要课题之一,并在众多科学领域中得到了应用。本报告主要介绍一些高维数据的统计建模思想、方法和理论,以及重点介绍大规模高维数据集的多重假设检验,如何寻找一种统计规则来决定哪一些假设应该被拒绝,并控制犯错误的概率。重点介绍两类多重假设检验问题中第І类错误的度量准则:FWER准则和错误发现率(false discovery rateFDR)准则,以及几种错误率控制方法:Bonferroni校正方法、BH方法、knockoff方法和镜像统计量方法。

报告伊始,李高荣教授明确了大规模多重假设检验的核心场景与挑战。李教授指出,在DNA微阵列分析、临床实验、高维回归等领域,研究者常需同时检验成百上千个假设──例如在基因表达分析中,需对6033个基因分别检验其是否具有显著影响,传统单一假设检验方法易产生大量假阳性结果,如何平衡“错误发现”与“有效识别”成为核心问题。报告通过清晰的四象限分类表,界定了多重检验中的两类错误:U(错误发现/假阳性)与S(假阴性),并引出两种全局错误准则FWERFDR

在报告中,李高荣教授系统梳理了从传统到前沿的错误控制方法。李教授指出,经典的Benforonni校正虽能严格控住FWER,但其阈值随检验次数激增而急剧缩小,导致结果过于保守,难以检测真阳性信号。为突破此局限,引FDR的概念。李高荣教授详细讲解Benjamini-HochbergBH)方法,该方法通过构造检验统计量与p值,对p值排序,依据阈值公式来确定拒绝边界,从而实现FDR在独立性假设下的有效控制。同时,李教授也指出BH方法的局限性p值存在相关性时,控制效果会受影响,而Benjamini-YekutieliBY)方法通过引入调和级数修正项,可在任意依赖结构下实现 FDR 控制,为复杂数据提供了更稳健的解决方案。

接下来,李教授系统阐释了Knockoff方法的核心框架及其拓展。他指出,Knockoff方法通过构造合成变量,利用统计量的对称性来控制错误发现率(FDR),适用于特征数较少的情形;而模型-X Knockoff则突破了这一限制,可广泛应用于更复杂的模型。实验证明,在高维设定下,Knockoff系列方法在FDR控制精度与检验效能上均优于传统BH方法。此外,报告还介绍了镜像统计量和高斯镜像等新兴方法。它们无需依赖p值,仅通过数据分割或引入随机噪声来构造对称统计量,便可实现FDR的稳健控制,并在高维稀疏模型中展现出更卓越的变量识别精度。

在报告的最后环节,李高荣教授梳理了该领域的未来研究方向,包括高维非线性模型的FDR控制、复杂相关结构下的方法鲁棒性优化等,并分享了团队在《Journal of the American Statistical Association》《The Annals of Statistics》等期刊发表的相关成果,以及编写《统计学习(R语言版)》等教材的经验,为在场师生提供了理论学习与实践应用的双重指引。

报告结束后,参会人员踊跃提问,就感兴趣的问题与李教授进行了深入的讨论和交流。李教授对提出的问题进行了详细解答,并分享了自己的研究心得。本次学术交流会不仅拓展了同学们的学术视野,也激发了大家的学习热情。聆听报告的师生纷纷表示受益匪浅,将更加努力地学习和研究新的领域与方法。



初审:关迪

复审:杨凯

终审:王丹、王纯杰

数学与统计学院

20251021


下一条:数学与统计学院2025年系列学术活动第二十八场