报告题目:基于深度学习的生物信息学应用
报告时间:2023年5月10日 下午 13:30
会议链接:https://meeting.tencent.com/dm/NtEtRuGlEcP9
会议 ID:886-552-312
主办单位:科研处/数学与统计学院
主讲人:邓明华
邓明华简介:现任北京大学数学科学学院教授。1987年9月-1998年1月在北京大学数学科学学院学习,毕业后留校工作至今。2003年8月晋升为副教授,2006年任博士生导师,2009年8月晋升为教授。其间2001年2月-2003年8月在美国南加州大学计算分子生物学中心从事博士后研究,2009年8月-2010年1月美国耶鲁大学访问副教授。邓明华从事生物信息学研究,发表SCI论文90余篇。曾先后主持6项自然科学基金面上项目,1项数学天元基金项目和1项科技部863项目,先后参加3项科技部973项目和2项科技部重点研发项目。
摘要:本报告将汇报本课题组近期的几个研究工作,介绍深度学习在生物信息学上的应用,包括基于卷积神经网络(CNN)的序列模体发现(Motif finding)上的应用ExpectationPooling,基于自编码器的单细胞聚类方法scziDesk和单细胞注释方法scMRA。ExpectationPooling给出了CNN的统计理解,建立了CNN和EM算法的融合; scziDesk将数据的统计建模和自编码器的非线性降维相结合,实现对高噪声的单细胞数据进行聚类;scMRA考察细胞类型标签从多个参考数据到目标数据迁移问题,挖掘了不同细胞类型的结构关系,在实现目标数据精确标注的同时,能够有效去除不同数据之间的批次效应。