4月20日,由经济学院统计学和数据科学系2019级在读博士生任蕊与其导师组导师方匡南教授、张庆昭副教授以及耶鲁大学马双鸽教授合作完成的论文“iSFun: an R package for integrative dimension reduction analysis”被Bioinformatics正式接受并在线发表。
Bioinformatics是学界公认的生物信息学国际重要期刊,也是我校认定的统计学国际A-期刊(国际一类)。该论文是由方匡南教授主持的厦门大学校长基金创新团队项目“健康医疗大数据中的统计方法及其应用”的阶段性成果。
降维分析在高维生物组学数据分析中有着非常广泛的应用,对于此类具有高维协变量但样本量小的数据,单一数据集的降维分析往往会产生令人不满意的结果。针对相同的研究问题,多个独立数据集的综合降维分析通过“借鉴”其他数据集的信息,同时求解多个模型,是一种有效的信息融合方法,优于单数据集和一些多数据集分析方法。该论文提出的一系列多源数据融合降维分析方法,并开发了相应的R软件包供读者直接使用(iSFun, https://CRAN.R-project.org/package=iSFun)。在这项研究中提及的整合降维分析方法包括整合稀疏主成分分析(Integrative Sparse PCA)、整合稀疏偏最小二乘分析(Integrative Sparse PLS)、整合稀疏典型相关分析(Integrative Sparse CCA)等,通过惩罚函数综合不同来源的数据集并考虑数据集间的异质性和同质性,结合基于量级或符号的惩罚,明确促进多个数据集稀疏结构间的相似性,最终识别不同数据集的重要变量并进行参数估计。数值模拟证实:和一些单数据集、多数据集降维分析方法相比,此类综合降维方法具有相似或更好的识别和估计性能。
厦门大学经济学院统计学和数据科学系2019级博士研究生,目前已在Bioinformatics、JMIR Public Health and Surveillance以及《管理科学学报》等期刊发表(含正式接受)论文3篇,并且多篇论文在Statistics in Medicine等期刊审稿。
厦门大学经济学院统计学与数据科学系教授、博士生导师、耶鲁大学博士后,国家社科基金重大项目首席专家、国际统计学会 elected member。主要研究领域为统计机器学习、高维数据分析、经济管理统计、健康医疗大数据等。入选国家级高层次青年拔尖人才、南强青年拔尖人才计划 (A类)、福建省“特支双百计划”青年拔尖人才、福建省新世纪优秀人才计划、福建省高校杰出青年科研人才培育计划等。兼全国工业统计学会常务理事,中国商业统计学会常务理事,《统计研究》《数理统计与管理》编委等。在国内外权威期刊共发表学术论文100余篇,著有学术专著和教材等6部。主持了国家社科基金重大项目1项,国家自然科学基金3项,以及教育部人文社科、国家统计局重大项目等10多项纵向项目。
厦门大学经济学院统计学和数据科学系、王亚南经济研究院双聘副教授,博士生导师,国际统计学会elected member。2008年获得华中科技大学数学与应用数学学士学位,2013年获得中国科学院数学与系统科学研究院概率论与数理统计博士学位,先后在中国科学院大学和美国耶鲁大学进行博士后研究。中国现场统计学会高维数据分析学会理事,全国工业统计学理事、中国青年统计学家协会理事等。主要研究方向为高维数据分析、多源数据融合、函数数据分析、统计机器学习等,发表论文50余篇,先后主持国家自科2项,教育部基金1项。