科研动态
张成教授最新研究成果被《Journal of the American Statistical Association》正式接收

北京大学数学科学学院、北京大学统计科学中心张成教授关于非二分演化树推断的自适应LASSO方法的论文“Non-bifurcating Phylogenetic Tree Inference via The Adaptive LASSO”被《Journal of the American Statistical Association》正式接收。《Journal of the American Statistical Association》是美国统计学会的会刊,是目前国际统计学界论文质量最高、覆盖领域最广、发行数量最多的国际顶尖学术期刊之一。


演化推断是现代分子演化生物学的重要内容。根据不同物种的基因测序数据和适当的概率演化模型,演化推断通过对演化树的重构来反演物种的进化历程。目前,演化推断已被广泛地应用于基因组流行病学(例如,对新冠病毒的变异追踪及溯源),保护遗传学,生态学,以及免疫学(例如,辅助疫苗设计与研发)等领域。


由于实际采样环境的复杂性以及某些研究对象(如病毒) 过快的进化速度,真实的演化历程可能违背经典的二分树结构而呈现出多分以及祖先抽样等非饱和结构。通过利用各种非饱和结构跟二分树枝长稀疏性之间的对应关系,本论文提出了一种基于自适应LASSO的简单易行的非二分演化树重建方法,并在理论上严格证明了方法的收敛性和拓扑一致性。


实验表明,具有拓扑一致性的自适应LASSO相对于普通LASSO可以更准确的检测出退化枝长。相比于当前使用的贝叶斯非二分演化树重建方法,自适应LASSO方法能够给出一致的退化枝长检测结果,同时更敏锐地捕捉较短枝长。


该论文共同第一作者Vu Dinh,特拉华大学数学科学学院助理教授。通讯作者Frederick A. Matsen IV,Fred Hutchinson癌症研究中心Associate Member。


Cheng Zhang, Vu Dinh and Frederick A. Matsen IV. (2020). Non-bifurcating Phylogenetic Tree Inference via The Adaptive LASSO. Journal of the American Statistical Association, to appear.