期刊简介

               本刊创刊于1984年9月,是中华人民共和国卫生部主管,中国卫生信息学会(原中国卫生统计学会)和中国医科大学主办的全国性卫生统计专业学术性双月刊,是国内卫生统计专业的唯一学术性期刊和中国医学类中文核心期刊及国家科技部中国科技论文统计源期刊。本刊的任务是及时报道我国卫生统计学科的科研成果和卫生统计工作改革与卫生事业发展的信息。主要读者对象为各级卫生机构的卫生统计人员、卫生技术人员和高等医学院校卫生统计专业的教学和科研人员。                

首页>中国卫生统计杂志
  • 杂志名称:中国卫生统计杂志
  • 主管单位:中华人民共和国国家卫生和计划生育委员会
  • 主办单位:中国卫生信息学会 中国医科大学
  • 国际刊号:1002-3674
  • 国内刊号:21-1153/R
  • 出版周期:双月刊
期刊荣誉:中国学术期刊(光盘版)全文收录期刊期刊收录:北大核心期刊(中国人文社会科学核心期刊), 万方收录(中), 知网收录(中), JST 日本科学技术振兴机构数据库(日), 上海图书馆馆藏, 国家图书馆馆藏, 统计源核心期刊(中国科技论文核心期刊), CSCD 中国科学引文数据库来源期刊(含扩展版), 维普收录(中)
中国卫生统计杂志2017年第03期

三种块缺失数据处理方法的比较

林丽娟;董学思;赵杨;魏永越;戴俊程;陈峰

关键词:
摘要:跨平台组学数据(cross-platform-omics data)研究中,一组样本往往只在某些平台(例如蛋白组学、代谢组学等)上进行了测序分析,而另外一些样本在其他平台(例如,基因组学、蛋白组学等)上进行了测序,欲将不同平台的数据进行整合分析,则块缺失(block missing)是不可避免的.由于块缺失的缺失比例比较高,如果将含有缺失的观测全部剔除,仅对完整数据进行分析,则会损失大量信息,甚至无信息可用.传统上,常用的缺失数据处理方法是基于填补(imputation)的方法,包括单一填补法(如均值填补、回归填补、hot deck填补等)和多重填补法[1-2].然而这些方法适用于缺失比例不太高的情况,如果采用传统填补方法对块缺失数据进行填补,可能会导致估计偏差较大,或耗时太多,从而大大降低了统计分析的效率.如何处理这类缺失数据,将是跨平台组学大数据研究中急需解决的一个问题.