期刊简介

               本刊创刊于1984年9月,是中华人民共和国卫生部主管,中国卫生信息学会(原中国卫生统计学会)和中国医科大学主办的全国性卫生统计专业学术性双月刊,是国内卫生统计专业的唯一学术性期刊和中国医学类中文核心期刊及国家科技部中国科技论文统计源期刊。本刊的任务是及时报道我国卫生统计学科的科研成果和卫生统计工作改革与卫生事业发展的信息。主要读者对象为各级卫生机构的卫生统计人员、卫生技术人员和高等医学院校卫生统计专业的教学和科研人员。                

首页>中国卫生统计杂志
  • 杂志名称:中国卫生统计杂志
  • 主管单位:中华人民共和国国家卫生和计划生育委员会
  • 主办单位:中国卫生信息学会 中国医科大学
  • 国际刊号:1002-3674
  • 国内刊号:21-1153/R
  • 出版周期:双月刊
期刊荣誉:中国学术期刊(光盘版)全文收录期刊期刊收录:北大核心期刊(中国人文社会科学核心期刊), 万方收录(中), 知网收录(中), JST 日本科学技术振兴机构数据库(日), 上海图书馆馆藏, 国家图书馆馆藏, 统计源核心期刊(中国科技论文核心期刊), CSCD 中国科学引文数据库来源期刊(含扩展版), 维普收录(中)
中国卫生统计杂志2016年第04期

基于正则化回归的组学数据变量筛选方法

谢宏宇;侯艳;李康

关键词:
摘要:近年来,随着各种生物检测技术的发展,医学研究中出现了各种高通量数据,如基因组、蛋白质组和代谢组学数据等,变量选择是生物标志物识别和建立分类模型的重要环节,由于高维组学数据中的绝大多数变量对分类并不起作用,并且存在多重共线性、模型过拟合等问题,传统的基于小二乘方法估计的线性回归并不适用于高维数据[1].在高维组学数据特征变量筛选过程中,由于变量数目很多,子集筛选方法计算量巨大,并可能由于选择不同的筛选准则导致筛选的结果有很大差异[2];维数缩减方法虽然能够避免计算量大的问题,但是由于模型中的变量不再是原始变量,模型的可解释性差;而正则化回归方法由于在解回归方程的过程中可以同时实现参数估计和变量筛选,且计算速度快,对变量数目没有限制,因此受到研究者的关注[3].这类方法不仅能够用于单一组学数据的变量筛选,同时也能拓展到多组学数据融合的情况,因此在实际中具有很好的应用前景.本文将对正则化回归方法及在高维组学数据中的应用做一综述.