期刊简介

               本刊创刊于1984年9月,是中华人民共和国卫生部主管,中国卫生信息学会(原中国卫生统计学会)和中国医科大学主办的全国性卫生统计专业学术性双月刊,是国内卫生统计专业的唯一学术性期刊和中国医学类中文核心期刊及国家科技部中国科技论文统计源期刊。本刊的任务是及时报道我国卫生统计学科的科研成果和卫生统计工作改革与卫生事业发展的信息。主要读者对象为各级卫生机构的卫生统计人员、卫生技术人员和高等医学院校卫生统计专业的教学和科研人员。                

首页>中国卫生统计杂志
  • 杂志名称:中国卫生统计杂志
  • 主管单位:中华人民共和国国家卫生和计划生育委员会
  • 主办单位:中国卫生信息学会 中国医科大学
  • 国际刊号:1002-3674
  • 国内刊号:21-1153/R
  • 出版周期:双月刊
期刊荣誉:中国学术期刊(光盘版)全文收录期刊期刊收录:北大核心期刊(中国人文社会科学核心期刊), 万方收录(中), 知网收录(中), JST 日本科学技术振兴机构数据库(日), 上海图书馆馆藏, 国家图书馆馆藏, 统计源核心期刊(中国科技论文核心期刊), CSCD 中国科学引文数据库来源期刊(含扩展版), 维普收录(中)
中国卫生统计杂志2016年第03期

基于AUC统计量的随机森林变量重要性评分的研究

张晓凤;侯艳;李康

关键词:
摘要:随机森林(random forest,RF)[1]是高维组学数据常用的分析方法,在进行判别分析时,同时能够给出变量重要性评分(variable importance measure,VIM).RF的变量重要性评分通常有两种,一种方法是通过变量值的置换计算其重要性,第二种方法是通过基尼(Gini)指数计算其重要性,由于置换法比Gini指数法具有更好的非偏倚性能,因此多采用置换法进行变量筛选[2-5].然而,当数据类别(标签)比例不均衡时,即收集到的数据在两类中的数目不相同,尤其比例相差较大时,基于错误率(error rate,ER)的置换法不能准确反映变量的重要性.为此,Janitza等(2013)提出基于AUC统计量的评价方法,能够克服类别间比例不平衡的影响[6].本文在简要介绍该方法的基础上,通过模拟实验和实例数据探索其适用性,并与传统的置换法进行比较.