期刊简介

               本刊创刊于1984年9月,是中华人民共和国卫生部主管,中国卫生信息学会(原中国卫生统计学会)和中国医科大学主办的全国性卫生统计专业学术性双月刊,是国内卫生统计专业的唯一学术性期刊和中国医学类中文核心期刊及国家科技部中国科技论文统计源期刊。本刊的任务是及时报道我国卫生统计学科的科研成果和卫生统计工作改革与卫生事业发展的信息。主要读者对象为各级卫生机构的卫生统计人员、卫生技术人员和高等医学院校卫生统计专业的教学和科研人员。                

首页>中国卫生统计杂志
  • 杂志名称:中国卫生统计杂志
  • 主管单位:中华人民共和国国家卫生和计划生育委员会
  • 主办单位:中国卫生信息学会 中国医科大学
  • 国际刊号:1002-3674
  • 国内刊号:21-1153/R
  • 出版周期:双月刊
期刊荣誉:中国学术期刊(光盘版)全文收录期刊期刊收录:北大核心期刊(中国人文社会科学核心期刊), 万方收录(中), 知网收录(中), JST 日本科学技术振兴机构数据库(日), 上海图书馆馆藏, 国家图书馆馆藏, 统计源核心期刊(中国科技论文核心期刊), CSCD 中国科学引文数据库来源期刊(含扩展版), 维普收录(中)
中国卫生统计杂志2015年第06期

基于大相关小冗余朴素贝叶斯分类器的应用

陈江鹏;彭斌;文雯;曾庆;唐小静;胡珊;文小焱;阙萍

关键词:最大相关最小冗余, 朴素贝叶斯分类器, 随机森林, 特征选择
摘要:目的 将基于大相关小冗余(maximum relevance minimum redundancy,MRMR)的朴素贝叶斯分类器(na?ve bayesian classifier,NBC)应用于基因表达数据并与经典NBC、随机森林(random forests,RF)进行比较.方法 采用Matlab与R软件编程,应用结肠癌与肺癌基因表达数据集,分别采用上述三种方法进行比较研究,使用10-折交叉验证方法估计经典NBC与RF的分类准确率.结果 应用MRMR-NBC分析结肠癌基因表达数据集显示,采用信息熵(mutual information quotient,MIQ)法,当特征m=11时分类准确率达93.55%;而采用信息差(mutual information difference,MID) 法时,当m=15时分类准确率达到95.16%.应用MRMR-NBC分析肺癌基因表达数据集显示,采用MIQ法,当m=14时分类准确率高达98.63%,而采用MID法时当m=12时分类准确率达到97.26%.而采用经典NBC分析结肠癌与肺癌基因表达数据时,分类准确率分别为66.67%、80.00%;RF在分析结肠癌与肺癌基因表达数据时,分类准确率分别为81.89%、77.62%.结论 MRMR-NBC能在仅有极少属性参与分类时,得到较高的分类准确率,优于经典NBC与RF.