《计算机学报》文章摘要   全文下载
  文章题目一种基于递归分类树的集成特征基因选择方法
  作者李霞1), 2) 张田文1) 郭政1), 2)
  作者单位1)(哈尔滨工业大学计算机科学与技术系 哈尔滨 150001) 2)(哈尔滨医科大学生物医学工程与生物信息学系 哈尔滨 150086)
  发表年份2004
  发表月份5期(675-682)
  文章摘要摘要 利用DNA芯片基因表达谱信息识别疾病相关基因,对癌症等疾病分型、诊断及病理学研究有非常重要的实际意义.该文提出了一种基于递归分类树的特征基因选择的集成方法EFST (Ensemble Feature Selection based on Recursive Partition-Tree).EFST可选择多组基于不同样本分布结构的特征基因,结合有监督机器学习中的多分类器集成(ensemble)决策技术,利用提出的衡量特征基因稳定性与显著性测度,集成各特征基因组选择最终的特征基因.应用结肠癌2000个基因的表达谱实验数据分析结果显示:EFST方法不仅具有寻找疾病相关基因的能力和较强的数据维数压缩能力, 而且由支持向量机(SVM)等4种模式分类方法证实EFST方法可以明显地提高疾病鉴别分类的准确率. 关键词 基因表达谱; 递归分类树; 特征选择; 集成决策 中图法分类号 TP391