《计算机学报》文章摘要 全文下载 | |
文章题目 | 一种基于递归分类树的集成特征基因选择方法 |
作者 | 李霞1), 2) 张田文1) 郭政1), 2) |
作者单位 | 1)(哈尔滨工业大学计算机科学与技术系 哈尔滨 150001) 2)(哈尔滨医科大学生物医学工程与生物信息学系 哈尔滨 150086) |
发表年份 | 2004 |
发表月份 | 5期(675-682) |
文章摘要 | 摘要 利用DNA芯片基因表达谱信息识别疾病相关基因,对癌症等疾病分型、诊断及病理学研究有非常重要的实际意义.该文提出了一种基于递归分类树的特征基因选择的集成方法EFST (Ensemble Feature Selection based on Recursive Partition-Tree).EFST可选择多组基于不同样本分布结构的特征基因,结合有监督机器学习中的多分类器集成(ensemble)决策技术,利用提出的衡量特征基因稳定性与显著性测度,集成各特征基因组选择最终的特征基因.应用结肠癌2000个基因的表达谱实验数据分析结果显示:EFST方法不仅具有寻找疾病相关基因的能力和较强的数据维数压缩能力, 而且由支持向量机(SVM)等4种模式分类方法证实EFST方法可以明显地提高疾病鉴别分类的准确率. 关键词 基因表达谱; 递归分类树; 特征选择; 集成决策 中图法分类号 TP391 |