《计算机学报》文章摘要   全文下载
  文章题目分支合并对决策树归纳学习的影响
  作者王熙照 杨晨晓
  作者单位(河北大学数学与计算机学院 河北保定 071002)
  发表年份2007
  发表月份8期(1251—1258)
  文章摘要摘要 传统的决策树构建方法,由于其选择扩展属性时的归纳偏置,导致属性值较多的属性总会被优先选择,从而导致树的规模过大,并且泛化能力下降,因此需对其进行简化.剪枝是简化的一种,分为预剪枝和后剪枝.该文主要针对预剪枝中的分支合并进行研究.文中研究了分支合并对决策树归纳学习的影响;具体讨论了在决策树的产生过程中,选择适当的分支合并策略对决策树进行分钟合并处理后,能否增强树的可理解性,减少树的复杂程度以及提高树的泛化精度;基于信息增益,分析了分支合并后决策树的复杂程度,设计实现了一种基于正例比的分支合并算法SSID和一种基于最大增益补偿的分支合并算法MCID.实验结果显示:SSID和MCID所得到的决策树在可理解性和泛化精度方面均明显优于See5. 关键词 决策树归纳;归纳偏置;剪枝;分支合并;信息增益;增益补偿 中图法分类号 TP181