《计算机学报》文章摘要 全文下载 | |
文章题目 | 分支合并对决策树归纳学习的影响 |
作者 | 王熙照 杨晨晓 |
作者单位 | (河北大学数学与计算机学院 河北保定 071002) |
发表年份 | 2007 |
发表月份 | 8期(1251—1258) |
文章摘要 | 摘要 传统的决策树构建方法,由于其选择扩展属性时的归纳偏置,导致属性值较多的属性总会被优先选择,从而导致树的规模过大,并且泛化能力下降,因此需对其进行简化.剪枝是简化的一种,分为预剪枝和后剪枝.该文主要针对预剪枝中的分支合并进行研究.文中研究了分支合并对决策树归纳学习的影响;具体讨论了在决策树的产生过程中,选择适当的分支合并策略对决策树进行分钟合并处理后,能否增强树的可理解性,减少树的复杂程度以及提高树的泛化精度;基于信息增益,分析了分支合并后决策树的复杂程度,设计实现了一种基于正例比的分支合并算法SSID和一种基于最大增益补偿的分支合并算法MCID.实验结果显示:SSID和MCID所得到的决策树在可理解性和泛化精度方面均明显优于See5. 关键词 决策树归纳;归纳偏置;剪枝;分支合并;信息增益;增益补偿 中图法分类号 TP181 |