《计算机学报》文章摘要   全文下载
  文章题目重采样方法与机器学习
  作者毕华 梁洪力 王珏
  作者单位(中国科学院自动化研究所复杂系统与智能科学重点实验室 北京 100190)
  发表年份2009
  发表月份5期(862—877)
  文章摘要摘要 Boosting算法试图用弱学习器的线性组合逼近复杂的自然模型,以其优秀的可解释性和预测能力,得到了计算机界的高度关注.但Boosting只被看作是一种特定损失下的优化问题,其统计学本质未曾得到充分的关注.作者追根溯源,提出从统计学角度看待Boosting方法:在统计学框架下,Boosting算法仅仅是重采样方法的一个有趣的特例.作者希望改变计算机科学家只重视算法性能忽略数据性质的现状,以期找到更适合解决“高维海量不可控数据”问题的方法. 关键词 重采样;自助法;Boosting;机器学习 中图法分类号 TP18 DOI号: 10.3724/SP.J.1016.2009.00862