2. 1决策树算法简介
随着数据挖掘技术的越来越广泛的应用, 决策树作为数据挖掘技术中一种分类问题的解决方
法也受到重视,正在被广泛的研究。约 20 年前,决策树这种数据挖掘技术的形式就己经和
现在非常相似了,算法的早期版本可以追溯到 20 世纪 60 年代 [1]。以后决策树归纳算法被广
泛应用到许多进行分类识别的应用领域。 这类算法无需相关领域知识, 归纳的学习与分类识
别的操作处理速度都相当快。 而对于具有细长条分布性质的数据集合来讲, 决策树归纳算法
相应的分类准确率是相当高的。 决策树也是分析消耗、发现交叉销售机会、 进行促销、 信用
风险或破产分析和发觉欺诈行为的得力工具。 采用决策树, 可以将数据规则可视化, 也不需
要长时间的构造过程, 输出结果容易理解, 精度较高, 因此决策树在知识发现系统中应用较
广。决策树的广泛应用使得对决策树生成算法也得到更多的研究, 生成决策树算