一种新的无监督连续属性离散化方法
 
花海洋 赵怀慈

关键词:决策树 数值型属性 聚类区间 分类
 
主要内容:提出了一种基于聚类方法的无监督连续属性离散化算法,称为CAMNA(Clustering and Merging on Numerical Attribute)算法。CAMNA算法通过聚类过程将数值值域划分为多个离散区间,根据类分布的指导信息优化合并相邻区间,实现理想的离散方案。通过实验证明该算法在保持执行效率较高的前提下,离散结果更加合理,生成的决策树结构简单,获得较少的分类规则,分类准确率也有提高。
 
《计算机工程与应用》  2011,47(6).-208-211
全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp
仿站