基于局部稀疏K近邻密度的主动学习
 
汪婵 程玉虎 王雪松

关键词:主动学习 信息熵 孤立点 K近邻密度
 
主要内容:在选择含信息量大的样本时,基于不确定度缩减的主动学习算法通常会将孤立点一并加入训练集,从而影响分类效果。为此,提出一种基于局部稀疏K近邻密度的主动学习算法,采用近邻密度来判定未标记样本是否为孤立点,并考虑未标记样本周边样本的稀疏程度,减少将非均匀分布样本集中的孤立点当作正常样本点及将正常样本点当作孤立点的错误。典型UCI和人工数据集上的仿真结果表明,与基于密度重排序的主动学习算法相比,所提算法能够取得较好的分类性能。
 
《中国科技论文在线》  2011,6(7).-507-511
全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp
仿站