基于归一化向量的文本分类算法
 
钟将 孙启干 李静

关键词:文本分类 矩阵投影 向量空间模型 归一化向量
 
主要内容:基于归一化思想和矩阵投影运算提出一种文本分类算法。该算法综合考虑单个类别内的文档频率和词频,用于进行矩阵投影运算。将训练样例中表示文本特征的三维空间投影到二维空间上,得到归一化的特征向量,可有效地达到降低特征空间维数、提高分类效率和精度的目的。与kNN算法的对比实验表明,该算法在时间性能和精度上都有较大提高。
 
《计算机工程》  2011,37(8).-47-49
全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp
仿站