高维稀疏数据频繁项集挖掘算法的研究
 
闫珍[1] 皮德常[1] 吴文昊[2]

关键词:高维数据 稀疏数据 频繁项集 存储结构
 
主要内容:传统挖掘算法不适用于挖掘高维稀疏数据集。提出了一种针对高维稀疏数据的频繁项集挖掘算法FIHS。FIHS引入了一种新的数据结构用来存储频繁项集,该结构不但可以减少存储空间,而且可以降低计数代价。该算法只需扫描一次数据集,通过优化连接剪枝操作避免产生非频繁的候选项集,基于K-频繁项集使用"与"、"或"操作产生K+1-频繁项集,且数据结构易于维护。理论分析和实验表明,该算法用于高维稀疏数据集上具有挖掘速度快,存储空间少等优点。
 
《计算机科学》  2011,38(6).-183-186
全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp
仿站