新两类频繁项算法在网络流上的适用性评估
 
周骏[1,2] 陈鸣[1] 张佳明[3]

关键词:数据流 频繁项 基于计数的算法 基于略图的算法 网络流 适用性
 
主要内容:通过建立基于分组俘获文件产生网络流的模拟环境,对计数型算法和略图算法两类经典的频繁项挖掘算法的适用性进行验证,检验采用界标窗口查询模式的效果。实验结果表明,算法查全率不低于98%,与查准率和查询精度的相关性弱,与数据项的规模及数据流中频繁项分布的相关性强。略图类算法对频率的估算误差比较稳定,计数型算法则偏大。计数型算法的执行效率明显优于略图类算法。
 
《计算机工程》  2011,37(16).-24-26,35
全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp
仿站