| 基于Base64编码的垃圾图片过滤方法 |
| 陈雅芳 徐从富 |
| 关键词:垃圾图片 Base64编码 4-gram分词 支持向量机 |
| 主要内容:针对目前直接提取图片文本特征费时且分类准确率不高,以及使用图像属性特征过滤垃圾图片召回率低下等问题,提出一种快速有效的垃圾图片过滤方法。在使用4-gram切分Base64编码后的图片文本后,通过Binary特征将图片特征项表示为Binary向量,并训练支出向量机分类器来识别垃圾图片。实验结果表明,该方法不仅能够识别不同格式的垃圾图片,而且垃圾图片识别精确率、召回率和F1值分别可达99.85%、99.49%和99.67%。 |
| 《计算机工程》 2011,37(8).-194-196 |
| 全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp |