基于FSA的DNA重复体频率统计算法
 
陈聪[1] 韩建民[1] 贾洞[1] 辛德东[2]

关键词:有限状态自动机 DNA子序列 重复体频率 频率统计算法 最长公共子序列
 
主要内容:针对现有DNA重复体频率统计算法效率低、灵活性差等不足,基于字符串多模式匹配的有限状态自动机,构造DNA子序列比对自动机,利用KMP算法对自动机进行状态转移优化,由此提出一种高效的重复体频率统计算法。该算法通过对DNA数据库的线性扫描,得到每个DNA子序列在全局数据库中重叠与非重叠的重复体频率统计信息以及指定DNA序列集合的最长公共子序列信息。实验结果表明,该算法具有效率高、匹配精确、信息获取方式灵活、支持在线操作等优势。
 
《计算机工程》  2011,37(11).-184-186,189
全文下载请进入http://hightech.stlib.cn/tpi_1/sysasp/include/index.asp
仿站