针对测序平台特征的碱基质量值矫正方法、装置、电子设备和存储介质
 
CN202211638241.X  2022-12-20  发明申请

2023-2-3
 
  本申请公开了一种针对测序平台特征的碱基质量值矫正方法、装置、电子设备和存储介质,属于基因测序技术领域。该方法以原始双端测序数据为基础,提取read1和read2的重叠碱基,利用重叠碱基区分测序错误和非测序错误,并根据测序错误碱基所在的read朝向、测序循环数、测序方向的dinucleotide及测序仪给定的碱基质量值,将提取的重叠碱基划分成不同的bins,统计各特征bins下测序错误碱基并计算经验质量值,采用局部加权回归模型对特征bins内的RQS和EQS进行多项式拟合建模,并利用建立的模型对原始碱基质量值进行矫正。本申请能够区分测序错误和非测序错误,能够更准确的反映测序仪偏好,在此基础上建模矫正,能够全面提高碱基质量值的可信度。
 
仿站