文 / 屈武斌 (
quwubin@gmail.com)
多重PCR引物设计,一个重要的方面在模板序列的预处理,处理好了后面的引物设计将事半功倍。
问题:假设我们要对6个模板(基因)序列设计6对引物,每对引物特异性的扩增特定的模板序列。针对这一问题,首先我们要设计6对引物,这6对引物要在一个体系中反应,因此彼此之间不能产生二聚体,最好它们的最佳退火温度相同,不能发生非特异扩增。
要实现上面的目标,比较复杂,这里先从最基础的来说,即模板序列的预处理,那么具体如何操作?为什么要进行这些预处理?
1. 过滤序列中的低复杂度区域(Low complexity region)
例如“GTAGTCAGTAGACNATGACNACTGACGATGCAGACNACACACACACACACAGCACACAGGTATTAGTGGGCCATTCGATCCCGA
CCCAAATCGATAGCTACGATGACG”,这段序列中有一段CA重复区域(红色表示),模板序列预处理时,一般需要将这段序列标记为N,这样引物设计程序在寻找候选引物的时候就会跳过这一段区域。
如果不过滤,则会带来非特异的问题,假如引物的3’端落在这一区域,那么引物的3’端将在这一区域有很多的结合位点,在引物与模板的反应中,会大大降低引物与模板杂交的效率。现在普遍认为引物3’端对引物的特异性起决定作用。
低复杂度过滤程序,可以使用BLAST+程序包中自带的dustmasker命令行程序。