显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Talk To Myself

Wubin's Bioinformatics Life

 
 
 
 
 
 
 
 

多重PCR引物设计 (2) ——平衡反应体系

2012-1-19 23:45:24 阅读1505 评论0 192012/01 Jan19

文 / 屈武斌 (quwubin@gmail.com)

多重PCR的一个关键点在于反应体系的平衡。即使多重PCR体系内每对引物的特异性都很好,在单重PCR测试中扩增效果也非常好,但到了多重体系中却经常出现某些目标产物扩增不出来的现象。原因就在于反应体系的不平衡,这种不平衡导致在前期的几轮反应中某些优势引物及其模板迅速扩增,获得大量的扩增产物,而这些扩增产物同时又是DNA聚合酶的良好抑制剂(SantaLucia, 2007)。所以,随着扩增产物的大量出现,聚合酶的聚合能力被越来越强烈的抑制住了,因此,前期处于劣势的引物及其模板,这时就更加举步维艰了,最终导致扩增产物量非常之小,以至于无法检测。正所谓"强者更强、弱者更弱"。而导致反应体系不平衡的因素很多,限于个人知识水平以及目前多重PCR引物设计理论发展的程度,这里列举我所知道一些因素:

非特异引物    如果引物与背景DNA有较多且结合能力比较强的结合位点,那么目的基因结合引物的机会就会受到竞争,从而影响扩增效率。 引物二聚体    包括引物间的二聚体以及引物自身所形成的发卡结构,还有一类是第三方DNA介导的二聚体,这些二聚体和非特异引物一样都会干扰引物与目标结合位点的竞争,影响扩增效率。不一致的最佳退火温度    多重PCR反应中不同的模板及其引物使用同一个反应体系,退火温度等都是一致的,因此在引物设计的时候就需要尽量保证各引物的

作者  | 2012-1-19 23:45:24 | 阅读(1505) |评论(0) | 阅读全文>>

多重PCR引物设计 (1) ——模板序列预处理

2011-12-30 12:50:32 阅读1514 评论1 302011/12 Dec30

文 / 屈武斌 (quwubin@gmail.com)

多重PCR引物设计,一个重要的方面在模板序列的预处理,处理好了后面的引物设计将事半功倍。

问题:假设我们要对6个模板(基因)序列设计6对引物,每对引物特异性的扩增特定的模板序列。针对这一问题,首先我们要设计6对引物,这6对引物要在一个体系中反应,因此彼此之间不能产生二聚体,最好它们的最佳退火温度相同,不能发生非特异扩增。

要实现上面的目标,比较复杂,这里先从最基础的来说,即模板序列的预处理,那么具体如何操作?为什么要进行这些预处理?

1. 过滤序列中的低复杂度区域(Low complexity region)

例如“GTAGTCAGTAGACNATGACNACTGACGATGCAGACNACACACACACACACAGCACACAGGTATTAGTGGGCCATTCGATCCCGA

CCCAAATCGATAGCTACGATGACG”,这段序列中有一段CA重复区域(红色表示),模板序列预处理时,一般需要将这段序列标记为N,这样引物设计程序在寻找候选引物的时候就会跳过这一段区域。

如果不过滤,则会带来非特异的问题,假如引物的3’端落在这一区域,那么引物的3’端将在这一区域有很多的结合位点,在引物与模板的反应中,会大大降低引物与模板杂交的效率。现在普遍认为引物3’端对引物的特异性起决定作用。

低复杂度过滤程序,可以使用BLAST+程序包中自带的dustmasker命令行程序。

作者  | 2011-12-30 12:50:32 | 阅读(1514) |评论(1) | 阅读全文>>

生物序列基本格式fasta格式的解析

2011-12-24 23:17:45 阅读801 评论0 242011/12 Dec24

文 / 屈武斌 (quwubin@gmail.com)

正常情况下,这是一个很简单的问题,因为Biopython中有现成的解析包。

当然,这里说的是非一般的情况。比如,如果我们所要解析的序列并非来自NCBI等标准数据库,而是由普通生物学者自己提供的数据,里面可能会存在各种很难想到的问题;或者我们有其他的需求。列举如下:

序列中有若干行空行>后面是空的(也就是说解析出来的id是None)只有>行(即注释行),没有序列行序列ID不唯一我们项目中仅仅需要一个序列解析的模块,而不需要一个庞大的Biopython包对解析速度的要求

以上的这些情况,是我们在开发MFEPrimer, MFEprimer-2.0, MPprimer, VizPrimer等项目中遇到的问题,作为在线免费供用户使用的生物信息学网站,在收集用户输入的引物序列时,不能保证用户的输入都像NCBI那样规范,所以有必要自己写模块来应付各种情况。

下面是我写的Python模块,代码很简单,因为fasta格式本身很简单。但是请注意,代码中没有处理ID不唯一的情况,并且逐个yield返回结果,而非一次性返回为结果列表,这对解析大容量数据库有利。

下载该脚本

作者  | 2011-12-24 23:17:45 | 阅读(801) |评论(0) | 阅读全文>>

VizPrimer:基于可视化基因结构的引物设计软件

2011-10-19 21:23:13 阅读746 评论0 192011/10 Oct19

见网址:http://biocompute.bmi.ac.cn/CZlab/VizPrimer//

Bioinformatics. 2011 Oct 20. [Epub ahead of print]

VizPrimer: a web server for visualised PCR primer design based on known gene structure.

Zhou YQu WLu YZhang YWang XZhao DYang YZhang C.

Source

Beijing Institute of Radiation

作者  | 2011-10-19 21:23:13 | 阅读(746) |评论(0) | 阅读全文>>

FASTA format

2011-5-10 17:01:15 阅读712 评论0 102011/05 May10

A sequence in FASTA format begins with a single-line description, followed by lines of sequence data. The description line is distinguished from the sequence data by a greater-than (">") symbol in the first column. The word following the ">" symbol is the identifier (unique required) of the sequence, and the rest of the line is the description (both are optional). There should be no space between the ">" and the first letter of the identifier. It is recommended that all lines of text be shorter than 80 characters. The sequence ends if another line starting with a ">" appears; this indicates the start of another sequence.

A simple example of four sequence in FASTA format (Note that the bold part should be unique):

作者  | 2011-5-10 17:01:15 | 阅读(712) |评论(0) | 阅读全文>>

查看所有日志>>

 
 
 
 
 
 
模块内容加载中...
 
 
 
 
 

日志分类

 
 
日志分类列表加载中...
 
 
 
 
 
 
 
日志评论
评论列表加载中...
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017

注册 登录  
 加关注