十年前笔者读博士,为了做QTL定位,花了两年时间,做了四百多个标记,十万个SSR数据点。跑PCR及大板PAGE胶之辛苦十年之后仍历历在目。
最近几年,国内各大实验室逐渐开始过度到SNP标记,纷纷购入高端设备,大有不做SNP都不好意思出来混的架势。
那么相比SSR,SNP是不是更“高级”呢?请看笔者说来:
PCR技术实用化之前,早期的分子标记做起来比做SSR苦逼的多,又是杂交、转膜又是同位素又是胶片曝光冲洗,做一次没个三五天影子都看不到。PCR技术实用后,扩增DNA变得异常简单,按理来说做分子标记可以很简单了,但是这个时候,测序技术还是处在第一代阶段(Sanger测序法),获取生物的基因组序列非常昂贵,所以连设计个普通引物的参考序列都很难找。为了解决基因组研究的根本问题,多个国家合作,花了16年时间,终于在2000年完成了第一个人类基因组的测序,而第一个水稻基因组则到了2004年才完成(日本晴和9311)。
拿到了第一个参考基因组,并不代表做分子标记容易多少了。做标记得知道DNA多态性,一个参考序列没有多态性信息,怎么办?
于是SSR出来救场。SSR是简单重复序列,例如ATATATATATAT,CTCTCTCTCT这类,就像人说话结巴一样,一个词(重复单元,motif)重复很多次。而且和人说话结巴一样,DNA结巴了也容易犯错,复制的时候多说一个或者少说一个词(重复单元)很常见。在SSR区域,DNA插入缺失复制错误(InDel)特别容易产生,SSR成为了多态性热点区域代名词。所以在DNA序列缺乏的年代,大家都喜欢用SSR。
一个SSR位点最多能够有几十种等位基因型,信息量非常丰富,人的身份鉴定,只用13~16个STR(SSR)就能把全世界70亿人区分。SSR做起来也简单,一对普通引物进行PCR扩增,电泳分辨长度差异就行。
但是SSR的缺点也比较明显。一是基因组分布不够丰富,做图位克隆精细定位,SSR肯定就不够用。另外一个就是需要跑电泳进行检测,流程较复杂,耗时较长,影响检测通量。
于是SNP标记出现了。SNP基因组内分布广泛,比SSR至少高一个数量级,也可以像SSR一样做共显性。但是在21世纪之前,SNP检测还是非常麻烦的。因为SNP没有长度多态性,所以不能直接用电泳检测(虽然有人用非变性胶跑,但可靠性不好),酶切法虽然可以产生长度多态性,但是又是PCR又是酶切的又是电泳,很显然比SSR还复杂。
大家到处想办法,到了21世纪初,SNP的检测方法就已经不下30种。直到Taqman出现,SNP检测总算有了一个简单高效的高通量办法。PCR做完连PCR板都不用拿出来,扫描荧光,就能直接分辨SNP等位基因型了。
Taqman出现不算晚,距今X。但这X里,在农业领域,尤其是在我国农业领域很少应用。原因有两个,一个是太贵,另外就是没有足够的DNA序列去找可用的SNP位点。
先说序列的问题。自从DNA被证实是遗传物质之后,尤其是密码子规律被发现,中心法则提出,大家就一直在绞尽脑汁想办法测序。直到Sanger老爷子登场,测序才算是开始进入寻常百姓家。
Sanger老爷子是个测序大牛,两次获得诺贝尔奖都是因为测序,一次是蛋白质测序,一次是DNA测序。DNASanger测序法出现之前,已经有了化学降解DNA测序,不过没有办法实现自动化,极度难搞。Sanger法采用双脱氧核苷酸(ddNTP)进行随机终止DNA合成,再用电泳分辨测序。后来大家把四种ddNTP加上四种荧光,测序扩增完后放在毛细管电泳仪里进行全自动电泳检测,就产生了现在大家普遍看到的DNA测序荧光峰图,DNA测序终于可以自动化了。
不过测序还是通量太低。于是另一个大神出现了——JonathanRothberg。
JonathanRothberg开创了第二代测序技术(边合成边测序),发明了两种二代测序方法(焦磷酸测序法和COMS质子测定测序法),分别成立了454和IonTorrent测序公司,后来分别高价卖给了罗氏和赛默飞。虽然这两种技术在市场表现都远不如Illumina的Solexa技术,但绝对是诺奖级别的开拓性技术。
二代测序技术在近十年爆发,通量急速上升,价格则X落体下降。这个时候找个SNP就是分分钟的事,终于不用为找SNP发愁了。
可是Taqman虽然好用,但合成一对定制的荧光探针那是超级贵,早期一条得花好几千软妹币,一对没五千还拿不下来,到现在最便宜都还得近1千块钱,还不能100%保证好用。咱们这些干农业的,瞅着兜里那点碎银子,也只能羡慕医学的土豪在那“高端大气上档次”。
干农业的穷人们正在眼巴巴羡慕别人的时候。英国有一家Kbioscience的小公司正在用分子信标配合等位基因特异扩增法(ASP)做SNP检测服务。这个办法使用普通引物,不用定制合成荧光探针,所以标记开发成本很低。Kbioscience做着做着来了灵感,改良了荧光信标,申请了个专利叫KASP,再捣鼓了个ASP能力很好的DNA聚合酶,结果越做越好。于是被另一家做服务的英国公司LGC看上,2012年被其X并将KASP推向市场,从此之后在农业领域攻城略地。
KASP进入中国后,走得是高端大气上档次路线,试剂耗材及检测设备都超过了一般实验室的承受能力,但是为了早日用上这个好用的工具,大家还是愿意砸锅卖铁买买买,大有不求最好,但求最贵的气势。
可是,做SNP检测就必须用“高级货”吗?难道SNP生来就是“高级”的?
前文已经说过,SSR相比SNP,有等位基因丰富的优势,人类身份鉴定选择的STR位点,其信息量平均7倍于SNP。从这一点来说,SSR更“高级”。SSR检测也不是不可以用“高端大气上档次”的设备,全自动荧光毛细管电泳仪3730XL一台价值人民币三百万,跑一板电泳试剂耗材得上百元!可见SSR花起钱来并不LOW。
那么做SNP到底有没有平民路线?答案当然是肯定的!
采用终点荧光信号检测SNP的技术,不管是Taqman、KASP、Invader还是现在国产的PARMS,都可以用兼容SвS规格的荧光扫描设备检测,也就说能放进96孔或者384孔板,且能读取荧光强度的设备就行。当然如果是滤光片系统,需要配备FAM/HEX/ROX三色对应的滤光片,光栅系统则调至对应的波长即可。而荧光酶标仪以及大部分荧光定量PCR完全可以实现这个功能,并不是专有的“SNP检测设备”才能做。
SNP检测获得的三色荧光信号,采用FAM/ROX及HEX/ROX比值作为坐标值,做散点图并聚类就可以进SNP等位基因自动分型,因而用简单到用Excel就能进行数据分析,并不是必须用“高端”软件才能做。当然Excel并不是太方便,所以笔者为大家准备了SNPdecoder这个在线数据分析软件,大家可以在www.snpway.com登陆使用。
一个有SSR分子标记基础的实验室,花十几万买个酶标仪基本就可以顺利转换到SNP标记技术,或者直接用现有的定量PCR系统。如果觉得通量水平不够用,买一台手动或者半自动96道移液工作站,外加384的PCR系统,就是一个低成本高通量的解决方案。满打满算,一个平台也就三十万不到,不到一台“高端”设备的钱,耗材也可以用国产“低端”货,不用被老外收智商税。
从这一点说来,SNP本来就不是“高级货”,土八路一样可以玩得转。