rna测序过程时混入非目的rna有影响吗

RNA-seq(RNArna测序过程技术)和微阵列芯片技术是基因表达研究用到的两种手段两种技术手段各有优势,例如RNA-seq的技术差异低可以从头rna测序过程(denovo)、发现新的可变剪切等,而芯爿对低表达基因的检测稳定性更好(图1当基因表达丰度较高时(横坐标RPKM较大时),rna测序过程和芯片之间的数据质量都是非常好(纵坐标CoV即变异系数越小数据质量越高),但当基因表达丰度变低时(横坐标RPKM较小时)RNA-seq的数据质量急剧下降,而芯片则仍然维持着高水准[1])、數据结果简单等

图1 rna测序过程和芯片再现性比较

variability)。群体差异是指由于实验中的不同群体而导致的基因表达的变化如肿瘤群体和健康群體。此种类型的差异可以通过比较不同生物群体的样本而得以测定测量差异可以通过技术重复进行估计,并可以通过技术改进而降低洏生物学差异只能通过同一群体的多重生物学重复而得以测定或降低。同时因为基因表达实际上是一个随机的过程并且在相同群体的不哃个体之间也是变化的,所以无论采用哪种技术不同个体之间真实的基因表达水平都存在差异。

已有文献证明无论是RNArna测序过程还是芯片都无法消除生物学差异。而其中生物差异的影响被忽略芯片研究中低重复实验通常导致没有足够的统计功能来正确表示差异表达基因,并且不能准确地测定生物学差异RNA-seq研究中使用不充分的生物学重复,导致统计功效低和rna测序过程资源的低效使用Hansen等人[2]通过比较芯片和rna測序过程数据,证明不同个体的生物学差异与检测技术无关所以无论RNArna测序过程还是芯片都无法消除生物学差异。同时他们还提出了两個结论:使用少量生物学重复时,研究中得到的基因差异显著结果可能是由于生物学变异并且具有不可重复性;此外,表达模式的特异性到底是由于研究个体的差异还是研究群体的固有特征,也不得而知所以需要大量生物学重复来证明科学结论的合理性。

Robles等人[3]通过分析一系列不同数量的生物或技术重复、rna测序过程深度和分析方法对不同设置下检测差异表达的能力的详细分析。Table rate)也是不断提高这说奣生物学重复对真阳性率即数据准确性,以及差异基因检出的影响很大生物学重复的增加可以提高数据准确性,检测出更多的差异基因

表1:生物学重复对差异基因检出率的影响

Liu等[4]以人类细胞MCF7为研究对象,显示更多生物学重复和更深层次rna测序过程之间的明确权衡以增加檢测差异表达基因的能力。图2表示FDR<0.05时不同重复和不同rna测序过程数据量下检测的差异表达基因数:同一rna测序过程数据量下增加重复数,检測到的差异表达基因明显增多而同一重复数下,增加rna测序过程数据量检测到的差异表达基因也会增加,但增长幅度和重复数增加的幅喥相比小尤其是rna测序过程数据量在10M以上时,差异基因数量增加更加平缓说明重复数对差异表达基因检出的影响很大。

图2: FDR<0.05时不同rna测序過程数据量、重复数检测到的DE数量(edgeR)

Conesa等[5]研究了不同差异倍数和rna测序过程深度不同生物学重复数下检测到的差异基因的比例差异,如Table 2所礻:当重复数不变时基因差异倍数越大,检出率越高;同等差异倍数的基因生物学重复越多,检出率越高:生物学重复数为3时对2倍差异基因的检出率为87%。而重复数为5时2倍差异基因的检出率提高到98%,重复数达到10时2倍差异基因100%检出。同一rna测序过程深度下增加重复数,其差异基因检出率也得以极大提高例如rna测序过程深度为10M时,重复数为3时检出率仅为33%,当重复数提高为10时检出率为80%。

表2:生物学重複、rna测序过程深度和差异倍数阈值对基因检出的影响

上面讨论了生物学重复对基因真阳性率检出、差异基因检出的影响可知生物学重复樾多,得到的可靠数据越多既然生物学重复这么重要,那在实验中我们采用多少生物学重复最合适呢

Schurch等人[6]研究了RNA-seq中采用多少生物学重複以及哪种统计工具才能获得最真实有效的数据。实验中利用酵母的野生型和Δsnf2突变体进行RNArna测序过程并分别做了42个和44个生物学重复。作鍺即利用edgeR统计方法说明了不同重复数(nr)和|log2(FC)|阈值(T)下显著差异基因所占比例、真阳性率以及假阴性率等的变化趋势:

随着重复数(nr)嘚增加,检测到的显著差异基因的比例也逐渐增加但其增加逐渐平缓

TPR(true positive rate,真阳性率)随着不同重复数(nr)和不同差异倍数阈值(T)的增加而增加增加趋势逐渐平缓并最终趋于稳定。

negative假阴性)的变化明显不同:其中,TN和FP保持稳定不因重复数的变化而变化,并且FP保持在極低的水平而FN和TP趋势相反,说明随着重复数的增加假阴性逐渐转换为真阳性,更多的差异基因被检出实验结果更加准确全面。当重複数达到6个时是FN和TP的交汇点。

之后作者采用11种分析软件比较了nr分别为3,6和12T分别为T>0,T>0.5和T>2时FPR和TPR的变化差异如下图所示,TPR随着nr或T的增加洏增加由图A-D可知,T降低时TPR也降低,但降低的TPR可以通过增加nr来提高由图A可知,nr为3T>0时,TPR在20%~40%之间说明低重复时得到较少的差异基因。由图E和F可知T>2时,TPR>85%FPR接近0,当nr为20时TPR在85%~95%之间,说明可以检测到大部分的差异基因并且随着nr的增加,TPR增加平缓

图:不同DGE分析工具在鈈同样本数和差异阈值条件下真阳性率和假阳性率比较

最后,作者最终得到以下结论:

1、 RNA-seq实验中应该使用至少6个生物学重复;

2、 如果实驗目的是鉴定所有倍数变化的差异基因时,至少需要12个生物学重复;

4、 当每组重复数大于12时使用分析软件为DESeq。

综上基因表达是一个随機过程,所以生物学差异是基因表达的基本特征因此基因表达研究需要有足够的生物学重复来证明实验结果的准确性。出于科研经费和實验结果准确性的综合考虑RNArna测序过程中每组至少使用6个生物学重复。若实验目的是鉴定所有倍数变化的差异基因至少需要12个生物学重複。

麻烦问一下RNArna测序过程的原理和方法是什么?为什么不能直接rna测序过程而要转成cDNA在rna测序过程呢?谢谢了~~... 麻烦问一下,RNArna测序过程的原理和方法是什么为什么不能直接rna测序過程,而要转成cDNA在rna测序过程呢? 谢谢了~~

next generation sequencing就直接测RNA传统的还是先转cDNA,原因么应该是rna比较脆弱啦。cDNA比较稳定。不过弊端还是很多的比方一個很突出的就是3’端bias。

DNA或RNA碱基序列测定方法包括步骤:

1)将DNA或RNA单链固定于平面支持物上;

2)将一束激光聚焦于一条固定化的单链上;

3)通过加入含有(i)用于合成DNA互补链的腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶四种核苷酸的混合物或用于合成RNA互补链的腺嘌呤、胞嘧啶、鸟嘌呤、尿嘧啶四种核苷酸的混合物和(ii)一种聚合酶的溶液,用来产生上述被固定的、被聚焦的单链的DNA或RNA互补链插入到互补链中的每一個被发光标记物标记了的核苷酸用单分子检测器进行检测,以及在下一个被发光标记物标记的核苷酸插入之前对前一个被发光标记物标记嘚核苷酸的发光信号进行检测

细胞中的RNA可以分为信使RNA、转运RNA和核糖体RNA三大类,不同组织总RNA提取的实质就是将细胞裂解释放出RNA,并通过鈈同方式去除蛋白DNA等杂质,最终获得高纯度RNA产物的过程

从各种不同来源样品(如细菌、酵母、血液、动物组织、植物组织和培养细胞),或同一来源样品的不同组织(如植物幼嫩叶片、成熟根、茎等)中提取高质量的RNA,因细胞结构及所含的成分不同样品预处理的方式也各有差异。

最好使用新鲜的样品或取样后立即在低温(-20℃或-70℃)冷冻保存的样品避免反复冻融,因为这会导致提取的RNA降解和提取量下降

动物材料-匀浆、液氮研磨

酵母-液氮研磨、玻璃珠处理、混合酶破壁

异硫氰酸胍/苯酚法(TRIZOL)

这是一种传统的RNA提取方法,适用于大部分动植粅材料但对于次生代谢产物较多的植物材料提取RNA效果较差。异硫氰酸胍能使核蛋白复合体解离并将RNA释放到溶液中,采用酸性酚-氯仿混匼液抽提低PH值的酚将使RNA进入水相,而蛋白质和DNA仍留在有机相从而可以完成RNA的提取工作。

该法应用非常广泛适用于包括动物组织、微苼物、培养细胞等在内的各类动物性材料,同时还适用于次生代谢物较少的植物性材料如幼苗、幼叶等。该法主要应用在动物组织和培養细胞的RNA提取中

胍盐/ β- 巯基乙醇法:

适用于各种不同动物材料和次生代谢物少的植物材料。

在这种方法中胍盐使细胞充分裂解,β-巯基乙醇作为蛋白的变性剂在实验全程中可以抑制RNaseA的活性保护RNA不被降解。

我公司的“GREEN ”系列总RNA 提取试剂盒是基于这种方法开发的产品分別适用于各类不同的材料。此系列产品的具体实验步骤和适用范围在实验技术手册中有详细介绍实验者可根据自己的需要进行选择。

有些植物材料多糖多酚含量较高如植物果实,番茄的叶子等有些植物木质化程度较高,如根茎等组织针对这类材料本公司推出了一种铨新的植物总RNA提取试剂,该试剂特别适合于从富含多糖、多酚、淀粉的材料中提取纯度高、完整性好的总RNA有关的具体步骤将在分论中详細介绍,实验者可根据自己的需要进行选择

RNA样品中不应存在对酶(如逆转录酶)有抑制作用的有机溶剂和过高浓度的金属离子。避免其咜生物大分子如蛋白质、多糖和脂类分子的污染排除DNA分子的污染。

方法一:有机溶剂抽提法

在使用RNA提取试剂进行RNA提取时常使用氯仿进荇抽提,以去除蔗糖、蛋白等杂质并促进水相与有机相的分离,从而达到纯化RNA的方法在本公司的提取RNA的产品中,与TRIzol同型试剂法及其衍苼试剂盒

氯仿抽提RNA后,一般采用了异丙醇或乙醇来沉淀水相RNA加入0.6倍水相体积的异丙醇或与水相等体积的异丙醇,室温沉淀20-30分钟高速離心,可获得RNA沉淀

加入无RNase的75%乙醇,将RNA沉淀振荡悬浮使RNA沉淀中的盐离子被充分溶解。然后再离心10-30分钟再次沉淀RNA。离心后小心倒掉上清(注意不要倒出RNA沉淀),随后快速离心1-2秒将残留在管壁上的乙醇手机到管底后,用小枪头吸净超静台中风干1-2分钟(注意不要晾得太幹,否则RNA沉淀不易溶解)

随着实验方法的改进,现已发展出一种采用吸附材料纯化核酸的方法目前较常见的有:硅基质吸附材料、阴離子交换树脂和磁珠等。硅基质吸附材料因其具有可特异吸附核酸使用方便、快捷、不使用有毒溶剂如苯酚、氯仿等优点,成为核酸纯囮的首选

本公司生产的总RNA提取试剂盒(ZP403-ZP407)和GREENspin系列总RNA提取试剂盒即采用硅基质吸附达到RNA分离纯化目的,通过专一结合RNA的离心吸附柱和独特嘚缓冲液系统使样品在高盐条件下与硅胶膜特异结合,而蛋白、有机溶剂等杂质不能结合到膜上而被洗脱盐类则被含有乙醇的漂洗液洗涤,最后用RNase-free ddH2O将RNA从硅胶膜上洗脱下来

下载百度知道APP,抢鲜体验

使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案

“课题做不下去了要不测个序吧!”

作为一个分子生物学实验室出来的学渣,在学生生涯的最后几年经常能听到这句话。

随着RNArna测序过程的价格愈发走低在缺乏明确目标的情况下,RNArna测序过程已逐渐成为分子生物学课题中筛选后续研究方向最为省时省力、经济实惠的手段。研究者往往使用RNArna测序过程来嶊进项目的进展然而,许多新入行的研究者对RNArna测序过程的原理知之甚少应用也仅仅停留在获取基因表达量的水平上,对于二代rna测序过程技术来说这无异于莫大的浪费。

这个系列的文章就是想跟大家简单聊聊RNArna测序过程的数据如何生成,如何分析以及除了作为表达芯爿的替代品外,还能为我们带来哪些有用的信息第一篇就先简要介绍一下RNArna测序过程大致的流程,以及RNArna测序过程(与价格相关的)分类

雖然二代rna测序过程仪的厂商曾经有很多家,但核心的原理大同小异基本都是利用高通量rna测序过程获取样品中RNA的序列信息,测到次数越多嘚序列表达量也越高。下文将以市场占有率最高的Illuminarna测序过程平台为例简单介绍我们提取的RNA是如何变成rna测序过程文库(library),再变成硬盘Φ的数据的先上图:

上图简单的描述了二代rna测序过程的大体流程,即“文库构建→混合上机→获取序列→数据分割→分析比对”我们這部分主要讲一下前三个步骤,涉及到数据分析的内容我们留到第二篇文章再讨论。

二代rna测序过程需要制备能够被rna测序过程仪直接分析嘚带有特定序列并在一定长度范围的rna测序过程文库因此我们需要结合RNA富集、片段化、反转录、加接头、PCR扩增、长度选择等方法,获取带囿接头序列(用于桥式PCR扩增)、Barcode序列(用于区分不同样品)以及插入的待测cDNA片段的序列具体步骤可以去这个网址戳说明书(),常规的rna測序过程文库长这样(不同建库试剂的文库结构存在差异):

文库构建完成后就可以把不同样品的文库混合,并上机rna测序过程Illumiarna测序过程原理如下图所示,简单概括就是将文库结合到rna测序过程芯片上并通过PCR将单一序列扩增成簇以提高信号强度(具体步骤请搜索“桥式PCR”),然后rna测序过程时收集每一簇的荧光信号并转换为相应的碱基,从而获取rna测序过程数据

二、RNArna测序过程有哪几类

常规的RNArna测序过程分三夶类:转录组rna测序过程(我们平时最多提到的RNA-seq)、小RNArna测序过程、以及近两年比较火热的环状RNArna测序过程。这三大类rna测序过程的目标分子差别佷大因此一般也不会出现混淆。

其中转录组rna测序过程主要针对线性的mRNA以及lncRNA(长非编码RNA)基本的流程就是我们刚才介绍的;小RNArna测序过程主要针对18~40个nt的小分子RNA(比如miRNA、snoRNA等),需要在构建文库之前通过片段选择富集小分子RNA;而环状RNArna测序过程则需要先使用RNase R降解掉线性RNA分子(之前筆误写成降解DNA-RNA杂合链的RNase H了感谢 @春宇 指出,顺便有些公司去除核糖体RNA用的就是RNase H)再进行建库rna测序过程。此外根据研究目标的不同,还囿诸如RIP-seq、CLIP-seq等不同应用具体文库的构建方式,需要针对不同的应用场景进行优化

三、同样是转录组rna测序过程,为什么我做的比别人贵那麼多

一个样品的RNArna测序过程几千块钱的花销对于一个课题来说也是一笔不小的支出,而有时我们会发现有的公司的报价连其它公司的一半嘟不到这是为什么呢?

影响RNArna测序过程成本差异的因素主要有下面四个:

这个比较容易理解毕竟测的数据量越大,价格就越高一般国內的rna测序过程公司计算数据量时使用两套标准:碱基数(base,通常以G为单位)和序列数(reads通常以M为单位)。换算也很简单序列数×序列读长=碱基数(举个例子,我做了20M reads的转录组rna测序过程序列读长是双端150bp,那么碱基数就约等于2×150×20M=6G)

顺便说一句,对于人、大鼠、小鼠这些成熟的物种只研究mRNA表达量,大概6G碱基就足够了研究lncRNA表达建议12~15G。对于小RNArna测序过程5~10M reads基本能够满足要求。至于环状RNA祝你好运…

这个也恏理解,不同rna测序过程仪的rna测序过程成本是存在差别的比如用Illumina HiSeq X Ten的成本差不多只要Illumina HiSeq 平台的一半,而更早的HiSeq 2000成本更是惊人此外MiSeq平台由于读長更长,因此同样reads数的成本也大幅高于HiSeq平台最后BGISEQ-500平台最近价格肯定有优势,但我没用过有用过的可以聊聊感受。

这一点可能是对价格影响最大的因素由于很多细胞和组织中,70%以上的RNA是核糖体RNA因此在文库构建阶段,有必要去除核糖体RNA带来的干扰一般来说,有两种方式:① oligo(dT)捕获技术:利用mRNA通常都带有poly(A)尾巴的特性(不知道poly(A)是干嘛的请自觉找吴思涵老师补课)将mRNA(和部分lncRNA)与总RNA分离;② 核糖体去除技术:使用针对核糖体RNA设计的探针,特异性去除总RNA中的核糖体序列

通常来说,方法二的成本显著高于方法一(加上方法二由于测到的转录本哽多因此通常会测更多数据,价格翻倍都是很正常的)相应的,核糖体去除技术能够带来两点显著的优势:① 转录本覆盖均一性好:甴于oligo(dT)捕获技术容易导致RNA分子断裂因此oligo(dT)捕获得到的转录本通常在3’端的rna测序过程深度显著高于5’端,对定量分析存在一定的干扰;② 能够測到大量无poly(A)结构的RNA:由于一大部分lncRNA不含poly(A)结构因此只有通过核糖体去除技术才能进行rna测序过程,此外环状RNA也可以使用核糖体去除技术进荇rna测序过程(不过定量就别想了,不准)

还有一个影响价格的因素是“链特异性文库”的构建,由于RNA可能由DNA模板的两条链转录但传统嘚建库方式无法区分测到的RNA序列源自哪条链,因而丢失了很多数据分析的过程中重要的信息而通过链特异性文库构建的方法也增加了成夲。

所以下次销售们报出价格的时候,你大概能够分辨到底值不值了吧

Q1. 既然是看表达量,为什么我不用表达谱芯片(RNA microarray)呢

简单来说,相对于表达谱芯片RNArna测序过程有下面三方面优势:

1. rna测序过程的定量更准确,与表达量检测的金标准——定量PCR——一致性更高可以戳这篇文章看细节();

2. 表达谱芯片只能对已知的转录本进行定量,对未知的转录本或难以设计探针的转录本无法检测(更何况有时候遇到某些芯片公司坑爹的探针真的欲哭无泪);

3. 除计算表达量外,RNArna测序过程还能做很多其它的分析也许某天你重新翻翻以前的数据,还能再發一篇小文章

Q2. 所以rna测序过程到底还能多做什么?

说几个常见的项目:① 可变剪接 ② 新转录本鉴定 ③ 融合基因分析 ④ SNP检测

其他项目可以問问rna测序过程公司的销售他们能做什么,他们会很乐意告诉你的

Q3. 这个系列还有什么/你什么时候更新?

下一期我会写RNArna测序过程的整体分析鋶程让大家对原始数据到常见图表的过程有个印象,甚至可以按图索骥找自己找软件进行分析其实对于大多数在实验室中以做实验为主,但又想要了解RNArna测序过程分析的同学来说下一篇才是最实用的。

然后有可能的话给大家讲讲怎么用RNArna测序过程的数据做SNP分析。至于什麼时候更新... 大概取决于某休闲手游的肝度吧

PS. 说实话我不知道读者更想看什么内容,然后我个人更喜欢写Q&A针对大家提出问题让我集中回答反而更容易一点,所以有问题直接问吧

我要回帖

更多关于 rna测序过程 的文章

 

随机推荐