基因从头测序和重测序有什么区别?

基因从头测序也叫做基因de novo测序,是指不依赖于任何已知基因组序列信息对某个物种的基因组进行测序,然后应用生物信息学手段对测序序列进行拼接和组装,最终获得该物种基因组序列图谱。
重测序是指在已知物种基因组的情况下,对物种内的不同个体或某个个体的不同组织进行基因组重测序,可以在全基因组水平上发现不同个体或组织细胞之间的差异。

全基因组测序相对于全外显子组测序的优势是什么?

全外显子组测序捕获基因组的外显子区域,其基因组信息约占基因组大小的1.5%;全基因组测序对于全基因组层面来说,变异信息更全面,没有止步于编码区,而是向整个非编码区扩展,性价比更高,平均数据单价较全外显子组测序便宜了5倍以上。近些年非编码区突变的研究越来越多,其可与多种癌症在内的复杂疾病发生相关。

全基因组测序的测序深度如何选择?

测序深度根据研究目的、样本量及合作伙伴的预期而定。30×测序深度即可检测绝大部分SNV,但如果客户的研究目的是寻找癌组织中较大的结构变异、少数肿瘤细胞携带的丰度较低的突变,建议测序深度(一般)至少50×以上;群体重测序可以使用较低深度测序(~10×),用群体分析策略寻找相关变异。

全基因组测序技术适用的研究方向有哪些?

全基因组测序可以应用于孟德尔遗传病研究、复杂疾病研究、罕见病研究、新生突变研究、药物基因组研究、疾病分子分型研究、人群队列数据库构建及群体进化研究等。特别对于包括癌症、精神分裂症、智力障碍在内的复杂疾病,非编码区变异及CNV/SV结构变异皆与疾病的发生具有密切的关系,全基因组测序可以结合非编码区变异信息和结构变异信息全面挖掘致病突变位点。

FFPE样本为什么不推荐使用全基因测序?

FFPE样本提取的DNA多数存在降解的情况,基因组呈现片段化,CNV/SV等结构性变异检出的假阳性率较高,无法体现全基因组测序在结构变异检测方面的优势,且通过增加测序深度提高变异检出准确性的成本太高。

什么是SNP、InDel、CNV、SV?

单核苷酸多态性(single nucleotide polymorphism,SNP),个体间基因组DNA序列同一位置单个核苷酸变异(转换、颠换或缺失)所引起的多态性。SNP可作为基因组作图的标志。人基因组上平均约每1000个核苷酸即可能出现1个单核苷酸多态性的变化,其中有些单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关。单核苷酸多态性是研究人类家族和动植物品系遗传变异的重要依据。在研究癌症基因组变异时,相对于正常组织,癌症中特异的单核苷酸变异是一种体细胞突变(somatic mutation),称做SNV。

InDel指基因组上小片段(>50bp)的增加或缺失。

基因组拷贝数变异(copy number variation,CNV)指基因组中大片段的DNA形成非正常的拷贝数量。例如人类正常染色体拷贝数是2,有些染色体区域拷贝数变成1或3,这样,该区域发生拷贝数缺失或增加,位于该区域内的基因表达量也会受到影响。

染色体结构变异(structure variation,SV)是指在染色体上发生了大片段的变异,主要包括染色体大片段的增加和缺失(引起CNV的变化),染色体内部的某块区域发生翻转颠换,两条染色体之间发生重组等。

外显子测序适用于什么种类的研究?

外显子CDS区大小在人类基因中占1~2%,却包含85%的致病突变。外显子组测序主要针对编码区进行检测,所以主要适用于编码区潜在变异引起的疾病研究。外显子测序性价比高,尤其适合高深度、大样本量的测序,可找出常见突变及低频突变,主要应用在孟德尔遗传病及肿瘤等复杂疾病的研究。

外显子测序可以检测哪些类型的变异?

外显子捕获是一个杂交捕获的过程,探针与不同外显子区段的杂交效率并不相同,进而不同外显子区段的覆盖深度差异较大,因此通常外显子测序不能用于CNV的检测。但我们采用国际主流软件和长期优化的分析方法可以针对单个样本进行SNP、InDel和CNV变异检测。

使用的捕获平台是什么,有哪些优势?

我们使用的是Agilent SureSelect Human All Exon V6捕获平台,作为唯一一款单个样本捕获的液相杂交捕获平台,该产品汲取多个权威数据库(如RefSeq,OMIM_cds)的核心内容,具有更大的捕获区间,更高的捕获效率,保证外显子编码区的高覆盖率及SNP检出率。

外显子测序为何强调“有效测序深度”,与“测序深度”的概念有何区别?

首先明确两个概念:
测序深度:测序得到的总碱基数与目标区域大小的比值。
捕获效率:比对到参考基因组中目标区域的数据量占比对到参考基因组上总数据量的比例。
例如:若使用Agilent Sureselect Exome Kit V5,试剂盒的捕获范围为50M,测序得到500M数据量时,测序深度为500/50=10×;但是由于外显子试剂盒会有捕获效率,大约在60%以上,所以实际上目标区域数据量只有500M*60%=300M,目标区域测序深度 300M/50M=6×,称为target depth。

癌组织为什么要采用高深度测序?

相对于遗传病而言,肿瘤组织样品中突变位点的等位基因频率较低,一方面由于肿瘤细胞在肿瘤组织中的占比偏低,另一方面则由于癌症发展后期产生的突变仅存在于极少量的肿瘤细胞中,采用高深度测序可以尽可能全面的检测到与癌症发生发展相关的变异。通常推荐的外显子测序深度为,癌组织大于100x,癌旁组织/血液大于50x。

FFPE样本和ctDNA研究适合用外显子测序吗?

适合,FFPE样本和ctDNA由于样本自身的特性,存在DNA片段化、起始量不足等情况,高深度的外显子测序可以通过增加变异位点reads的支持数,提高变异检出的准确性。

全基因组甲基化测序有哪些优势?

在全基因组水平,单碱基分辨率检出甲基化位点,不仅能够高精度发现CpG岛等常见区域的甲基化水平的变化,还能够分析gene body区,基因间区等区域的甲基化水平的差异,分析甲基化对染色体的状态以及基因结构变化的影响,从多维度分析解决生物学问题。

全基因组甲基化的测序深度为多少?

为了进行全基因组水平的甲基化分析, 建议测序深度为物种基因的大小的30-50倍。

全基因组甲基化(WGBS)相对于其他甲基化测序的优势在哪?

目前DNA甲基化测序的主要有WGBS、MeDIP与RRBS,其中MeDIP无法达到单碱基甲基化的分辨率,而RRBS一般选择甲基化程度较高的区域进行分析,无法获得全基因水平的甲基化状态。

Input和IP样本之间的关系是什么?

Input和IP属于两个样本,在前期检测、建库、测序都是平行进行的,但是分析中需要将两个样本的测序数据进行整合分析,得出最终的peak结果,并进行后续分析。

Input是什么?有什么作用?

我们将DNA或者RNA片段化后,在进行免疫沉淀前,需要取一部分断裂后的染色质做Input对照(不进行免疫沉淀过程)。Input是断裂后的基因组DNA或者RNA,需要与沉淀后的样品DNA/RNA一起经过逆转交联,DNA/RNA纯化,以及最后的PCR或其他方法检测。通过后续数据分析,我们可以通过Input对照排除背景噪音(排除因本底表达水平高或一些非特异性结合所造成的假阳性peaks),验证染色质断裂的效果和整个实验中IP效果,所以Input对照是IP-seq实验必不可少的步骤。

阳性对照和阴性对照是什么?

阳性对照

一般用anti-RNA polymerase II抗体,因为RNA polymerase II是通用转录因子,在所有细胞中都能结合基因的核心启动子区,因此理论上,ChIP后PCR会有条带。一般阳性对照不进行测序。

阴性对照

阴性对照分为mock和Input两种,二者均能起到减少假阳性的作用。mock:用普通IgG为抗体,理论上不会ChIP下来任何DNA片段,因此作为阴性对照,但是由于非特异性结合,或者实验过程,没发生结合的DNA清楚不完全,可能会出现条带,但是一般条带亮度较弱。IgG不需要进行测序,只是判断IP试验中所选取的抗体是否特异。

转录组测序和DGE的关系是什么?

转录组和DGE主要的差别在于数据量和分析内容上,转录组的数据量较大,除了分析差异基因,还可以进行基因结构分析,而DGE就是数字基因表达谱,它的数据量较小,一般只分析差异基因,不能进行基因结构分析。

如何确定研究物种有无参考基因组?

根据所研究物种的拉丁文名,可在JGI(http://genome.jgi-psf.org/)、Ensembl(http://asia.ensembl.org/index.html)、NCBI(http://www.ncbi.nlm.nih.gov/)中搜索是否有该物种的基因组信息,也可在其他专门介绍某种物种的网站寻找参考基因组。

是否一定要求设置生物学重复以及重复次数?

目前没有生物学重复的实验发文章比较困难,尤其是IF≥5的杂志。文章投出之后,遭编辑质疑。如果确实受限于研究经费,无法设置生物学重复,那就得结合强有力的实验数据做支撑,比如定量实验、FISH荧光原位杂交或Northern blot等实验数据说服编辑。重复设置原则上越多越好,但是考虑到现实条件,重复设置≥3。一般不建议设置两个重复,因为如果两者结果不一致,我们无法确定以哪个数据为参考。

注:3个生物学重复,不等同于将3个样品的RNA等量混合后测序。3个样品等量混合测序,相当于将3个样本的基因表达量取平均值,其实就是相当于取了一个样本,由此得到的差异基因同样不可信,不能反应群体生物学现象。

真核核糖体RNA去除的话,去除率一般多高?和原核转录组去核糖体RNA的方法一样吗?

和原核去除核糖体的原理是一致的,现在去除真核生物rRNA的kit也主要是Ribozero公司的,针对特异物种。根据长期项目经验,绝大多数真核生物去除rRNA的效率大于90%。

共表达分析需要多少样本?

最少6个(不包含生物学重复),如果想要准确度高的话最少15个(可包含生物学重复)。

small RNA分析需不需要参考基因组?

需要,因为新miRNA的预测必须要通过其前体形成的二级结构进行分析,没有参考基因组,则无法知道其前体可能的二级结构。或者,退而求其次的办法,至少需要提供相应的参考转录组信息,以转录本作为参考序列用于small RNA的分析。

small 如何验证miRNA的表达量?

设计miRNA专门的发夹状反转录引物,定量PCR验证其表达量。

small 所有的物种small RNA都主要分布在20-24个碱基吗?

不是,这取决于物种和样品特性,有些样品就会在30nt左右表现出高丰度。

如果因为样本量不够,导致无法直接建库检测外泌体circRNA,那是否可以通过lncRNA的建库方法去解析circRNA?一般表达数据和差异能解析出多少条?

因为RNA量不足,可以利用去核糖体建库方法测序后解析circRNA,因提取外泌体的组织和方法不同,结果得到的外泌体circRNA数量差异较大,差异的数量是根据实验设计的分组或样本本身的差别决定的。

small 已知miRNA分析中,样品的首位及各位碱基的偏好性统计图可以说明什么?

miRNA前体发育为成熟体的过程是由Dicer酶酶切完成,酶切位点的特异性使得miRNA成熟体序列首位碱基对U具有很强的偏向性,而对G却排斥,但第二到四位缺乏U,一般来讲,除第四个碱基外,其他位置通常都缺乏C。

small RNA测序完成后如何进行实验验证?

sRNA后续实验验证的方法有很多:

1.qPCR,验证microRNA的表达;

2.RIP-seq,通过RIP技术富集得到具有甲基化修饰的RNA或与目的蛋白特异结合的RNA, 对富集得到的RNA进行高通量测序,与基因组进行比对分析,获得microRNA上与目的蛋白特异结合的位置信息等;

3.荧光素酶报告系统;

4.过表达载体的构建或目的基因的敲除。

为什么lncRNA要测链特异性文库?

测序过程中保存了RNA方向信息,一方面可以使基因表达定量更为准确;另一方面能够准确区分转录本来自于基因组的哪条链,可以更好地鉴定antisense lncRNA。

lncRNA测序对比芯片方法有哪些优势?

 与芯片方法相比可以增加novel lncRNA的预测;另外还可选择特异富集的lncRNA。

用芯片技术和用二代测序技术分析circRNA有什么区别?

芯片技术只能检测已知的circRNA,而且噪音信号比较大,现在对circRNA的研究相对较少,对circRNA的注释不全面;另外,circRNA的表达具有很强的时空特异性,我们又难以保证实验处理条件下获得的数据和数据库中收录的数据吻合,因此可能丢失大量特异表达的circRNA;二代测序技术使用先进软件对样本中circRNA进行筛选,不仅能分析已知的circRNA,更能获得新的circRNA,进一步丰富对circRNA的研究。

circRNA过表达构建载体有哪些需要注意的?

构建circRNA载体需要有成环序列,还要有必要的促进成环序列,如长的临近序列。

转录组测序都能做哪些分析,有哪些个性化的分析内容?

转录组测序包括mRNA测序,lncRNA测序,circRNA测序和miRNA测序;以上测序除了可以对基因/转录本表达定量、筛选差异表达基因、功能通路富集分析外,mRNA和lncRNA测序还可以进行转录本层面分析,可变剪切分析,新转录本预测等。以上转录组测序可以联合进行ceRNA分析。

去除rRNA链特异性建库,与去除rRNA线性消化链特异性建库的优缺点?

(1)去除核糖体,构建去rRNA文库,在此基础上使用生物信息学方法预测circRNA

优点:不需要使用RNase R减少部分实验消耗,可以同时研究mRNA, lncRNA, circRNA。

缺点:只能研究部分高表达的circRNA,无法大规模检测,需要较高的测序数据量准确度差。

(2)去除核糖体,使用RNase R去除线性RNA

优点:circRNA检出量高, 是第一种方案的20倍circRNA鉴定准确度高。

缺点:由于消除了线性RNA,mRNA,lncRNA与circRNA表达水平将会失真。

想从头研究ceRNA的调控网络,需要如何制定测序方案?

一般如果想深入研究整个ceRNA网络的话,需要mRNA、lncRNA、circRNA、miRNA测序的数据。因此相应的测序方案可以选择全转录组测序(只去掉核糖体RNA, 解析mRNA + lncRNA + circRNA)+ miRNA-Seq, 或者也可以选择全转录组测序(只去掉核糖体RNA,只解析 mRNA + lncRNA)+ circRNA-Seq(加入RNase R 去掉线性RNA) + miRNA-Seq 的方案。

什么是ceRNA?

一些非编码RNA,如lncRNA和circRNA等会竞争性地结合miRNA,导致miRNA调控的靶基因发生变化。这类新型的非编码RNA除了具有转录前调控等功能外,一个重要的功能就是像海绵一样对miRNA有吸附作用。这种具有miRNA吸附作用的RNA,我们称作内源性竞争结合RNA(Competitive endogenous RNA, ceRNA)。

测序的碱基的准确度用什么表示,在多少是一个能够接受的范围?

碱基的测序质量值 Q 和此碱基出错的概率 Pe 相关。公式:Q = -10 lg( Pe ) 二代测序中,每测一个碱基会给出一个相应的质量值,这个质量值是衡量测序准确度的。20代表碱基错误率为1%,30代表碱基错误率为0.1%。Q20和Q30表示质量值≥20或30的碱基所占百分比。若总计1G的数据量,其中有0.9G的碱基质量值大于或等于20,那么Q20为90%。 一般要求Q20大于90%,Q30大于80%。

做完测序后续还需要做哪些实验?

测序分析完成后,客户根据结果挑选目标基因或目标位点进行验证,验证符合后可以进一步做扩大样本验证和功能实验。

如果需要从血浆中分离外泌体,可以使用肝素或EDTA管去收集血液样本吗?

不可以。肝素将会大大损害接下来的RNA实验。EDTA也许会干扰PCR 实验。使用无肝素无EDTA管去收集血液样本。立即离心样品收集血浆用于exosome分离。如果必须使用抗凝剂,用EDTA管收集血液。如果有必要的话在接下来的PCR反应中调整Mg++的浓度。

细胞培养过程中的死细胞是否会影响外泌体的分析?

会的。在收获细胞时,应确定死亡细胞占所有细胞5%以下。细胞死亡过程中会释放大量大小不等的囊泡,细胞最终会裂成碎片,它们在exosome的纯化过程中会污染活细胞产生的exosome。

样品在exosome (外泌体)提取前是否可以冻存?

可以。血样、尿样、体液等,需要攒齐了一起提取,或者同一个患者的样本多次提取。冻存前,首先要离心去除细胞和血小板,再将样品分装冻存于-20或-80℃。但如果有条件最好还是用新鲜样品立即进行提取。

exosome(外泌体)提取后是否可以冻存?

可以。使用硅化E.P.管或冻存管,减少exosome的粘附。Exosome能够承受反复冻融,但我们仍建议分装,避免多次反复冻融。对于一些功能性实验,建议不要冻存,直接使用新鲜提取或保存在4℃悬浮于PBS 中的exosome。

PCR和QPCR有什么区别?

① 荧光定量 PCR (QPCR)能够实时监测 PCR 反应的全过程,对每一个循环进行定量定性分析;而普通 PCR 只能对反应的终产物进行半定量定性分析。
② QPCR 的结果分析可以直接通过电脑读出,而普通 PCR 的结果必须通过下一步的电泳条带分析。

绝对定量和相对定量有什么区别?

荧光定量有两种定量类型,分别为绝对定量和相对定量。这两种定量方法的不同点在于:
       目的不同:绝对定量的目的是测定目的基因在样本中的分子数目,即通常所说的拷贝数;相对定量的目的是测定目的基因在两个或多个样本中的含量的相对比例,而不需要知道它们在每个样本中的拷贝数;
实验方法不同:绝对定量必须使用已知拷贝数的标准品,必须做标准曲线;而相对定量可以做标准曲线,也可以不做标准曲线,仅利用Ct值的不同来分析实验结果。

绝对定量和相对定量怎么选择?

绝对定量的标准曲线法和相对定量的比较Ct法是我们最擅长的两种实验方案。不论哪种方案,我们均采用染料法(即SYBR Green I)作为检测方法。
标准曲线法,将标准品稀释至不同浓度,作为模板进行PCR反应。以标准品拷贝数的对数值为横坐标,以测得的CT值为纵坐标,绘制标准曲线,对未知样品进行定量时,根据未知样品的CT值,即可在标准曲线中得到样品的拷贝数。
比较Ct法,也就是2^(-△△CT)法。其中△△CT=(待测组目的基因Ct值-待测组内参基因Ct值)-(对照组目的基因Ct值-对照组内参基因Ct值),因此,2^(-△△CT)表示实验组目的基因的表达相对于对照组的而变化倍数,使用这一方法可以直接得到目的基因相对于内参基因的量。比较CT法的优点是不需构建标准品,节省时间、试剂,缺点是必须确定待测基因和看家基因的的扩增效率,效率接近时结果才可靠,否则结果不能用。

为什么要做3个平行孔?

严谨的生物学实验,通常要求3个技术重复,而3个平行孔就是三个技术重复,是为了便于后期的生物学统计分析。

内标法和外标法哪种更可靠?

同样可靠。

内标的优点在于目标基因与管家基因的反应条件最接近一致,缺点在于目标基因与管家基因的引物和探针相互之间会发生竞争与抑制,导致它们的 PCR 效率有差异。

外标的优点在于目标基因与管家基因的引物和探针之间没有发生竞争与抑制的机会,但是不同管之间的反应条件差异比同管的要大,也会导致它们的 PCR 效率有差异。两相比较,内标法与外标法的数据精确度是一样的。

Ct值偏大

可能的原因是:

  1. 特殊样本:比如血清,血浆,外泌体,石蜡等。
  2. 对于基因表达丰度很低的基因,也容易呈现CT值偏大的现象
  3. cDNA稀释倍数过大,导致起始上样量浓度过低。
  4. 扩增效率低:反应条件不够优化。设计更好的引物或探针;改用三步法进行反应;适当降低退火温度;增加镁离子浓度等。反应体系中有 PCR 反应抑制物:一般是加入模板时所引入,应先把模板适度稀释,再加入反应体系中,减少抑制物的影响。
  5. PCR 各种反应成分的降解或加样量的不足。
  6. PCR 产物太长: 一般采用 80~150 bp 的产物长度。

数据处理时判断数据是否能用的标准?

定量PCR数据的处理要求数据满足下面两个主要的条件:扩增曲线平滑,熔解曲线单一

例如:如果熔解曲线为双峰,表示为出现非特异性扩增,则其对应的数据不可用。当满足上述条件后,还要考虑数据的重复性,这个重复性的好坏要用STDEV来衡量,STDEV<0.5,表示这三个数据的重复性可以接受;如果大于0.5,而且三个数据中又有一个数值异于其他两个值,可以剔除这个异常值,然后重新计算STDEV,如果小于0.5,则可以只将两个数值进行计算,如果大于等于0.5,则考虑重新进行实验。

熔解曲线出现双峰甚至多峰?

可能原因是:

  1. 引物设计不够优化–与阴性对照的熔解曲线比对可判断是引物二聚体或是非特异性扩增的影响。相应的调整引物设计,避免引物二聚体、发夹结构或非特异性扩增的出现。
  2.  引物浓度不佳–适当降低引物的浓度(200-250 nM为宜),并注意上下游引物的浓度配比。
  3. 镁离子浓度过高–适当降低镁离子浓度,或选择更合适的预混试剂盒。
  4. 模板有基因组的污染–适当降低镁离子浓度,或选择更合适的预混试剂盒。

RNA中有DNA污染,怎么处理?

  1. 若是基因组DNA的污染,可使用DNaseI处理RNA; 同时设置没有逆转录的对照组反应检测DNA污染。
  2. 若是受到外源DNA的污染,可使用抗气雾剂和UDG酶。
  3. 跨内含子设计引物,排除基因组的干扰。

如何提高RNA的质量?

确认RNA质检的标准:RNA的质量包括两个方面:样品的纯度和完整性。RNA纯度一般用NanoDrop测量吸光值的方法进行检测,要求A260/280约在1.9~2.1之间,A260/230大于2。用凝胶电泳检测RNA的完整性,电泳图显示出清晰明亮的28S和18S条带。有Agilent 2100/4200 Bioanalyzer的实验室可以选择用测量RIN值的方法来进行检测,要求RIN值大于等于7。

提高RNA的质量就要从纯度和完整性两方面进行提高。里面有许多需要操作的细节,无法一一列出,但一般情况下,严格按照试剂盒的操作说明书进行操作,即能提取出质量较好的RNA。

有一个比较关键的注意点:提取RNA的操作环境、所有器材需保证没有RNA酶污染,且操作过程最好在冰上操作。

无反转录酶,对照RNA仍有扩增结果?

  1. 体外转录时不可能将所有的DNA模板消除,因而对照组会含有痕量的DNA。建议可将第一链cDNA稀释1:10、1:100、1:1000倍以消除DNA污染造成的影响。
  2. 可能是引物二聚体的条带。

基础参数的如何优化?

  1. Mg2 + 的浓度 一般来说,对以DNA 或cDNA 为模板的PCR 反应,应选择2~5mM 浓度的Mg2 + ,对以mRNA 为模板的RT – PCR 而言,则应选择浓度为4~8mM。
  2. 模板的浓度 如果研究者是进行首次实验,那么应选择一系列稀释浓度的模板来进行实验,以选择出最为合适的模板浓度。基因组DNA 的模板浓度在5pg~50ng 之间选择,质粒DNA 在106 拷贝数左右选择。一般而言,使Ct 位于15~30 个循环比较合适,若大于30 则应使用较高的模板浓度,如果Ct值小于15 则应选择较低的模板深度。
  3. PCR 抑制剂 通常用于消除抑制子的办法是将样本进行稀释,但是在某些条件下,抑制子的浓度高,而模板量少,稀释法就不再能达到好的效果,反而会使反应的敏感度降低,所以,研究者若要进行实时定量PCR 研究,最好选用纯化的模板。
  4. 引物的浓度 引物浓度太低,会致使反应不完全,若引物太多,则发生错配以及产生非特异的产物的可能性会大大增加。对于大多数PCR 反应,0. 5μM 是个合适的浓度,若初次选用这个浓度不理想,可在0. 3~1. 0μM 之间进行选择,直至达到满意的结果。
  5. 退火温度 首次实验设置的退火温度应比计算得出的Tm 值小5 ℃,然后在1 ℃~2 ℃内进行选择。一般退火温度要根据经验来确定,这个经验值往往同计算得到的Tm 值有较大的差距。对于定量PCR实验而言,60℃是实验非常常用的退火和延伸温度。

如何减少 RNA 模板中的二级结构?

  1. 将 RNA 和引物在不含盐及缓冲液条件下变性、退火,提高逆转录反应温度;
  2. 温度超过60°C时,不能使用oligo(dT)引物,选择一个在反应温度可以退火的 GSP;
  3.  RT-PCR 产物的长度超过 1kb时,反应温度需保持在 65°C。

现在都是用mix了,主要影响因素就是引物和模板了,经常碰到一对基因不同模板有的溶解曲线好,有的曲线不行,苦恼。

正如你所问,影响溶解曲线的主因是引物和模板,对于相同的引物,而因扩增不同模板而有所差异,这就归因于模板的影响了。第一,RNA提取的质量,除了RNA完整度的基本要求以外,提取的总RNA中不能含有过多的醇类酚类等物质,这类物质会影响酶的活性,影响反转录影响扩增,消除这类影响要求晾干要充分合适,洗脱要完全彻底。尤其是对于多酚多糖类的植物组织RNA提取要特别注意。第二,反转录后得到的模板要适当稀释,不建议直接用高浓度的母液作为模板直接扩增,试剂之间存在相互抑制。这个只是,实验室人员在实验过程遇到的类似问题,希望能对你有所帮助。

为何以前用动物组织跑PCR时内参在15左右,而把组织中的细胞提出来后再跑却常常是18-25,是同一个内参?

其结果的产生归因于多个方面:熟练地操作,组织和细胞总RNA是否合格完整,是否有蛋白污染,是否有酚醇等杂质污染,这些都会影响后续准确的定量和反转录;标准地操作,准确地定量总RNA,相同的起始总RNA上样量,组织和细胞上样量是否相同;不同组织内参的表达丰度也会有所差异,比如有的内参在肝中表达丰度高,而在骨骼中表达丰度低等,这也会造成这种情况;标准相同的反转录后,相同的稀释倍数等等因素。

用2-△△ct法计算目的基因的相对表达量需要跑标曲吗?如果要,此标曲的意义是什么?谢谢解答

首先对于相对定量而言,标准曲线的意义在于检测引物的扩增效率,比如说不同水稻品种检测同一个基因,为了确定这个基因在不同品种间的扩增效率,此时扩增效率就显得尤为重要,而对于同样类型的样本的检测而言,如果能熟练设计引物,保证引物的扩增效率达到90%以上,就并不需要跑标准曲线,而对于刚开始做这个类型的实验对于引物设计没有很好的把握,就建议扩增一下标准曲线。

怎样才能知道自己合成的引物特异性好不好呢?

做个预实验,看下熔解曲线(是熔解曲线,不是溶解曲线哦)。看看是不是单峰,然后看看熔解温度,一般大多引物会在80度以上,当然要参照NTC的熔解温度一起看,一般NTC的熔解温度会比实验样本低很多或者NTC直接表现为没有峰。

NTC是什么?

NTC:no template control,没有加模板的对照,或者称作阴性对照。

熔解曲线如果有峰,但是很宽大,并且加cDNA和加水是一个峰,这怎么解释呢?

峰宽则为引物不特异,水和模板一个峰,那就是引物二聚体或者体系污染。出现引物二聚体的解决办法就是重新设计引物。

请问标准曲线扩增效率要在多少才合格,过高或过低该怎么办呢?

对于相对定量qPCR而言,扩增效率最低标准要在90%-110%之间,很好的扩增效率要在95%-105%之间。若不在这个范围,需要重新设计引物。

提取细胞RNA做qPCR要不同组的细胞数量一样吗?如果没有一样有什么影响?

不需要,最终qPCR上样量是以RNA来衡量的,尽量保持总RNA上样量一致或者接近就可以了,这样扩增出来的内参的ct值会比较集中。

跑出来的条带拖尾是什么原因?谢谢解答

拖尾的可能原因:

  1. 模板不纯。建议纯化模板
  2. buffer不合适。建议更换buffer
  3. 退火温度偏低。建议适当提高退火温度
  4. 酶量过多。建议适量用酶
  5. dNTP,Mg2+浓度偏高。建议适当降低浓度
  6. 循环次数过多。建议减少循环次数。

为什么分析到的差异表达基因与qPCR实验结果不一致,无法被验证?

RNA-seq是大规模筛选用的,反应样本整体的基因表达变化趋势,但不能保证每一个基因的变化趋势都与qPCR保持一致。RNA-seq与RT-PCR本身就是两种不同的实验平台,两者不能一一对应。一般是挑选大量的基因验证,两者的结果从统计学上来说存在较高的相关性(r2>0.8),视为验证成功。

lncRNA如果需要进行验证,引物设计怎么处理?

lncRNA最短的长度是200nt,可满足荧光定量PCR(100-200nt目的片段)的要求。不过由于lncRNA的保守性比较低,组织特异性比较强,扩增效率比较低,可能需要设计多对引物进行尝试。

在没有明确目的的情况下如何挑选基因进行后续研究?

1.可以挑选P值和Q值低且差异倍数大的基因;

2.可以挑选网络图中核心的基因;

3.还可以根据用户提供的研究背景和研究目的挑选基因。

4.根据KEGG、GO富集结果,选取有代表性的差异基因进行实时荧光定量 PCR(qRT-PCR)验证

生物学重复设置几个合适?

最少的生物学重复是3个,肿瘤样本最低要求5个。

P值、FDR、Q值标准及每个值偏差对发表文章的影响?

P值是检验显著性的标准,FDR值、Q值和adjust P值都是对P值的再校正;一般要求P值和FDR,Q值和adjust P值都小于0.05;如果FDR,Q值和adjust P值偏大,会被编委质疑结果的可靠性。

得到的数据中只有1个我期待出现的基因,其他都是未知基因,后续怎么做?

首先,可以通过基因的相互作用网络,寻找未知基因和已知基因的关系;其次,可以通过共表达网络,推测已知基因和未知基因的相关性;以上两种方法可以实现由已知基因推测未知基因作用。

分析结果中实验组某一样本的表达值与同组差异较大,不在均线,质检合格,是测序还是样本处理有问题,或者其他问题?

如果样本是同一批次处理的,存在差别时,一般是因为样本准备的问题;其次在测序之前,可以通过抽提的RNA质量和文库质量来判定样本之间的差别。

数据为什么要做标准化?

对数据标准化的目的是消除特征之间的差异性。使各次/组测量或各种实验条件下的测量可以相互比较,消除测量间的非实验差异。非实验差异可能来源于样品制备、杂交过程或杂交信号处理等。

研究circRNA,已经预测了靶miRNA,可以通过什么技术来观察某一个circRNA与相对应的miRNA发生了结合或者是产生了吸附作用?

观察miRNA与其靶向circRNA的结合,可以利用双荧光素酶报告基因实验。

网络图中最大的点代表什么意义?

首先要确定网络图中的点的面积是利用什么指标表示的。如果是利用Degree表示,说明在网络图中该点的相互作用关系最多。如果是利用betweenness centrality表示,说明网络图中该点的介导能力最强。

GO analysis和GSEA两种分析方式的区别是什么?

GO analysis和GSEA都是基于Gene ontology数据库进行的富集分析,GSEA中也可以选用其他的数据库进行分析,其次GSEA要求提供每个基因的表达值,所以结果中可以提供每个功能中包含的基因的聚类图和富集图。

数据分析质控不通过的原因有哪些?

  1. 测序产出较低的数据量。测序产出的数据量不能够满足数据分析最低的数据量要求。
  2. 文库质量差。组织样本质量较差,RNA有降解,导致构建的文库质量不够好。

PCA分析 中,PC1与PC2分别是什么,如何分析得到的?

通常在PCA分析中,PC1指第一主成分,PC2指第二主成分,而在这里,指的是在将样本点(高维数据)投影到两个维度特征向量上的数据,用来考察样本的分布情况。PCA分析的具体的步骤如下:1.分别对多个变量(多维度)分别求平均值,然后对于所有的样例,都减去对应的均值。2.求特征协方差矩阵 3.求协方差的特征值和特征向量。4.将特征值按照从大到小的顺序排序,选择其中最大的k个特征值,然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵。5.将样本点投影到选取的特征向量上从而得到k个维度的坐标,比如我们做图得到的X轴坐标和Y轴坐标。 碱基的测序质量值 Q 和此碱基出错的概率 Pe 相关。公式:Q = -10 lg( Pe ) 二代测序中,每测一个碱基会给出一个相应的质量值,这个质量值是衡量测序准确度的。20代表碱基错误率为1%,30代表碱基错误率为0.1%。Q20和Q30表示质量值≥20或30的碱基所占百分比。若总计1G的数据量,其中有0.9G的碱基质量值大于或等于20,那么Q20为90%。 一般要求Q20大于90%,Q30大于80%。

常用软件featureCount和Htseq-count所统计的count是什么?

假设一个基因Gene1包含三个外显子exon1、exon2和exon3,测序数据经比对后,若exon1上比对到三条reads,exon2上比对到4条reads,exon3上比对到1条reads,那么Gene1的counts数为1+3+4=8

什么是normalized counts (标准化后的counts)?

为了比较同一基因不同样本的表达量,我们需要考虑“批次效应”,也就是不同样本间该基因能不能比较,主要的一个影响因素就是每个样本总的counts数不同,DESeq2等软件计算的normalized counts首先对counts进行标准化,例如,有A、B两个样本,现在要比较它们的Gene1的差异,样本A总的counts数为100,Gene1的counts数为1,样本B的总counts数为1000,Gene1的counts数为100,两者尺度不一样,无法比较,所以DESeq2会对它们进行标准化。

DESeq2怎么对counts进行差异显著性检验?

DESeq2 假设counts 服从一个负二项分布(negative binomial distribution),然后利用Wald test 进行差异显著性检验。