基因组重测序(Re-Sequencing)是对已知基因组序列信息的个体进行测序,可在此基础上对个体或群体进行基因型差异性分析。基因组重测序主要用于辅助研究者发现大量的单核苷酸多态性位点(SNP)、拷贝数变异(Copy Number Variation,CNV)、插入缺失(InDel,insrtion/Deletion)等变异位点,以高效准确获得生物群体的遗传特征,并方便进行全基因组关联性分析(GWAS),在人类疾病和动植物育种研究等方面意义重大。
服 务 优 势
♕ 重测序分析加速:使用从任务投递、数据切分到容器多线程的三重调度加速框架,最终实现了重测序分析的大幅度加速,4小时即可完成一个样本的人类重测序分析,较传统的分析方法(68-92小时)提高了十多倍速度;
♕ 定制化分析策略:根据不同测序物种和测序方案,定制化选择参考基因组版本、比对算法和注释用数据库区域信息等;
♕ 全面的数据库整合:不断更新基因组数据库并进行多数据库多版本整合,获得准确的基因信息与注释;
♕ 强大的组学联合分析能力:将基因组重测序与转录组测序和甲基化测序等技术进行结合,将单一的基因变异数据进一步拓展。
全基因组测序(二代、三代);
全外显子测序;
目标区域测序;
单细胞基因组测序;
人线粒体测序。
服 务 流 程
客户样本:新鲜培养细胞数≥4×106个;
提取基因组DNA:DNA总量≥2μg;
DNA质控:Agilent 2200质检合格,DNA样本主峰范围在100-500bp;
文库构建:随机引物PCR扩增;
上机测序:测序数据量达到50X覆盖深度,不同物种间存在差异,人一般达到30X。
测序深度:
肿瘤:癌组织50X,癌旁组织/血液样品30X
遗传病等其他样品:30X~50X
服务周期:
15~22个工作日
全基因组重测序通过对个体进行全基因组测序,全面解读基因组上的变异信息,预测该变异信息与疾病的关联性。
疾病基因组学 | |||
标准信息分析 | 高级信息分析(单基因病) | 高级信息分析(复杂疾病) | 个性化分析 |
1.数据质控:去除接头污染和低质量数据 | (一)基于变异有害性的筛选 | (一)基于变异有害性的筛选 | 1. 药物效应多态性的遗传学机理研究 |
癌症基因组学 | |||
基本信息分析 A | 基本信息分析 A+ | 高级信息分析 | 个性化分析 |
1. 数据质控 : 去除接头污染和低质量数据 | 基本信息分析 A 基础上增加5项分析内容 : | 1. MRT 高频突变基因相关性分析 | 1. 肿瘤进化树分析 |
与参考基因组比对
样本比对率,指比对到参考基因组上的数据量除以有效测序数据量,反映了样本测序数据与参考基因组的相似性。
测序深度,指比对到参考基因组的碱基总数除以基因组大小;
覆盖度,指被测到的该物种基因组的碱基总数占该物种基因组长度的百分比;
测序深度和覆盖度能够直接反应测序数据的均一性及与参考序列的同源性。
变异检测和注释
SNV全称Single nucleotide variant,是指在基因组上由单个核苷酸的替换所引起的变异。InDel指小片段的插入/缺失。
SV(结构变异)指的是在基因组上一些大的结构性的变异,比如大片段插入(insrtion)、倒位(inversion)、易位(translocation)。
CNV(拷贝数变异)是一类特殊的结构变异,指的是基因组上大片段序列拷贝数的增加或者减少,可分为缺失(loss)和增加(gain)两种类型。
变异注释内容包括基因及区域注释,数据库(人种频率)注释,保守(有害)性预测,变异位点信息,基因功能及通路注释等。
基因功能分析
对筛选注释得到的候选基因进行GO、Pathway、miRNA、Disease、Proteome、Phenotype等功能富集。
富集分析中采用P-value的多重检验校正值Q-value来控制FDR(False Discovery Rate),此外,也可以采取更严格的Bonferroni多重校正法(Bonferroni multiple correction method)。缺省富集显著性阈值为控制FDR的Q-value<0.05。
典 型 案 例
肌动蛋白功能丧失变异与早发性心房颤动之间的关联
Association between titin loss-of-function variants and early-onset atrial fibrillation
期刊:JAMA
影响因子:51.273
发表单位:The Broad Institute of MIT and Harvard, US
发表时间:2018.12
心房颤动(Atrial Fibrillation,AF)是最常见的持续性心律失常。发病率随年龄增长而增加,75岁人群患病率约为10%,全年龄段人群患病率约为1%。发生房颤时,心房会丧失收缩功能,血液在心房内瘀滞从而形成血栓,易造成脑梗塞、心力衰竭、脑卒中等严重后果,但病因仍未完全了解。在较为年轻(<66岁)的AF患者中,遗传性因素往往在致病因素中占据了更为主导的地位,因此在早发性 AF 患者中进行了大规模、深度覆盖的全基因组测序。
对7740个病例对照样本进行了全基因组测序,共检测出超过9800万个突变。在这些突变中,选择次等位基因频率(MAF)≥1% 的8248975个常见突变进行case-control样本的关联分析。结果显示,在全基因组范围内,共发现了7个基因座内的突变与早发性AF呈现显著相关,其中有6个为已报道的基因座,包括PITX2、PRRX1、NEURL1、ZFHX3、KCNN3、SOX5,还有一个为新发现的NAV2。
NAV2中关联性最强的变体 rs2625322 位于neuron navigator 2基因的内含子中(MAF= 21.3%;OR,1.32;95%CI,1.21~1.44;P=1.46×10 -8 )
在NAV2基因座中,根据之前报道的25个关联位点进行了LOF突变(loss of function,功能缺失性突变)鉴定,结果显示肌节蛋白的编码基因 TTN 的罕见变异与 AF 有关。
在去除了705个发生 AF 前已经发生过心力衰竭的 Cases 后,在剩余的2047例 AF 患者中,有44例在 TTN 中存在至少一种罕见的LOF 突变,频率为2.1%,而对照组中仅为1.1%(CI,1.04~2.97;P = 3.42×10 -2 )
对 AF 的发病年龄段以及 AF 患者携带 TTN 的 LOF 突变率进行统计,发现 TTN LOF 突变的增加与 AF 患病年龄呈现负相关,也是就说 TTN LOF 突变会导致个体更早地患上 AF。
Titin 是人体中最大的蛋白质,对正常心肌功能至关重要。该研究发现了 TTN 中的 LOF 突变与早发性 AF 之间存在关联,为今后的 AF 发病机制研究打开了新的思路。
Choi S H, Weng L C, Roselli C, et al. Association Between Titin Loss-of-Function Variants and Early-Onset AtrialFibrillation[J]. JAMA, 2018, 320(22): 2354-2364.