基因组测序3

基因组重测序(Re-Sequencing)是对已知基因组序列信息的个体进行测序,可在此基础上对个体或群体进行基因型差异性分析。

基因组测 

基因组重测序(Re-Sequencing)是对已知基因组序列信息的个体进行测序,可在此基础上对个体或群体进行基因型差异性分析。基因组重测序主要用于辅助研究者发现大量的单核苷酸多态性位点(SNP)、拷贝数变异(Copy Number Variation,CNV)、插入缺失(InDel,insrtion/Deletion)等变异位点,以高效准确获得生物群体的遗传特征,并方便进行全基因组关联性分析(GWAS),在人类疾病和动植物育种研究等方面意义重大。


  服  务  优  势  

♕ 重测序分析加速:使用从任务投递、数据切分到容器多线程的三重调度加速框架,最终实现了重测序分析的大幅度加速,4小时即可完成一个样本的人类重测序分析,较传统的分析方法(68-92小时)提高了十多倍速度;

♕ 定制化分析策略:根据不同测序物种和测序方案,定制化选择参考基因组版本、比对算法和注释用数据库区域信息等;

♕ 全面的数据库整合:不断更新基因组数据库并进行多数据库多版本整合,获得准确的基因信息与注释;

♕ 强大的组学联合分析能力:将基因组重测序与转录组测序和甲基化测序等技术进行结合,将单一的基因变异数据进一步拓展。



测序分类


全基因组测序(二代、三代);

全外显子测序;

目标区域测序;

单细胞基因组测序;

人线粒体测序


  服  务  流  程 

图片关键词

客户样本:新鲜培养细胞数≥4×106个;

提取基因组DNA:DNA总量≥2μg;

DNA质控:Agilent 2200质检合格,DNA样本主峰范围在100-500bp;

文库构建:随机引物PCR扩增;

上机测序:测序数据量达到50X覆盖深度,不同物种间存在差异,人一般达到30X。




样本量要求


图片关键词



技术参数


检测平台:

全基因组测序采用先进的Illumina测序平台,快速、高效地读取高质量的测序数据。hiseq4000.jpg

合作伙伴的高性能计算平台(High Performance Computing,HPC)采用DELL计算节点和Isilon存储的高效组合,实现快速稳定的测序数据分析及交付。


测序深度:

肿瘤:癌组织50X,癌旁组织/血液样品30X

遗传病等其他样品:30X~50X


服务周期

15~22个工作日


服务内容


全基因组重测序通过对个体进行全基因组测序,全面解读基因组上的变异信息,预测该变异信息与疾病的关联性。

疾病基因组学
标准信息分析高级信息分析(单基因病)高级信息分析(复杂疾病)个性化分析

1.数据质控:去除接头污染和低质量数据
2.与参考序列进行比对、统计测序深度及覆盖度
3.SNP/InDel/SV/CNV 检测、注释及统计
4.基因组变异 Circos 图展示

  (一)基于变异有害性的筛选
1. 突变位点筛选
  (1)筛选的突变过滤已知数据库;
  (2)筛选的变异保留编码区或剪切位点区的变异位点;
  (3)氨基酸保守性预测
2.突变位点有害性分类(ACMG)
3.Non-coding 区突变位点筛选
4.结构变异 CNV/SV 有害性分析
  (二)基于选样信息的筛选
1.显性/隐性遗传模式分析(需合作方提供家系图)
1.1 显性遗传模式
1.2 隐性遗传模式
2.家系连锁分析(家系样本)
3.纯合子区域(ROH)分析(近亲结婚家系样本)
4.共有突变基因筛选(散发样本)
  (三)基于基因功能和表型的筛选
1.候选基因功能富集分析
2.候选基因通路富集分析
3.候选基因与疾病相关性排序

  (一)基于变异有害性的筛选
1. 突变位点筛选
  (1)筛选的突变过滤已知数据库;
  (2)筛选的变异保留编码区或剪切位点区的变异位点;
  (3)氨基酸保守性预测
2.突变位点有害性分类(ACMG)
3.Non-coding 区突变位点筛选
4.结构变异 CNV/SV 有害性分析
  (二)基于选样信息的筛选
1.显性/隐性遗传模式分析(需合作方提供家系图)
1.1 显性遗传模式
1.2 隐性遗传模式
2.新生突变筛选(核心家系)
2.1 de novo SNP/InDel 筛选
2.2 de novo CNV/SV 筛选
2.3 SNP/InDel 新生突变速率计算
3.共有突变基因筛选(散发样本)
  (三)基于基因功能和表型的筛选
1.蛋白功能互作网络(PPI分析)
2.候选基因功能富集分析
3.候选基因通路富集分析
4.候选基因与疾病相关性排序

1. 药物效应多态性的遗传学机理研究
使用 PharmGKB 和 Drugbank 数据库对药物基
因组项目进行注释和分析,需客户提供所关注的
药物名称。
2. 生存分析(基于临床随访数据)
 (1)构建 Cox 风险比例回归模型
 (2)生存曲线
 (3)绘制曼哈顿图
 (4)绘制 Q-Q 图
 (5)绘制 Locus Zoom 图
3. 疾病显著性关联位点分析(建议基于 150 对以
上 case/control)
(1) Fisher 精确检验
(2) 绘制曼哈顿图
(3) 绘制 Q-Q 图
(4) 绘制 Locus Zoom 图
4. 疾病显著性关联基因分析(建议基于 150 对以
上 case/control)
(1) SKAT 统计检验
(2) 绘制 Heat map 图
备注:Control 的选择范围
  (1)客户准备 control 样本,和 case 样本
并行测序后,进行关联分析;
  (2)可以免费利用诺禾内部自然人数据库
Novo-Zhonghua 作为 control 来做关联分析;
  (3)可以利用数据库 ExAc、gnomAD 作为
control 来做关联分析。
5. HLA 分析(分析内容参照人 HLA 捕获测序分
析内容)
6. 线粒体基因组分析(分析内容参照人线粒体基
因组测序分析内容)


癌症基因组学
基本信息分析 A基本信息分析 A+高级信息分析个性化分析

1. 数据质控 : 去除接头污染和低质量数据
2. 与参考序列进行比对、统计测序深度及覆盖
3. Somatic SNP / InDel / SV /
CNV 检测、注释及统计 ( 成对样本 )

基本信息分析 A 基础上增加5项分析内容 :
4. 易感基因筛查
5. 高频突变基因统计及通路富集分析
6.NMF 突变特征及突变频谱分析
7.NovoDriver 已知驱动基因筛选
8. 基因组变异 Circos 图展示

1. MRT 高频突变基因相关性分析
1.1 高频突变基因协同作用分析
1.2 高频突变基因互斥作用分析
2. OncodriveCLUST 驱动基因预测
3. 突变位点分布情况分析(新)
3.1 高频突变基因 SNP/InDel 突变位点展示(新)
3.2 预测驱动基因 SNP/InDel 突变位点展示(新)
4. 高频 CNV 分析
4.1 CNV 分布分析
4.2 CNV 重现性分析
5. 融合基因检测及 Circos 图展示(新)
6. ABSOLUTE 肿瘤纯度及倍性分析
7. 杂合性缺失 (LOH) 分析(新)
8. 瘤内异质性及克隆结构分析
8.1 单样本克隆结构分析 (Pyclone)
8.2 体细胞突变 CCF 计算(新)
9. NovoDrug 高频突变基因靶向用药预测
10. NovoDR 耐药突变筛选
11. NovoNoncoding 非编码区高频突变分析

1. 肿瘤进化树分析
2. NovoVirus 病毒整合分析
3. 克隆结构分析(新)
3.1 同一病人多区域 取样克隆 结 构分析
(EXPANDS)
3.2 多样本间克隆结构进化分析(Pyclone)
4. 临床数据整合
5. 肿瘤分型分析(新)
5.1 微卫星分析
5.2 重排特征分析
5.3 端粒长度分析
5.4 Kataegis 分析
6. 新抗原预测(新)
7. 驱动基因预测(新)
8. 突变频谱 3D 展示图(新)
9. Conpair 分析样本间一致性和污染程度 (新)




结果展示


与参考基因组比对

 

变异检测和注释



 

基因功能分析

 




 典 型 案 例  

肌动蛋白功能丧失变异与早发性心房颤动之间的关联

Association between titin loss-of-function variants and early-onset atrial fibrillation

期刊:JAMA
影响因子:51.273
发表单位:The Broad Institute of MIT and Harvard, US
发表时间:2018.12




研究背景


心房颤动(Atrial Fibrillation,AF)是最常见的持续性心律失常。发病率随年龄增长而增加,75岁人群患病率约为10%,全年龄段人群患病率约为1%。发生房颤时,心房会丧失收缩功能,血液在心房内瘀滞从而形成血栓,易造成脑梗塞、心力衰竭、脑卒中等严重后果,但病因仍未完全了解。在较为年轻(<66岁)的AF患者中,遗传性因素往往在致病因素中占据了更为主导的地位,因此在早发性 AF 患者中进行了大规模、深度覆盖的全基因组测序。



研究方法


placeholder+image



研究结果



对7740个病例对照样本进行了全基因组测序,共检测出超过9800万个突变。在这些突变中,选择次等位基因频率(MAF)≥1% 的8248975个常见突变进行case-control样本的关联分析。结果显示,在全基因组范围内,共发现了7个基因座内的突变与早发性AF呈现显著相关,其中有6个为已报道的基因座,包括PITX2、PRRX1、NEURL1、ZFHX3、KCNN3、SOX5,还有一个为新发现的NAV2

placeholder+image

NAV2中关联性最强的变体 rs2625322 位于neuron navigator 2基因的内含子中(MAF= 21.3%;OR,1.32;95%CI,1.21~1.44;P=1.46×10 -8 )

placeholder+image

NAV2基因座中,根据之前报道的25个关联位点进行了LOF突变(loss of function,功能缺失性突变)鉴定,结果显示肌节蛋白的编码基因 TTN 的罕见变异与 AF 有关。

placeholder+image

在去除了705个发生 AF 前已经发生过心力衰竭的 Cases 后,在剩余的2047例 AF 患者中,有44例在 TTN 中存在至少一种罕见的LOF 突变,频率为2.1%,而对照组中仅为1.1%(CI,1.04~2.97;P = 3.42×10 -2 )

placeholder+image

对 AF 的发病年龄段以及 AF 患者携带 TTN 的 LOF 突变率进行统计,发现 TTN LOF 突变的增加与 AF 患病年龄呈现负相关,也是就说 TTN LOF 突变会导致个体更早地患上 AF。

placeholder+image



研究结论


Titin 是人体中最大的蛋白质,对正常心肌功能至关重要。该研究发现了 TTN 中的 LOF 突变与早发性 AF 之间存在关联,为今后的 AF 发病机制研究打开了新的思路。



参考文献


  • Choi S H, Weng L C, Roselli C, et al. Association Between Titin Loss-of-Function Variants and Early-Onset AtrialFibrillation[J]. JAMA, 2018, 320(22): 2354-2364.


微信公众号或添加客服号