全基因组重测序是对已有参考序列(Reference Sequence)的物种的不同个体进行基因组测序,并以此为基础进行个体或.群体水平的差异性分析。通过全基因组重测序,研究者可以找到大量的单核苷酸多态性位点(SNP)、拷贝数变异(Copy Number Variation, CNV)、插入缺失(Insertion/Deletion,)、结构变异(Structure Variation, SV)等变异位点。这在人类疾病及动植物育种研究等方面具有重大的指导意义。
上海伯豪可以帮助您利用有Illumina HISeq2500等平台进行全基因组重测序,并通过生物信息学的手段,分析不同个体基因组间的差异, 同时完成注释,从而帮助您在全基因组水平上扫描并检测特定人群的重要遗传性状相关位点。
技术路线
服务相关
1. 样品纯度:OD 260/280值应在1.7~2.0 之间;RNA 应该去除干净。
2. 样品浓度:最低浓度不低于50ng/µl。
3. 样品总量:每个样品总量不少于4µg。
4. 样品溶剂:要溶解在H20或Low TE (pH 8.0)中。
5. 样品运输:DNA低温运输(-20℃);且在运输过程中请用parafilm将管口密封好,以防出现污染;收到样品后,甲方需要对样品进行检测,最终样品的量和纯度,以甲方的检测结果为准。
数据分析流程和内容
数据基础分析内容:
1. 序列质量评估:应用测序质量Q值进行评估。
2. 数据预处理:去除总体质量低于标准的reads、接头序列去除reads中由于测序产生的含糊的N碱基。
3. 基因组mapping统计,包括mapped reads ratio, genome coverage, genome depth等信息的统计。
4. 基因组SNV检测结果:碱基突变情况;对应的氨基酸的改变,是否同义突变;对应染色体的物理位置定位信息;关联的dbSNP库信息(若是新发现SNV则无此信息);该SNV位点相关基因信息(若是新发现SNV则无此信息)。
5. 基因组SV检测结果:基因组发生SV的类型,SV区段的起始/终止位置,SV对氨基酸,蛋白质功能的影响。
6. 基因组Small InDel检测结果:基因组发生Small InDel区段的大小,位置,(仅限于有参考序列,reference sequence,的区域);关联的基因信息。
数据高级分析总览
复杂疾病/性状关联研究 |
肿瘤基因组学研究 |
群体进化研究 |
遗传图谱构建 |
群体SNP检测、分型 |
成对样本的somatic SNV/InDel/CNV检测,注释、统计 |
群体SNP检测、分型 |
群体SNP检测、分型 |
群体SNP位点质控 |
SNP/InDel数据库分析(dbSNP/1000G/UCSC) |
基于参考单体型集合的缺失基因型推断、填充 |
群体SNP位点质控 |
SNP注释与统计(OMIM, ENCODE) |
SNV/InDel COSMIC数据库注释、筛选 |
样本质控(亲缘关系检测、基于IBD的样本污染检测、PCA群体分层检测) |
样本质控(系谱矫正,样品混杂检测) |
样本质控(亲缘关系检测、基于IBD的样本污染检测、PCA群体分层检测) |
SNV保守性预测(SIFT、Polyphen-2) |
连锁不平衡分析 |
遗传图谱构建 |
基于单个位点的关联分析 |
|
系统进化树分析 |
QTL定位 |
候选区域LD分析 |
|
群体多态性分析 |
|
GO、PATHWAY富集分析 |
|
选择分析、驯化基因分析 |
|
应用案例
全基因组重测序揭示小细胞肺癌基因组的变化
吸烟会引发癌症,但是人们对这一过程的分子机制并不清楚,一般认为吸烟过程中释放的大于60种致癌物质可与DNA链上的鸟嘌呤和腺嘌呤进行化学修饰从而产生大的复合物,该复合物改变了DNA双螺旋的结构,如果这些复合物没有被及时纠正,那么在DNA复制的过程中就会产生突变,从而引发癌症,Erin D.Pleasance 等利用第二代测序技术(ABI SOLID)对一个小细胞肺癌(Smal-cell lung cancer,SCLC)细胞系NCI-H209进行全基因组重测序,探讨了烟气中的致癌物质引发该细胞系基因组中哪些碱基及其周围序列产生突变及细胞损伤修复路径。
原文出处:A mall-cell lung cancer genome with complex signatures of tobacco exposure.
Nature,2010,463:184-190.