基因突变检测高级分析的那点事

  • A+
所属分类:基因突变检测
对于高通量测序研究来说,高级分析可以更深入研究其分子机制,所以今天和大家聊一聊全基因组测序和全外显子测序的高级分析,肿瘤易感基因筛查、高频突变基因统计及通路富集分析、NMF突变特征及突变频谱分析以及已知驱动基因研究。

 

 

肿瘤易感基因筛查

 

什么是易感基因

易感基因(Predisposing gene)是在适宜的环境刺激下能够编码遗传性疾病或获得疾病易感性的基因。现代医学研究成果表明,大多数疾病是多种环境因素和遗传体质共同作用的结果,对健康不利的遗传体质所对应的一些与疾病发生相关的基因型,我们就叫做疾病易感基因。发现了这些基因,深入研究,从而有效地预防和控制遗传疾病的发生。

 

怎么分析易感基因

通过高通量测序,将患者正常组织细胞中检测到的变异与CGC(Cancer Gene Census)数据库比较,筛选可能的肿瘤易感基因。

 

测序筛查结果呈现

通过测序检测到的变异结果与相应数据库比对,筛选出肿瘤易感基因,结果在基因名称、染色体名称、基因位置以及突变情况和对应肿瘤种名称进行分析,具体结果呈现详细如下:

基因突变检测

注:Gene:基因名称、Chr:染色体、Position:基因所在位置、Ref:参考碱基、Variant_Classification:突变类型、AAChange:氨基酸改变信息 、CGC_Cancers:在CGC数据库里对应肿瘤种名称

 

 高频突变基因统计及通路富集分析

 

什么是高频突变基因?

高频突变基因(SMG,Significantly mutated genes)综合考虑了体细胞SNP和INDEL等变异,是指突变频率显著高于背景突变频率(BMR,background mutation rate)的基因

 

如何分析高突变基因?

肿瘤高频突变分析使用MuSiC软件,MuSiC以所有肿瘤样本的体细胞突变为背景,对基因上的各个突变类型进行统计检验,检测出显著高于背景突变率的基因。MuSiC通过3种方法进行SMG test,包括卷积检验(convolution test,CT)、Fisher检验(Fisher’s combined P-value test, FCPT)、似然比检验(likelihood ratio test,LRT)。对于高频突变基因,我们会进行高频突变基因的通路富集分析,分析软件使用PathScan(MuSiC的一个工具),富集使用的代谢通路数据库有:KEGG、Biocarta、PID和Reactome。

 

测序分析结果展示

通过测序分析,分析高突变基因,高频突变具体详细分析结果见下表,高频突变热图展示见下图:Gene:基因名称、Indels:该基因上发生的somatic indel突变数目、SNVs:该基因上发生的somatic SNV突变数目、Tot Muts:该基因上发生总的体细胞突变数目、Sample Affect:该基因上发生突变的样本数、Sample Percent(%):该基因上发生突变的样本数占总样本数目的比例、P-value CT:基于卷积检验计算得到的P-value、FDR CT:校正后的p value(基于卷积检验结果)。

基因突变检测

 

基因突变检测

 

高频突变基因富集分析对于高频突变基因,我们利用PathScan软件进行通路富集分析,使用的代谢通路数据库有:KEGG、Biocarta、PID、Reactome等。

基因突变检测

注:(1)Pathway:代谢通路ID (2)Name:通路名称 (3)Class:通路所属数据库 (4)Samples Affected:该通路中基因突变的样本数目 (5)Total Variantions:总的突变数目 (6)P-value:富集分析的P-value (7)FDR:FDR校正后的P-value

 

NMF突变特征及突变频谱分析

我们对体细胞SNV的变异进行了多个角度的分析,包括突变频谱(mutation spectrum)和突变特征(mutation signature)。从这些结果中,我们可以清晰地了解到肿瘤发生在点突变水平上的特征。通过突变频谱分析我们可以得知各个肿瘤样本各种类型突变(如C>A/G>T)的数量及样本是否有某种类型突变的偏好性;通过分析体细胞突变频谱及突变特征,可以研究不同肿瘤种的体细胞点突变特点。

 

测序分析结果展示

1、突变特征

考虑点突变上、下游各1bp位置的碱基,我们可以将点突变分成96种。突变特征分析是根据各肿瘤样本中96种点突变的数量,通过非负矩阵分解(Nonnegtive Matrix Factorization,NMF)的方法,提取出体细胞点突变的突变特征,每一种突变特征反映了一种肿瘤体细胞突变的物理、化学或生物过程。COSMIC 网站展示了30多种已知的突变特征。

基因突变检测

2、突变频谱

点突变变异共有6种类型:C>A/G>T,C>G/G>C,C>T/G>A,T>A/A>T,T>C/A>G,T>G/A>C,根据各类型点突变的数量对肿瘤样本和点突变类型进行聚类分析,我们可以分析所研究肿瘤的点突变类型的偏好和各肿瘤样本在点突变水平上的相似程度。分析结果如下:

基因突变检测

 

已知驱动基因筛选

肿瘤是一种复杂的疾病,是体细胞突变积累的结果。通常肿瘤细胞中的突变分为两种类型:一种对肿瘤的增殖扩散有重要影响,使肿瘤获得选择性的生长优势,这样的突变称为驱动突变(driver mutation)。另外一种对肿瘤增殖扩散影响很小或者没有影响的突变称为乘客突变(passenger mutation)。检测driver mutation及driver gene具有重要意义,可以进一步理解肿瘤形成的分子机理从而开发更有效的药物治疗肿瘤。

 

驱动基因筛选分析结果

将体细胞变异与已知驱动基因进行比较,筛选出该肿瘤样本中的已知驱动基因。Gene:基因名称、Chr:染色体、Position:染色体上位置、Ref:参考碱基、Alt:变异碱基 、Variant_Classification:突变类型 、AAChange: 氨基酸改变信息、CGC:在CGC数据库里对应肿瘤种名称。

基因突变检测

 

参考文献
 
 

1. Alexandrov, L.B, et al. Deciphering signatures of mutational processes operative in human cancer. Cell Rep, 2013,3:246–259.

2. Shigeng Zhanga,Qi Zhangb,Qing SunGenome et al. Evolution Analysis of Recurrent Testicular Malignant Mesothelioma by Whole-Genome Sequencing.Cell Physiol Biochem,2018;45:163-174

3. Bert Vogelstein, et al.Cancer Genome Landscapes.Science, 2013, 339:1546-1558.

4. David Tamborero, et al. Comprehensive identification of mutational cancer driver genes across 12 tumor types. Scientific Reports, 2013, 2650

5. Cyriac Kandoth, et al. Mutational landscape and significance across 12 major cancer types. Nature, 2013, 502: 333–339.

发表评论

您必须登录才能发表评论!