·长篇论著·

全外显子组测序筛选先天性心脏病基因突变的研究

杨言军 霍艳蓓 把玉佩 周立 史典 王瑞娟 任晓宇 甘婷 程宁

【摘要】 目的 用全外显子组学测序技术捕获和筛选新生儿先天性心脏病的基因突变。方法于2014年1月—2018年 4月,从兰州市妇幼保健院新生儿科明确诊断为以室缺伴房缺的严重先天性心脏病患儿中选取6例为研究对象,收集患儿与父母家系血样,通过全外显子测序技术捕获突变基因,采用公共数据库dbsnp、HapMap以及VEP和BGI内部数据库进行注释和筛选定位先天性心脏病的致病突变,用Sanger 测序验证突变。结果在6个家庭中有3个家庭发现了符合筛选条件的新生基因突变,其中3个基因发生错义突变,分别为FH2 域控制蛋白 1(FHDC1)(c.1977G>C;p.Gln659His)、溴区包含蛋白4(BRD4)(c.3797A>C;p.Glu1266Ala)和己糖激酶3(HK3)(c.397C>G;p.Leu133Val),一个基因剪切位点发生突变为sprouty相关EVH1域包含蛋白2(SPRED2)(c.373+1G>T)。结论FHDC1(c.1977G>C)、BRD4(c.3797A>C)、HK3(c.397C>G)、SPRED2(c.373+1G>T)可能为先天性心脏病有害的新生突变。

【关键词】 先天性心脏病; 全外显子组; 测序捕获; 基因突变

先天性心脏病是一种常见的出生缺陷,在世界范围内约占出生缺陷的三分之一[1],而在中国, 先天性心脏病的发病率逐年上升且已位居出生缺陷的首位,也是导致围产儿和婴儿死亡的主要原因之一[2]。导致先天性心脏病发病的病因除了孕妇在孕产期所接触到的一些环境致畸物、孕期服药、宫内感染或者孕妇所患一些疾病外,遗传因素也在其中发挥着重要作用[3-4]。研究发现,大量位于NKX2.5、GATA4和TBX5这三种基因的突变是导致先天性心脏病的原因[5],但是这些研究大多数是针对家族性和综合征型的先天性心脏病,而现实中,这些非综合征型的散发先天性心脏病却占大多数病例,这些病人的遗传病理机制仍不清楚。测序研究发现,一些散发性畸形和疾病是由新生基因突变引起的,这些新生突变比遗传变异危害更大[6-7]。近年来,基因测序技术发展为先天性心脏病遗传因素研究提供了有力的手段,尤其是全外显子组测序技术,一次性可以覆盖整个蛋白质编码的外显子区域,通过对患儿和父母全外显子测序来发现新生基因突变,逐渐成为发现散发先天性心脏病候选基因的有效方法。但是目前,国内外针对散发先天性心脏病新生基因突变的研究较少,本研究通过全外显子组测序技术尝试捕获6例室缺伴房缺的严重先天性心脏病儿及其父母血DNA外显子突变,并通过基因库进行注释和筛选先天性心脏病患儿有害的新生突变,为散发先天性心脏病患儿遗传病理机制研究提供依据。

对象与方法

一、 研究对象

于2014年1月—2018年 4月,从兰州市妇幼保健院经新生儿科明确诊断为以室缺伴房缺的严重先天性心脏病患儿中选取6例为研究对象,而其父母均未有心脏结构缺陷。在获取患儿家长知情同意并签署知情同意书后,收集患儿及父母外周血样,并置于-70℃保存备用。

二、全外显子组测序捕获突变方法

提取基因组DNA,并通过荧光定量和琼脂糖凝胶电泳对DNA浓度进行精确定量和质量检测。质量合格的基因组DNA打断成主峰是250~300 bp左右的片段,在DNA片段的3′端加上“A”碱基,两端加上文库接头,然后进行线性扩增(LM- PCR)制备成杂交文库。取适量的杂交文库与外显子芯片进行捕获富集,洗脱掉未富集的片段后进行扩增。

扩增产物经Agilent 2100 bioanalyzer仪器(Agilent DNA 1000 Reagents)和QPCR质控,质控合格使用Illumina HiSeq系列平台,进行高通量测序,经Illumina碱基识别软件(Base Calling)转化为原始序列数据(raw reads)。对原始数据过滤得到高质量的数据(clean data或clean reads)。

使用比对BWA(Burrows-Wheeler Aligner)和SOAPaligner,与人的参考基因组(GRCh37/hg19)比对,用SOAPsnp、GATK、SAMtools和Platypus进行变异检测(SNP和InDel)。最后,将获得的变异用VEP和BGI内部数据库进行注释(以上所有步骤均由深圳华大基因科技有限公司进行)。

三、质量控制

该研究中,约有 58.97 Mb 长的目标区域被芯片捕获,平均 99.82% 的 reads 比对上参考基因组。目标区域的平均测序深度约为 159.09 X,平均每个样本有 99.79% 的目标区域被至少1条reads覆盖,有98.26%的目标区域被至少10条reads覆盖。在整个分析流程中,对过滤后的测序数据、比对数据和变异结果均做了严格的质控(QC),如果某些质控项标准不满足,则重新测或者其他有效方式来改善数据质量,保证高质量的数据。

四、突变基因筛选定位策略

1. 家系分析:按照AD模式即假设在常染色体显性遗传方式进行分析,即表示家系成员中的患者都携带致病基因型,正常人都不携带致病基因型。筛选时,先筛出该遗传模式下共分离的记录,即AD:YY:1:2:0,再根据随机森林模型预测的结果找出真阳性的新生突变(De novo)。

2. 等位基因频率:选择公共数据库(如KG、ESP、EXAC、CG、HapMap、Wellderly)等位基因频率均小于等于0.005的位点。

3. 芯片阈值:针对不同的芯片选择阈值进行筛选,留下符合条件的记录,此次本研究选择华大推荐阈值20,即留下小于等于20的记录,去除系统假阳性变异。

4. 质控信息(filter):择质量较高位点即在目标区域(TR)且通过GATK过滤条件(PASS)。

5. 转录本影响程度(IMPACT):选择IMPACT选项中HIGH和MEDIUM。

6. 突变所在区域:筛选出功能影响比较大的位点,比如在蛋白质编码区和剪切位点。

如图1所示,仅当以上条件均满足时才作为候选的基因突变。

图1 有害的新生突变的筛选流程图
Figure 1 Screening flow chart for deleterious de novo mutations

五、Sanger测序验证

通过Sanger测序对筛选出的新生突变基因进行家系验证,PCR产物用ABI3730XL测序仪进行序列分析(由深圳华大基因科技有限公司进行)。测序结果用chromas软件进行查看。

结 果

一、全外显子组学测序技术捕获结果

此次测序平均每个样本有65 899 918 bp的靶向区域被捕获,捕获效率平均为79.05%,SNP为121 825,indel为32 375,具体各个样本详细信息见表1。

二、筛选先天性心脏病的有害新生突变结果

如表2所示,按照筛选方法本研究发现4个符合筛选条件的新生突变,涉及到基因和位点分别为FHDC1(c.1977G>C;p.Gln659His)、BRD4(c.3797A>C;p.Glu1266Ala)和HK3(c.397C>G;p.Leu133Val),SPRED2(c.373+1G>T),其中FHDC1、BRD4、HK3为错义突变,而SPRED2突变位置在剪切位点其有可能改变外显子剪切方式从而影响基因功能,另外FHDC1与BRD4基因突变在dbsnp库中无对应记录。通过多种预测软件对这些变异的功能和保守性进行预测,虽相应预测软件并未发现 FHDC1(c.1977G>C)为有害突变,但SPRED2(c.373+1G>T)有三个功能预测软件分别为GERP-plus、PhyloP与PhastCons预测为有害突变,而GERP-plus功能预测软件同样发现BRD4(c.3797A>C)位点的变异是有害的,而FATHMM、GERP_plus与PhastCons预测出HK3为有害突变。对筛选出的新生突变进行用Sanger测序验证,结果显示患儿存在突变,其父母不存在该突变,表明本研究发现的FHDC1(c.1977G>C)、BRD4(c.3797A>C)、HK3(c.397C>G)、SPRED2(c.373+1G>T)为新发突变,如图2所示。

表1 全外显子组测序捕获结果
Table 1 Whole exome sequencing capture results

SamplesTarget regions(bp)Capture specificity (%)Total SNPsTotal InDelsSXL59 156 08272.88100 49623 783SXL-F69 271 83682.49133 12537 592SXL-M69 271 83681.07127 01433 784CJL59 156 08280.9993 57620 974CJL-F69 271 83674.47137 46738 200CJL-M69 271 83678.44131 24434 057ZYH59 156 08271.62102 53024 810ZYH-F69 271 83673.92138 38039 575ZYH-M69 271 83679.16138 58640 052ZXL59 156 08279.9299 42823 980ZXL-F69 271 83683.07128 79933 346ZXL-M69 271 83677.67132 02834 098CFX59 156 08278.9698 33824 182CFX-F69 271 83682.32132 33337 014CFX-M69 271 83682.21131 71837 395LCY59 156 08281.96100 26323 866LCY-F69 271 83681.67134 04538 098LCY-M69 271 83680.13133 47537 945Average65 899 91879.05121 82532 375

表2 基因突变的筛选定位结果
Table 2 Screening and mapping results of gene mutations

GeneChromosomeIDBase mutationAmino acid mutationFATHMMGERP-plusPhyloPPhastConsFHDC14—c.1977G>Cp.Gln659His1.47-2.95-0.4990SPRED22rs1484198646c.373+1G>T——5.52.5891BRD419—c.3797A>Cp.Glu1266Ala3.074.941.8410.081HK35rs938005223c.397C>Gp.Leu133Val-6.683.061.1361

“—”:the mutation of this locus is not recorded in dbsnp database, or it means that there is no amino acid change, or it means that this locus cannot be predicted by relevant prediction software; Deleterious variation:FATHMM<-1.5,GERP-plus>3,PhyloP>2.5,PhastCons>0.6

图2 患儿及其父母突变基因Sanger测序
Figure 2 Sanger sequencing analysis of the mutated gene in patients and their parents

讨 论

心脏的发育是一个连续动态的过程,而心脏转录因子对调控心脏发育起着关键作用,研究发现心脏转录因子ZIC3、NKX2.5、TBX5、GATA4、TFAP2BTBX1和FOG2与 先天性心脏病发病有密切关系[8],这些转录因子发生突变可能影响其蛋白质功能从而导致先天性心脏病发生,尤其是NKX2.5、GTAT4、TBX5这几个核心的转录因子[9]NKX2.5、GATA4的杂合突变是家族性ASD的致病原因之一[10],TBX5突变与Holt-Oram综合征有关[11],但本研究并未发现心脏转录因子的新生突变。而国内的一项病例对照研究发现在224名先天性心脏病儿童中有13.40%患儿有GATA4的突变,且病例与对照差异有意义,而NKX2.5的变异与对照比差异无统计学意义[12],也有研究认为心脏转录因子NKX2.5与GATA4的突变在散发性先天性心脏病的作用有限[13]。而一项Meta研究表明,NKX2.5(63A>G与606G>C)的多态性与散发性先天性心脏病关系不大[14]。这些心脏转录因子与家族性先天性心脏病关系密切,但对于散发性先天性心脏病,这些变异具体作用仍存在争议。

除了心脏转录因子外,研究发现eNOS(rs7830)、BMP4(rs762642)多态性会增加中国人群先天性心脏病发病风险[15-16],病例对照研究发现DLC 1(Met360Lys、Glu418Lys和Asp554Val)这些预测软件为有害的变异是与先天性心脏病有关的基因突变[17],Watkins等[18]通过对患儿与父母一家三口人群的全外显子测序分析发现纤毛相关的基因突变在 先天性心脏病患儿中明显富集。而本研究发现有四个与先天性心脏病有关的新发突变FHDC1(c.1977G>C;p.Gln659His)、SPRED2(c.373+1G>T)、BRD4(c.3797A>C;p.Glu1266Ala)、HK3(c.397C>G;p.Leu133Val),其中FHDC1与肌动蛋白丝形成有关,另外它还是细胞骨架调节蛋白[19],这些蛋白通过协调细胞骨架动力学来影响纤毛的装配过程,而细胞表面的纤毛起着传递信号的作用,其过度表达会导致纤毛长度增加从而影响细胞之间信号转导[20]。Li 等[21]对先天性心脏病小鼠全外显子测序发现有34个纤毛相关基因,16个纤毛有关的基因突变与 先天性心脏病有关。SPRED2可抑制MAPK信号通路来发挥膜相关的酪氨酸受体激酶的调节剂的作用[22]。而Ras-MAPK通路是细胞生长和分化的重要信号通路。Wright和Kerr综述了Ras-MAPK通路中可能导致家族性综合征型 先天性心脏病的基因突变[23]。有研究发现SPRED2是一种心脏自噬调节因子,其异常会导致心功能不全、心率失常[24]。因此,本研究猜测SPRED2可的突变可能通过MAPK通路来影响心脏发育导致先天性心脏病。BRD4是心肌细胞肥大过程中病理基因转活化的关键共激活因子,在心房压力上升的内皮细胞中过表达[25],但该基因与先天性心脏病的关系并没有相关报道。HK3基因编码己糖激酶3,是糖代谢途径一种重要的酶,是本研究第一次发现该基因突变与先天性心脏病有关。

本研究局限性在于纳入的家系比较少,后续可能还需要进一步加大样本量来进行研究。此外,通过全外显子测序发现的可能与先天性心脏病发育有关的基因突变,需要今后通过相应的实验研究来进一步验证与深入探讨相应的致病机制。

参考文献

1 van der Linde D,Konings EE,Slager MA,et al.Birth Prevalence of Congenital Heart Disease Worldwide:A Systematic Review and Meta-Analysis.J Am Coll Cardiol,2011,58:2241-2247.

2 卫生部发布《中国出生缺陷防治报告(2012)》.中国药房,2012,23:3693.

3 Liang Q,Gong W,Zheng D,et al.The influence of maternal exposure history to virus and medicine during pregnancy on congenital heart defects of fetus.Environ Sci Pollut Res Int,2017,24:5628-5632.

4 Ehiole A,Walton NA,Nogee JM,et al.The Complex Genetic Basis of Congenital Heart Defects.Circ J,2017,81:629-634.

5 Qin X,Xing Q,Ma L,et al.Genetic analysis of an enhancer of the NKX2-5 gene in ventricular septal defects.Gene,2012,508:106-109.

6 Jin ZB,Li Z,Liu Z,et al.Identification of de novo germline mutations and causal genes for sporadic diseases using trio-based whole-exome/genome sequencing.Biol Rev Camb Philos Soc,2018,93:1014-1031.

7 Veltman JA,Brunner HG.De novo mutations in human genetic disease.Nat Rev Genet,2012,13:565-575.

8 Clark KL,Yutzey KE,Benson DW.Transcription factors and congenital heart defects.Annu Rev Physiol,2006,68:97-121.

9 Olson EN.Gene regulatory networks in the evolution and development of the heart.Science,2006,313:1922-1927.

10 Hirayama-Yamada K,Kamisago M,Akimoto K,et al.Phenotypes with GATA4 or NKX2.5 mutations in familial atrial septal defect.Am J Med Genet A,2005,135:47-52.

11 Mori AD,Bruneau BG.TBX5 mutations and congenital heart disease:Holt-Oram syndrome revealed.Curr Opin Cardiol,2004,19:211-215.

12 Xiong F,Li Q,Zhang C,et al.Analyses of GATA4,NKX2.5,and TFAP2B genes in subjects from southern China with sporadic congenital heart disease.Cardiovasc Pathol,2013,22:141-145.

13 Yin J,Qian J,Dai G,et al.Search of Somatic Mutations of NKX2-5 and GATA4 Genes in Chinese Patients with Sporadic Congenital Heart Disease.Pediatr Cardiol,2019,40:17-22.

14 Xie X,Shi X,Xun X,et al.Associations ofNKX2-5Genetic Polymorphisms with the Risk of Congenital Heart Disease:A Meta-analysis.Pediatr Cardiol,2016,37:953-961.

15 Zhou K,Wang Y,Peng W,et al.Genetic variants of the endothelial NO synthase gene (eNOS) may confer increased risk of sporadic congenital heart disease.Genet Mol Res,2014,13:3805-3811.

16 Qian B,Mo R,Da M,et al.Common Variations inBMP4Confer Genetic Susceptibility to Sporadic Congenital Heart Disease in a Han Chinese Population.Pediatr Cardiol,2014,35:1442-1447.

17 Lin B,Wang Y,Wang Z,et al.Uncovering the rare variants of DLC1 isoform 1 and their functional effects in a Chinese sporadic congenital heart disease cohort.PLoS One,2014,9:e90215.

18 Watkins WS,Hernandez EJ,Wesolowski S,et al.De novo and recessive forms of congenital heart disease have distinct genetic and phenotypic landscapes.Nat Commun,2019,10:4722.

19 Dutta P,Maiti S.Expression of multiple formins in adult tissues and during developmental stages of mouse brain.Gene Expr Patterns,2015,19:52-59.

20 Copeland SJ,Andrea MR,Giulia G,et al.Actin-dependent regulation of cilia length by the invertedformin FHDC1. Mol Biol Cell,2018,29:1611-1627.

21 Li Y,Klena NT,Gabriel GC,et al.Global genetic analysis in mice unveils central role for cilia in congenital heart disease.Nature,2015,521:520-524.

22 Tuduce IL,Schuh K,Bundschu K.Spred2 expression during mouse development.Dev Dyn,2010,239:3072-3085.

23 Wright EM,Kerr B.RAS-MAPK pathway disorders:important causes of congenital heart disease,feeding difficulties,developmental delay and short stature.Arch Dis Child,2010,95:724-730.

24 Ullrich M,Aßmus B,Augustin AM,et al.SPRED2 deficiency elicits cardiac arrhythmias and premature death via impaired autophagy.J Mol Cell Cardiol,2019,129:13-26.

25 Duan Q,Mcmahon S,Anand P,et al.BET bromodomain inhibition suppresses innate inflammatory and profibrotic transcriptional networks in heart failure.Sci Transl Med,2017,9:eaah5084.

Whole-exome sequencing reveals genetic mutations in congenital heart disease

YANG Yanjun, HUO Yanbei, BA Yupei, ZHOU Li, SHI Dian, WANG Ruijuan, REN Xiaoyu, GAN Ting, CHENG Ning.

Department of Neonatology, Lanzhou City Maternity and Child-care Hospital, Lanzhou 730030, China

[Abstract] Objective Whole exome sequencing was used to capture and screen genetic mutations in neonatal congenital heart disease.MethodsWe selected 6 children with severe congenital heart disease who had ventricular septal defect and atrial septal defect diagnosed by neonatology specialists from January 2014 to April 2018 in Lanzhou Maternal and Child Health Hospital. Blood samples of 6 children and their parents were collected, and the mutant genes were captured by whole exome sequencing. The dbSNP, HapMap, and internal databases of VEP and BGI were used to annotate and screen the pathogenic mutations of congenital heart disease. The mutations were verified by Sanger sequencing.ResultsAccording to the screening criteria, de novo mutations were found in the three of the six families. Three of them have missense mutations, namely FH2 domain-containing protein 1 (FHDC1)(c.1977G>C;p.Gln659His)、bromodomain-containing protein 4 (BRD4)(c.3797A>C;p.Glu1266Ala)、hexokinase 3(HK3)(c.397C>G;p.Leu133Val), as well as one gene splice site mutated to sprouty related EVH1 domain-containing protein 2 (SPRED2)(c.373+1G>T).Conclusion FHDC1 (c.1977G> c), BRD4 (c.3797A>c), HK3 (c.397C>G), and SPRED2 (c.373+1G>T) may be deleterious de novo mutations for congenital heart disease.

[Key words] congenital heart disease; whole exome sequencing; sequencing capture; gene mutation

基金项目:兰州市人才创新创业项目(2016-RC-25;2019-RC-25)

作者单位:730030 兰州, 兰州市妇幼保健院新生儿科(杨言军,周立,王瑞娟);兰州大学公共卫生学院流行病与卫生统计学教研室(霍艳蓓,把玉佩,史典,任晓宇,甘婷),生殖健康与出生缺陷研究中心(霍艳蓓,把玉佩,史典,任晓宇,甘婷,程宁)

通信作者:程宁(chengn@lzu.edu.cn)

【中图分类号】 R17; R72

(收稿日期:2020-10-13)