·论著·
辅助生殖技术国际监测委员会同世界卫生组织(World Health Organization, WHO)将不孕症(infertility)定义为经12月或更长时间的规律无保护性交仍未能临床妊娠的一种生殖系统疾病[1]。其包括原发性不孕和继发性不孕两大类。不孕症在世界范围内广泛流行,据2022年WHO估计,全球约有15%的育龄夫妇受不孕症的影响[2]。治疗不孕症有着至关重要的公共卫生意义。
不孕症的治疗方式因病因而异,辅助生殖技术(assisted reproductive technology,ART)被认为是目前治疗不孕症最终和最有效的方法之一。据估计,2018年全球约有900万婴儿通过ART出生[3]。体外受精-胚胎移植(in vitro fertilization and embryo transfer,IVF-ET)俗称“试管婴儿”,是最常用的ART方法之一。一项研究调查了中国上海市2010年1月至2017年6月期间行IVF-ET治疗的妇女,收集了共22 043个冻融周期,发现临床妊娠率在49%~54%[4]。其治疗结局受到多方面的影响,目前已有较多的相关研究或报道,但其间依然存在争议及不确定因素。
机器学习是人工智能的一个分支,现已被广泛应用于疾病的诊断和预测。在辅助生殖领域,大量的研究表明机器学习辅助决策有助于进一步提高IVF-ET的成功率[5]。相较于传统统计学模型,机器学习有着更好的预测效果,Barnett-Itzhaki等[6]的研究仅纳入136个周期,发现基于年龄、体重指数(body mass index, BMI)等临床数据的机器学习算法在预测IVF-ET结局方面优于传统Logistic回归。此外,基于树的算法,如随机森林(random forest,RF)算法,可以通过控制变量建立损失函数,可用于计算变量重要性。例如Chen等[7]的研究纳入了3 012个IVF-ET周期,构建活产结局预测模型,发现重要性前三位变量依次为女方年龄、血清雌二醇水平和黄体生成素水平。但既往研究中,变量的筛选主要基于统计学结果或临床经验,缺乏对重要变量的定量模型解释,部分研究甚至并无变量筛选步骤。因此,本研究综合多种变量筛选方式,结合文献研究补充关键变量,以期更具代表性地量化不同典型变量对IVF-ET活产结局的贡献程度,并定量寻找关键变量的敏感区间,为临床工作者和患者提供科学的决策参考。
本研究是建立在已有队列上的回顾性队列研究,原队列于 2012年—2021年期间,在山东省烟台毓璜顶医院生殖医学科,收集IVF-ET治疗的周期信息。本研究主要关注结局为活产,即孕满28周(或出生体重达1 000 g及以上),胎儿娩出后具有呼吸、心跳、脐带搏动、随意肌收缩之一[8]。收集资料主要包括接受IVF-ET治疗患者的一般信息、既往病史、激素水平、治疗操作记录以及胚胎信息等。冷冻胚胎移植受冷冻条件、天数等多因素影响,本研究未获得相关信息。此外,本研究主要关注IVF-ET治疗,在临床上进行IVF-ET治疗多为45岁以下患者,移植胚胎数多小于等于3个。为确保构建模型的代表性及科学性,在原队列基础上,本研究按以下标准进行排除:(1)冷冻胚胎移植周期治疗;(2)女方年龄大于或等于45岁;(3)移植胚胎数大于3个;(4)采用除IVF-ET外的ART辅助技术。经排除,本研究最终纳入5 859个IVF-ET新鲜周期,包含活产结局共101个特征变量。本研究得到北京大学人民医院伦理委员会批准(2021PHB358-001)。
本研究采用三种方式对变量进行初步筛选,见图1 变量的筛选流程。(1)基于单因素Logistic回归,筛选对结局影响差异具有统计学意义(P <0.01)的变量集合。(2)基于多因素套索回归(least absolute shrinkage and selection operator regression,LASSO),筛选出收缩系数非零的变量集合。(3)基于随机森林算法,计算所有变量的重要性系数,筛选出能贡献85%重要性的变量集合。对以上三种方式筛选结果取交集,得到初步的变量筛选结果。此外,本研究资料来自单一中心,为使结果更具代表性,本研究进一步通过PubMed网站,以“(ivf OR ivf-et OR "in vitro fertilization and embryo transfer") AND("live birth") AND(association) AND(cohort)”为关键词进行文献检索,基于既往研究的关联性结果,对初步筛选的变量集合做进一步补充。
图1 变量筛选流程
Figure 1 Flowchart of variable screening
本研究使用 R 4.2.0(R Development Core Team, Austria)统计分析软件进行分析,所有统计均为双侧检验。本研究预测模型的构建过程中,主要使用tidyverse包(https://www.tidyverse.org/packages/)对数据进行清洗,用mlr3包(https://mlr3book.mlr-org.com/)训练机器学习模型并进行交叉验证。基于树的机器学习模型可以通过控制变量,并建立损失函数,可用于计算变量重要性,这有利于展示单一变量对预测结局的影响程度。本研究采用随机森林算法,计算筛选的变量的重要性系数,并进行排序,筛选出重要性系数 >0变量,计算变量的重要性贡献百分比。最后,本研究进一步利用DALEX包(https://github.com/cran/DALEX),绘制预测模型的部分依赖曲线(partial dependence curve),进行模型解释。进而给出关键变量的敏感区间。
本研究最终纳入5 859个IVF-ET新鲜治疗周期,共101个变量。本研究首先综合单因素分析、多因素分析、随机森林重要性系数分析三种方式对101个自变量进行筛选,初步筛选出19个变量。在此基础上,本研究进一步结合文献检索,共查找787篇文献,筛选出既往报道中,与IVF-ET治疗活产结局关联有统计学意义的影响因素,补充了包括父方体质指数(BMIM)、父方年龄(AGEM)、抗缪勒氏管激素水平(CAMH)、既往流产史(NP.A)、基础促性腺激素水平(CB.FSH)、子宫内膜异位症(endometriosis,EDT)等共9个特征。本研究最终纳入共28个特征,用于后续的机器学习建模与关键特征识别。
5 859个新鲜胚胎移植周期的28个变量的基本情况见表1。本研究纳入新鲜胚胎移植周期的活产率约为43%,在活产的周期中,女方的平均年龄(AGEF)为31.8岁,低于非活产周期的33.4岁;父方平均年龄(AGEM)为33.2岁也低于非活产周期的34.4岁。从BMI上看,活产周期的女方和父方平均BMI(BMIM、BMIF)均低于非活产周期。在优质胚胎总数(TNHQE)上,活产周期的平均优质胚胎总数为3.4个,非活产周期仅2.6个。
表1 研究人群的基本特征 Table 1 Basic characteristics of the study population
VariablesDescriptionnon-LB[N=3 333(57%)]LB[N=2 526(43%)]AGEF (years)Female age33.4±4.531.8±3.5AGEM (years)Male age34.4±5.133.2±4.3BMIF (kg/m2)Body mass index of female24.0±3.723.5±3.5BMIM (kg/m2)Body mass index of male26.1±3.726.0±3.7TNHQE Total number of high-quality embryos2.6±2.23.4±2.2TNET Total number of transferred embryos1.8±0.41.9±0.3NHQE.IVFNumber of high-quality embryos transferred using IVF treatment1.1±0.91.4±0.8EMTHCG (mm)Endometrial thickness on the hCG day10.9±2.2 11.6±2.2 NBA.D5.IVF Number of available blastocysts on day 5 using IVF treatment0.9±1.61.3±1.8CGN.LH (U/L)Concentration of luteinizing hormone on the GN initial day3.5±3.02.9±2.3NET.IVF Number of transferred embryos using IVF treatment1.4±0.81.6±0.8CET.E2 (μg/L)Concentration of basal estradiol on the day of embryo transfer1 332±763 1 479±778 NHQB.D5.IVF Number of high-quality blastocysts on day 5 using IVF treatment0.5±1.00.7±1.3CET.P (μg/L)Concentration of progesterone on the day of embryo transfer54±1657±8 NME Number of mature eggs5.6±3.36.4±3.2CHCG.LH (U/L)Concentration of luteinizing hormone on the day of HCG injection3.4±3.03.0±2.0NP.A Number of previous abortion times0.7±1.00.5±0.8TNBF.D6 Total numbers of blastocyst formation on day 60.8±1.21.0±1.2NOR.IVF Number of oocytes retrieved using IVF treatment5.7±4.26.6±4.2RLH/FSH Ratio of basalluteinizing hormone concentration to basal follicle stimulating hor-mone concentration in blood0.8±0.60.8±0.8CAMH (ng/mL)Concentration of blood anti-Mullerian hormone3.7±3.33.9±3.0CB.FSH (U/L)Concentration of basal follicle stimulating hormone7.4±3.87.0±2.2CHCG.E2 (nmol/L)Concentration of estradiol on the day of hCG injection2 170±1 2542 429±1 267CHCG.P ((μg/L))Concentration of progesterone on the day of HCG injection0.7±0.40.8±0.3QET [n(%)]Quality of embryos transferred Other 546(16) 179(7.1) High2 787(84)2 347(93)DO [n(%)]Disturbance of ovulation No2 828(85)2 243(89) Yes 505(15) 283(11)EDT [n(%)]Endometriosis No2 979(89)2 187(87) Yes 354(11) 339(13)LOSP [n(%)]Long ovarian stimulation protocol No1 593(48) 861(34) Yes1 740(52)1 665(66)
LB=Live birth
本研究利用RF算法,计算28个变量的重要性系数,进一步得出其贡献百分比,以此获得各特征对活产结局的重要性排序,结果见图2。总体上,女方年龄(AGEF)、优质胚胎总数(TNHQE)以及IVF移植优胚数(NHQE.IVF)的重要性贡献较为靠前,分别贡献了16.0%、13.8%以及8.3%的重要性。在28个特征中,前5个重要变量贡献了50.5%的重要性。总体上,根据文献研究新增变量的重要性贡献较低,其中,抗缪勒氏管激素水平(CAMH)贡献了2.9%,而子宫内膜异位症(EDT)仅贡献了0.4%。
图2 变量贡献百分比
Figure 2 Percentage of variable contributions
本研究采用RF算法,构建活产的预测模型。对总模型进行模型解释,并绘制四个关键特征的部分依赖曲线,见图3 A-D。总体上,变量的重要性系数越高,预测结果随该变量的变化趋势越明显,例如女方年龄(AGEF)和优质胚胎总数(TNHQE)。由图3 A可以观察到,活产成功率,即基于模型预测所得的活产概率,随AGEF的增加而逐渐降低,当AGEF≥37岁时,降低趋势更加急剧;相反的是,当TNHQE从0增加到2时,成功率迅速增加,而当TNHQE≥2时,增长趋于平缓(图3 B)。IVF移植优胚数(NHQE.IVF)和hCG日子宫内膜厚度(EMTHCG)对活产成功率的影响并不明显,总体上趋势趋于平稳(图3 C和图3 D)。
图3 关键变量的部分依赖曲线
Figure 3 Partial dependence curves for key variables
本研究纳入共5 859个IVF-ET新鲜胚胎移植周期,综合多种变量筛选方式进行初步筛选,并结合文献研究补充重要变量,进一步提高研究的代表性。对于纳入的变量,本研究利用随机森林算法计算其重要性系数,获得变量重要性贡献百分比,发现影响IVF-ET活产结局的最重要变量为女方年龄(AGEF)。此外,本研究对于重要典型变量,绘制部分依赖曲线,探讨变量的敏感区间,发现当AGEF≥37岁时,活产成功率出现骤降趋势;而当优质胚胎总数(TNHQE)达到2时,活产成功率增长达到顶峰并趋于平缓。
本研究发现,女方年龄(AGEF)是预测IVF-ET活产结局的最重要因素,其次为优质胚胎总数(TNHQE)。既往有研究构建机器学习模型预测IVF-ET治疗的活产结局,并计算了重要性系数,大部分研究均提示女方年龄的重要性在首要位置。Liu等[9]的研究纳入了1 857个治疗周期,构建活产预测模型,研究发现重要性前三变量依次为女方年龄、抗缪勒氏管激素水平和卵泡刺激素水平。Bhattacharya等[10]的研究也提示女方年龄的重要性排在首位,其次为移植优胚数。而Amini等[11]的研究中,排在首要位置的变量为移植胚胎数。本研究的研究样本来自中国三级甲等医院辅助生殖中心,数据量大,综合了统计学方式以及文献研究筛选模型的纳入特征,结果更具有人群代表性。
本研究发现,当AGEF≥37岁时,活产成功率出现骤降趋势。既往也有大量研究探讨行IVF-ET治疗的最佳年龄,但研究的结果并未达到一致。早在2002年的一项研究纳入2 708个周期,发现当女方年龄在35岁以下时,累积受孕率最高[12]。另一项研究也发现了当女方年龄超过35岁时,会降低IVF-ET临床妊娠率,并增加自然流产率[13]。而有一项在澳大利亚进行的研究则认为22至36岁女性的IVF-ET成功率最高[14]。卵母细胞和子宫的老化[15]以及年龄依赖性卵巢储备和卵母细胞质量下降[16]是高龄女性IVF-ET失败的原因。本研究女方年龄的部分依赖曲线显示拐点在37岁,基于统计学模型所得结果,可为IVF-ET治疗的临床决策提供更有力参考。
对于培养优质胚胎总数,其与IVF-ET治疗结局的关联性研究相对较少。一项国内的研究分析了5 543个周期的临床资料,使用二元Logistic回归分析,发现培养优质胚胎总数对单胚胎移植临床妊娠结局的影响差异并无统计学意义(P= 0.74)[17]。而Dean等[18]的一项临床将380名接受IVF-ET治疗、有三个或更多优质胚胎可供移植的患者分为两组,对于,第1组的患者可以选择移植两个或三个胚胎,而第2组的患者最多可以移植两个胚胎;该研究结果显示,第1组的多胎妊娠率和三胎妊娠率明显提高,认为对于35岁以下的妇女,有三个或更多优质胚胎可供移植时,通常最多应移植两个胚胎。本研究发现当优质胚胎总数(TNHQE)达到2时,活产成功率增长达到顶峰并趋于平缓,提示临床上,应当以优质胚胎总数(TNHQE)为2作为IVF-ET治疗过程判断胚胎移植预后的重要指标。
综上所述,本研究结合了统计学方式以及文献研究筛选模型的纳入特征,结果更具代表性,具有更高的可信度。本研究主要有以下结论:(1)女方年龄、优质胚胎总数是影响IVF-ET新鲜周期移植治疗结局的重要因素;(2)女方年龄达到37岁和优质胚胎总数达到2个是影响IVF-ET新鲜周期移植治疗活产结局的重要拐点。推荐不孕症患者在37岁之前接受IVF-ET治疗,临床上培养的优质胚胎总数达到2个的治疗效果最佳。
1 Practice Committee of the American Society for Reproductive Medicine.Definitions of infertility and recurrent pregnancy loss.Fertil Steril,2008,90:S60.
2 Wei Y,Wang J,Qu R,et al.Genetic mechanisms of fertilization failure and early embryonic arrest:a comprehensive review.Hum Reprod Update,2024,30:48-80.
3 Adamson GD,Dyer S,Chambers G,et al.O-151 ICMART preliminary world report 2018.Human Reproduction,2022,37:deac105.
4 Zhang J,Liu H,Mao X,et al.Effect of body mass index on pregnancy outcomes in a freeze-all policy:an analysis of 22,043 first autologous frozen-thawed embryo transfer cycles in China.BMC Med,2019,17:114.
5 Raef B,Ferdousi R.A Review of Machine Learning Approaches in Assisted Reproductive Technologies.Acta Inform Med,2019,27:205-211.
6 Barnett-Itzhaki Z,Elbaz M,Butterman R,et al.Machine learning vs.classic statistics for the prediction of IVF outcomes.J Assist Reprod Genet,2020,37:2405-2412.
7 Chen Z,Zhang D,Zhen J,et al.Predicting cumulative live birth rate for patients undergoing in vitro fertilization(IVF)/intracytoplasmic sperm injection(ICSI) for tubal and male infertility:a machine learning approach using XGBoost.Chin Med J(Engl),2022,135:997-999.
8 Xu B,Geerts D,Yuan J,et al.A modified flexible GnRH antagonist protocol using antagonist early cessation and a gonadotropin step-down approach improves live birth rates in fresh cycles:a randomized controlled trial.Human Reproduction,2024,39:1969-78.
9 Liu X,Chen Z,Ji Y.Construction of the machine learning-based live birth prediction models for the first in vitro fertilization pregnant women.BMC Pregnancy Childbirth,2023,23:476.
10 Bhattacharya S,Harrild K,Mollison J,et al.Clomifene citrate or unstimulated intrauterine insemination compared with expectant management for unexplained infertility:pragmatic randomised controlled trial.BMJ,2008,337:a716.
11 Amini P,Ramezanali F,Parchehbaf-Kashani M,et al.Factors Associated with In Vitro Fertilization Live Birth Outcome:A Comparison of Different Classification Methods.Int J Fertil Steril,2021,15:128-134.
12 Sharma V,Allgar V,Rajkhowa M.Factors influencing the cumulative conception rate and discontinuation of in vitro fertilization treatment for infertility.Fertil Steril,2002,78:40-46.
13 Preutthipan S,Amso N,Curtis P,et al.Effect of maternal age on clinical outcome in women undergoing in vitro fertilization and embryo transfer(IVF-ET).J Med Assoc Thai,1996,79:347-352.
14 Wang YA,Healy D,Black D,et al.Age-specific success rate for women undertaking their first assisted reproduction technology treatment using their own oocytes in Australia,2002-2005.Hum Reprod,2008,23:1633-1638.
15 P,Bener A,Karabulut S.Comparison of machine learning classification techniques to predict implantation success in an IVF treatment cycle.Reprod Biomed Online,2022,45:923-934.
16 Ubaldi F,Vaiarelli A,D′Anna R,et al.Management of poor responders in IVF:is there anything new.Biomed Res Int,2014,2014:352098.
17 黄映琴,黄冬梅,黄玲,等.新鲜单卵裂胚与单囊胚移植周期妊娠结局及其影响因素分析.中国临床新医学,2023,16:951-957.
18 Dean NL,Phillips SJ,Buckett WM,et al.Impact of reducing the number of embryos transferred from three to two in women under the age of 35 who produced three or more high-quality embryos.Fertil Steril,2000,74:820-823.