·妇儿临床·

医学自然语言处理技术对产科病历逻辑错误的质量控制效果

赵悦淑 王蕊 窦华溢 张坤丽 王军

【摘要】 目的 运用医学自然语言处理技术查找病历的逻辑错误,提高病历质量。 方法 选取2016年1月1日至2016年12月31在河南省某三甲医院的全部产科出院患者的产科首次病程记录,共计19 860份。运用自然语言处理技术把归档的产科病历的产科检查抽取成Excel文件,然后查找可疑逻辑错误,把错误项与原始病历核对,最后由病历书写者确认错误。 结果 19 860份中有309份除住院号、性别、年龄外,其他字段全部为“空”,只有19 551份包括主诉等内容。在19 551份病历中,共发现通过人工质控和质控软件没有发现的存在逻辑错误的病例1 246份(0.28%)。逻辑错误共23类,错误率最高的前三位分别是髂嵴间径小于髂棘间径259个(1.32%),预产期在末次月经前140个(0.72%),宫高和腹围填写颠倒120个(0.61%),极度异常值如腹围 703.0 cm。 结论 自然语言处理技术用于文本病历的逻辑错误审核,比人工审核快速、客观、全面。

【关键词】 自然语言; 逻辑错误; 质量控制; 病历

分娩期安全管理是产科质量控制的主要内容之一[1]。“全面两孩”政策在中国启动后,高龄孕产妇的比例增高,妊娠和分娩期并发症增多,导致医务人员的工作强度增加,用于病历书写和审核的时间相对减少,病历质量下降[2]。病历缺陷不仅影响诊疗效果,产生医疗过失,甚至导致医疗纠纷赔偿。因此,病历质量控制是医疗质量管理的重要环节[3]

电子病历质量控制系统实现了病历的完整性、时限性、前后一致性、内涵逻辑错误检查的系统审核和监测结果自动提醒、评分功能等[4]。医院病历管理要求病历书写者、科室、病案室和医务部、病案委员会四个层面进行质控。电子病历质量控制系统的使用和逐级质控有效提高了病历质量,但逻辑错误没有明显改善[5]

中国电子病历卫生行业标准规定“人读部分”的纯文本数据项共307处[6]。病历中纯文本自动化提取比较困难[7]。由于时间限制和工作量增大,通过人工进行文本数据的全部质控较为困难,只能进行病案管理要求的重点内容审核。为了提高产科病历首次病程记录质量,消除逻辑错误,本文对部分医院已经归档的产科首次病程记录,运用医学自然语言处理技术,对产科检查等文本部分的关键字段结构化处理后,通过逻辑分析,发现逻辑错误,为产科质量控制体系建设提供科学依据,为产科专科病历信息化建设提供产科专业指导,从而提高产妇分娩期安全。

对象与方法

1.对象:2016年1月1日至2016年12月31日在河南省某三甲医院的全部产科出院患者的产科首次病程记录,共计19 860份。产科首次病程记录中的主诉、入院查体、产科检查、辅助检查、入院诊断、诊断依据、鉴别诊断和诊疗计划等内容。重点抽取了住院号、性别、年龄(岁)、主诉、末次月经日期(LMP)、预产期(EDC)、体温(T)、心率(P)、呼吸次数(R)、高血压(HBP)、低血压(LBP)、骨盆测量中的髂棘间径(IS)、髂嵴间径(IC)、骶耻外径(EC)、坐骨结节间径(TO),宫高、腹围、胎心、胎儿估重、肛诊共计20项内容。

2.方法:(1)病历文件转为纯文本文件。使用病历转换系统,把19 860份“*.emr”格式的产科首次病程记录转换为以住院号命名的19 860份纯文本文件;(2)纯文本文件转化为Excel文件。运用自然语言技术研发程序把纯文本文件进行匿名化处理,对匿名化的纯文本文件进行医学自然语言处理[8],把研究内容中的字段抽取成Excel 4.0文件;(3)对Excel文件分析。对Excel文件,通过排序,查看较大和较小的可疑值,用(预产期-末次月经)、(髂嵴间径(IC)-髂棘间径(IS))、(高血压-低血压)、(宫高-腹围)等条件进行计算,发现可疑逻辑错误数据;(4)可疑逻辑错误确认。可疑逻辑错误数据与原始病历核对,排除提取错误后,由病历书写人员确认是逻辑错误。

3.统计学处理:采用SPSS 21.0统计软件对数据进行描述性分析,排序,条件计算。构成比用百分率表示。

结果

1.抽取数据的完整性和正确性:抽取成功的Excel文件中,共19 860份,其中309份除住院号、性别、年龄外,其他字段全部为“空”。19 551份包括主诉等内容。核查原始病历,是入院小于8 h出院,没有书写首次病程记录,抽取数据正确。

2.数据抽取所用的时间:从病历文件到转换成为Excel文件共用时间20 h 30 s。其中19 860份病历格式的产科首次病程记录转换为以住院号命名的19 860份纯文本文件用时15 h 42 s,把19 860份纯文本文件转换成Excel文件用时间4 h 48 s。

3.运用自然语言技术处理后,用统计软件分析产科首次病程记录,总结的逻辑错误条件、逻辑错误数及率见表1。

讨论

本文运用医学自然语言处理技术进行归档病历中的产科电子病历首次病程记录,审核出逻辑错误1 246项,错误率0.28%。这类逻辑错误是一些医院的个别现象,还是产科首次病程记录的共性问题?通过到北京一些知名三甲医院信息化参观和学习,使用北京相关医院的病历质控软件,按照“宫高大于腹围”等条件查询后,同样发现有腹围13 cm等类似的逻辑错误数值。

这类错误产生的原因是什么?为什么经过多级质控,这些错误没有被发现? 在二胎政策下,经产妇增多,产科患者中妊娠合并子宫瘢痕等产科并发症的患者显著增加,导致产科人员书写产科首次病程记录时的模板筛选等工作量增加。并发症患者可能不良结局的预防消耗了产科人员的大量时间和精力,用于产科首次病程记录的检查和审核时间减少,上级医师做不到每个病历均看。宫高和腹围录入数据颠倒,如体温36.5℃,少录入了3,导致体温6.5℃等错误的发生[6]

表1 产科首次病程记录中的逻辑错误条件、错误数(%)及错误举例

编号逻辑错误条件逻辑错误数[例(%)]逻辑错误举例1髂嵴间径(IC)<髂棘间径(IS)259(1.32)IS80cm,IC26cm;IS25m,IC0.3cm2预产期在末次月经前140(0.72)末次月经:2016/6/17;预产期:2016/3/243宫高和腹围填写颠倒120(0.61)宫高79.0cm,腹围16cm4呼吸次数<14次/分89(0.46)呼吸2次/分;胎儿心率144次/分5宫高非数字87(0.44)脐平;脐耻之间;6血压未填写85(0.43)高压/低压mmHg;7(预产期-末次月经)>300d76(0.39)末次月经:2015/8/28;预产期2016/6/258孕7个月以上,胎儿估重<1000g58(0.30)停经9月余,阵发性腹痛4h,胎儿估重35g9胎心<100次/分,主诉无死胎等57(0.29)停经9月余,不规律下腹痛12min;胎心0次10呼吸>30次/分51(0.26)呼吸96次/分;胎儿心率144次/分11髂嵴间径(IC)<20cm48(0.25)0.3cm12腹围<60cm41(0.21)胎儿估重3100g,宫高15cm,腹围33cm13体温未填写34(0.17)体温℃14骶耻外径(EC)<15cm32(0.16)1.0cm15宫高>50cm但小于腹围18(0.09)宫高73cm,腹围108cm16髂棘间径IS<20cm13(0.07)2.0cm17髂嵴间径(IC)>35cm11(0.06)99.0cm18髂棘间径IS>30cm9(0.05)80.0cm19胎心>400次/分7(0.04)胎心:132140次/分20体温<35℃4(0.02)T6.5℃21骶耻外径(EC)>30cm3(0.02)49.0cm22腹围>200cm2(0.01)宫高34.0cm,腹围402.0cm;宫高36.0cm,腹围703.0cm23高血压<低血压2(0.01)0/89mmHg;10/67mmHg合计1246(0.28)

《医疗质量管理办法》中的病历书写与病案管理制度要求医疗机构医疗质量管理实行院、科两级责任制,强调科室医疗质量管理与质量相关部门联动监管,重视病历质量环节质控[9]。在病历质量控制方面,本文中的三甲医院执行四级质控,第一级:在患者出院前,管床主治医师质控病历完成情况,全面检查纠正错误后签字;第二级:病历出科前,每科指定的科室质控医师监控病历质量并签字;第三级:病案管理部门和质控管理部门,每月抽检;第四级:医务部组织病案管理委员会对病历审核,并进行综合质量进行管理。

本文中的三甲医院虽然进行了严格的病历质量和母婴安全管理,基本按照《医疗质量管理办法》规定的内容进行,产科首次病程记录中上述内容属于文本内容,不是重点审核内容。

目前的电子病历质控系统主要按照《医疗质量管理办法》规定的内容进行智能化审核[10],可以实现病历完整性、时限性、一致性、内在的逻辑性的实时监测和在线跟踪,及各项记录的书写时间、完成时间、修改时间全程监控功能;根据监控结果的自动提醒;以病人、科室、病种,时间段为信息质控单元,参照《医疗质量管理办法》及相关的评分标准的自动或者手动评分功能;自动判别不同数据、各种记录之间错综复杂的逻辑关系、唯一关系、替代关系、并列关系和等级关系等,从中准确找出最适当的记录及其规定时限的智能判别功能。例如,女性患者不能出现“提睾反射”等[4]。智能化系统的智能判断条件按照《医疗质量管理办法》进行设置,基本雷同。智能化程度的高低是根据产科首次病程记录中所有的内容可以自动提取多少个、可以进行分析的字段以及提取的正确率来判断的。智能化软件可以个性化设置查询条件,但工程师不知道需要设置哪些条件。真正特色化的智能判断条件是由产科专家、智能化信息系统建设单位的工程师和医院管理部门共同研究后制订,并将其设定在智能化信息系统中才能发挥作用。

本文报告的产科首次病程记录中的逻辑关系条件:预产期-末次月经≠280 d;宫高大于腹围;髂嵴间径(IC)大于髂棘间径(IS);胎心次数<100次/分,没有胎儿宫内窘迫的相关记录等是产科专科病历智能化建设的逻辑条件。

另外,对产科检查数据的最大值和最小值的规定也是产科学术界值得关注的研究,对推进产科专科病历建设,提高产科工作效率,保证医疗安全有重要意义。

上述逻辑错误的消除方法:(1)在病历模板中进行数据限制,超过范围最大值和最小值的数据,自动提醒:是否录入错误?(2)把本文的逻辑条件加入智能审核程序中,书写完成后进行实时电子病历质控;(3)没有质控系统的医疗机构,定期召开病历质量分析会议,把本文中常见的错误作为人工质控的重点审核。

随着医疗纠纷时患者可以在任意时间复印病历,对产科病历质量和书写时限提出了更高的要求。产科专家在进行产科专业学术研究的同时,要参与指导产科专科病历的信息化建设,使用信息化技术提高产科工作效率,为产科医疗安全和医学科研提供强力支撑。

参考文献

1 陈敦金,陈艳红.建立完善的产科质量控制体系.中华围产医学杂志,2017,9:632-635.

2 林文华,刘礼芳,蔡红侠,等.二胎高龄孕妇妊娠结局的临床分析.中国卫生标准管理,2019,1:65-67.

3 王志强,黄丹,赵越.运用电子病历质控提高病历质控效率.中国医学创新,2013,22:154-155.

4 刘晓东,宋俊.结构化电子病历质量控制新模式实践与探讨.中国医疗设备,2018,9:168-171.

5 张艳红,李小莹,王力红,等.电子病历的质量控制.中国病案,2015,12:13-14.

6 中华人民共和国国家卫生和计划生育委员会.关于发布《电子病历共享文档规范第1部分:病历概要》 等57项卫生行业标准的通告[EB/OL].(2016-09-12)http://www.nhfpc.gov.cn/fzs/s7852d/201609/37f11aacca5a49c2ad0984c8fc7a2873.html.

7 包小源,黄婉晶,张凯,等.非结构化电子病历中信息抽取的定制化方法.北京大学学报(医学版),2018,2:256-263.

8 张坤丽,马鸿超,赵悦淑,等.基于自然语言处理的中文产科电子病历研究.郑州大学学报(理学版),2017,2:40-45.

9 杨开浩,吴永忠,汪波.以科级质量管理为基础的病历质量考评机制建立.中国医院管理,2016,7:38-39.

10 苏茂华.电子病历质量控制及保障措施研究.中国保健营养,2017,5:156.

基金项目:河南省医学科技攻关省部共建项目(2018SBGJ2018048)

作者单位:450052 郑州,郑州大学第三附属医院产科(赵悦淑,王蕊,王军);鹏城实验室(赵悦淑,王蕊,窦华溢,张坤丽);郑州大学信息工程学院计算机科学系(窦华溢,张坤丽)

通讯作者:王军(wj3028@163.com)

共同第一作者

(收稿日期:2019-11-13)