作者团队:平台产品研发部(黄亮、郭旭炀、崔新龙、刘慧、王虎)
受到新冠肺炎疫情影响,互联网医疗行业的发展进入了加速期。由于在线医药服务便捷、快速,而且能够避免医院拥挤和排队等不愉快体验,公众的接受度在快速提高。越来越多的人选择了线上问诊,不过仍然存在一些顾虑,例如线上问诊是否规范?是否有标准流程对隔着网络的医生进行约束?问诊结果是否有针对性?是否有质量保障?针对这些问题,作为互联网医疗的从业者,同时又是算法工程师的我们能够做些什么工作来消除大众的疑虑呢?
目前,全国已有900家互联网医院,30个省份建立了互联网医疗服务监管平台。治疗质量和安全成为不容忽视的环节,纵观线下用以保障医疗质量和安全的举措,线上至少应该搭建起事前、事中、事后的保障体系。
2020年《银川市互联网诊疗服务规范(试行)》专门制定了“医疗质量管理”章节,规范了医生接诊时效、投诉处理等方面;今年的《政府工作报告》首次提出促进‘互联网+医疗健康’规范发展,意味着国家将推动互联网医疗行业进入规范、可持续的发展轨道,制度层面,互联网医疗对质量控制的规范正在逐步细化与重视。
目前京东互联网医院线上诊疗涵盖二级科室近130个,日均处理问诊订单数十万单,其中图文问诊占绝大多数;线上接诊医生有京东健康的全职医生以及兼职医生,其中兼职医生占比绝大多数;线上诊疗服务风险高、难度大、合规管控严,保证诊疗安全是健康业务发展的首要职责。
对线上诊疗数据进行分析,发现:
线上疾病诊断-质控问题多:互联网医院线上问诊流程颠倒、内容不全、诊断欠合理、用药存风险成为现阶段突出问题;
线上医疗服务-容错能力低:大众及行业对医疗事故高度敏感,医生轻微过失将引发医疗纠纷,致使京东健康商誉受损,影响业务发展;
医生服务质量-评估挑战大:诊疗对话信息、医生诊断结果、患者满意度打分无法综合评估医生问诊质量、问诊效果、患者真实就诊体验;
医患诊疗内容-审核效率低:线上问答自由,问诊意图多变,问诊信息口语化明显;医学诊断专业、病理推理复杂、问诊审核成本较高;
京东健康技术产品部团队通过自然语言处理技术及知识图谱,对医患问诊内容进行识别分析,将线上医疗风控分为流程质控、内涵质控;并对不同问题划分风险等级,一旦出现严重问题,则立即使用报警模块通知相关医生或质控人员进行核查并及时联系患者;如果是一般问题或无问题,则进入人工质控模块进行人工抽样核验。同时,人工质控的人工核验结果,会作为训练样本对质控模块进行性能优化。
信息提取模块包含5个主要的功能:
问句识别:准确判断医患对话文本句式(疑问句、陈述句)
问句匹配:关联医患对话上下文内容,快速匹配问答关系,确定医生询问槽位的状态
NER:标记医患对话中出现的疾病、症状、患病时长等实体信息
关系抽取:结合NER模型的输出结果,采用pipeline的方式,判断医患对话中实体信息之间的关系类型
主题分割:使用无监督的LDA算法模型,文本分类模型以及规则引擎,提取各个流程的关键词
如上图所示,流程质控相关模型的功能是检测对话中是否包含以下几种情形:
- 是否包含必要的问诊过程
- 是否明确告知患者所患疾病(拟诊)
- 在开具药物前,是否询问或已了解患者的过敏史、病史、怀孕等特殊情况
- 在开具药物的情况下,是否明确告知患者药物的用法用量等信息(用药建议)
使用知识图谱和业务规则对医生的诊断以及开药进行合理性评估。内涵质控首先通过对话信息提取模块,提取出对话信息中患者涉及的症状、病程、患者自身的信息,使用业务规则与问诊知识图谱召回患者可能患得的候选疾病,如果医生所下诊断不在候选疾病中,则提示该诊断存在风险。
目前,问诊质控服务已经对京东互联网医院的所有图文问诊进行了质量分析,质控系统对于涉及潜在风险问诊单的召回率大于99%,精确率90%。在此之前,一位医学专家一周的审单量是1k单。现在,通过人机协智模式(自动质控+专家复核),可辅助医学专家提升10倍效率(发现所有存在问题的问诊单,所需审核的问诊单数,降至之前审核单量的十分之一)。随着数据积累,系统指标的提升,这个效率将进一步提升,从而降低用户增长带来的边际成本。
问诊质控系统对不同一级科室的评价得分柱状图
在问诊质控服务中添加报告解读、图像识别等功能,对“图文问诊”中的每一个细节进行解析和识别。问诊质控属于线上问诊的诊后环节,随着算法的迭代和图谱的完善,诊中辅助问诊与建议用药等功能也会逐步上线,配合已经上线的智能分诊和预问诊,将形成覆盖全诊疗流程、全生命周期的线上医疗辅助决策系统。