摘要:
目的:综合运用自然语言处理、结构化算法和知识图谱等技术,探索实现电子病历高精度信息抽取和结构化处理的方法。方法:通过构建命名实体识别模型、关系识别模型、同义词识别模型完成病历文本的句内信息抽取;提出了一种病历生成树算法,可以有效实现大段落病历文本分层结构的解析;同时利用知识图谱技术存储信息抽取与分层解析的构造模型,实现病历文本信息高精度抽取。结果:形成了一套融合深度学习算法与结构化解析算法的病历信息高精度抽取方法,其中实体识别模型准确率达95.74%,关系识别模型准确率达89.20%,最终生成具有清晰层次结构、可精确定位和抽取信息的结构化病历。结论:本文所探索的病历信息高精度抽取方法,将深度学习算法与结构化解析算法相融合,兼顾了病历文本的句内信息抽取与病历结构层次的解析,可以实现对病历数据的自动抽取、精准定位与高效管理,可以为临床医学研究奠定数据基础,也可以为其他疾病病历文本数据的挖掘提供方法学参考。