当前位置: 首页 > 详情页

基于自然语言处理与结构化算法的病历信息高精度抽取方法研究

文献详情

资源类型:

收录情况: ◇ 统计源期刊

机构: [1]清华大学自动化系,北京 100084 [2]首都医科大学宣武医院信息科 [3]北京爱医声科技有限公司 [4]首都医科大学宣武医院神经内科
出处:

关键词: 电子病历 信息抽取 自然语言处理 知识图谱 结构化解析

摘要:
目的:综合运用自然语言处理、结构化算法和知识图谱等技术,探索实现电子病历高精度信息抽取和结构化处理的方法。方法:通过构建命名实体识别模型、关系识别模型、同义词识别模型完成病历文本的句内信息抽取;提出了一种病历生成树算法,可以有效实现大段落病历文本分层结构的解析;同时利用知识图谱技术存储信息抽取与分层解析的构造模型,实现病历文本信息高精度抽取。结果:形成了一套融合深度学习算法与结构化解析算法的病历信息高精度抽取方法,其中实体识别模型准确率达95.74%,关系识别模型准确率达89.20%,最终生成具有清晰层次结构、可精确定位和抽取信息的结构化病历。结论:本文所探索的病历信息高精度抽取方法,将深度学习算法与结构化解析算法相融合,兼顾了病历文本的句内信息抽取与病历结构层次的解析,可以实现对病历数据的自动抽取、精准定位与高效管理,可以为临床医学研究奠定数据基础,也可以为其他疾病病历文本数据的挖掘提供方法学参考。

基金:
语种:
第一作者:
第一作者机构: [1]清华大学自动化系,北京 100084
通讯作者:
推荐引用方式(GB/T 7714):

资源点击量:16409 今日访问量:0 总访问量:869 更新日期:2025-01-01 建议使用谷歌、火狐浏览器 常见问题

版权所有©2020 首都医科大学宣武医院 技术支持:重庆聚合科技有限公司 地址:北京市西城区长椿街45号宣武医院