当前位置: 首页 > 详情页

基于Skip-gram词嵌入算法的结构化患者特征表示方法研究

| 导出 |

文献详情

资源类型:

收录情况: ◇ 统计源期刊

机构: [1]首都医科大学生物医学工程学院 [2]首都医科大学临床生物力学应用基础研究北京市重点实验室 [3]首都医科大学宣武医院
出处:
ISSN:

关键词: 电子病历 Skip-gram算法 特征表示 自然语言处理 词嵌入

摘要:
目的 基于表示学习中的Skip-gram词嵌入算法,寻找能够克服电子病历中结构化特征的高维性并在语义层次上表示特征的方法。方法 本文的数据来源于北京市某三甲医院的电子病历系统,从中提取患者的结构化特征,包括疾病、药物和实验室指标,其中实验室指标通过正常值范围离散化;利用Skip-gram算法,将电子病历中离散型患者特征(疾病和药物)和离散后的连续型患者特征(实验室指标)嵌入到同一个低维实数向量空间中。通过t-SNE降维可视化方法显示低维实数空间中特征向量的关系,并与特征向量间的余弦距离计算结果相互印证,从而评价特征表示的有效性和揭示特征向量间的潜在联系。结果 患者特征的低维实数向量既降低了患者特征的维度,又很好地表征了特征间的潜在联系,临床含义相关的特征表示成的低维实数向量也很相近。结论 基于Skip-gram算法将患者结构化特征表示成低维实数向量取得了较好的效果,为解决EMR数据表示的高维性以及结构化特征间潜在关系分析提供一种思路。

语种:
中文影响因子:
第一作者:
推荐引用方式(GB/T 7714):

资源点击量:16461 今日访问量:0 总访问量:871 更新日期:2025-01-01 建议使用谷歌、火狐浏览器 常见问题

版权所有©2020 首都医科大学宣武医院 技术支持:重庆聚合科技有限公司 地址:北京市西城区长椿街45号宣武医院