基于电子病历和公开医学知识图谱的专病知识图谱构建

Construction of Specific Disease Knowledge Graph Based on Electronic Medical Records and Public Medical Knowledge Graph

暂未订购

导出

摘要目的基于公开的医学知识图谱和电子病历构建脑卒中临床专病知识图谱。方法使用生物医学信息本体系统和脑卒中患者结构化电子病历作为知识来源,依次构建脑卒中基础术语表、患者特征词表、脑卒中概念字典、脑卒中关系三元组集和脑卒中概念术语集,将关系三元组集和概念术语集导入Neo4j数据库中,完成脑卒中专病知识图谱的构建。通过知识图谱嵌入模型获得知识图谱表示,设计实验将链接预测和三元组分类作为评价任务对比图谱通过TransE、Rotate以及Analogy等模型获得的图谱嵌入的性能差异。此外,设计关于患者住院是否超过7和14 d的2个预测任务,将性能最优知识图谱嵌入与基于Skip-Gram算法的原始特征患者表示相融合,构建机器学习模型完成预测任务并评价其性能。评价指标采用F1得分、受试者工作特征(Receiver Operating Characteristic,ROC)的曲线下面积(Area Under Curve,AUC)、精确率-召回率AUC。结果构建的脑卒中专病知识图谱拥有215090个实体和550976个关系,基于RotatE模型获得最优图谱嵌入。实验结果显示,相较于P-vector,KGP-vector在预测患者住院是否超过7和14 d的任务中,F1得分、ROC的AUC、精确率-召回率AUC分别提升0.039、0.061、0.047和0.089、0.081、0.103。结论利用公开的医学知识图谱并结合患者数据可以快速构建高质量专病知识图谱,有望为脑卒中疾病的临床决策、疾病诊断以及个性化医疗提供支持。 Objective To construct a clinical specific disease knowledge graph of stroke based on the public medical knowledge graph and electronic medical records.Methods The biomedical information ontology system and the structured electronic medical records of stroke patients were used as knowledge sources,the basic terminology list of stroke,the characteristic word list of patients,the concept dictionary of stroke,the triplet set of stroke relationships and the concept terminology set of stroke were constructed successively.The relational triplet set and the conceptual term set were imported into the Neo4j database to complete the construction of the knowledge graph of stroke specific diseases.The knowledge graph representation was obtained through the knowledge graph embedding model.Experiments were designed to take link prediction and triple classification as evaluation tasks to compare the performance differences of the graph embeddings obtained by the graph through models such as TransE,Rotate,and Analogy.In addition,two prediction tasks were designed for whether the patient’s hospitalization exceeded 7 and 14 d.The embedding of the knowledge graph with the optimal performance was fused with the original feature patient representation based on the Skip-gram algorithm to construct a machine learning model to complete the prediction task and evaluate its performance.F1 score,area under curve(AUC)of receiver operating characteristic(ROC),and AUC of precision-recall rate were adopted as the evaluation indicators.Results The constructed knowledge graph for stroke specific diseases had 215090 entities and 550976 relationships,and the optimal graph embedding was obtained based on the RotatE model.The experimental results showed that,compared to the P-vector,the KGP-vector achieved improvements in the tasks of predicting whether a patient’s hospitalization exceeds 7 and 14 d.Specifically,the F1 score,ROC AUC,and precision-recall AUC increased by 0.039,0.061,0.047 and 0.089,0.081,0.103,respectively.Conclusion By using the public medical knowledge graph combined with patient data,a high-quality specific disease knowledge graph can be rapidly constructed,which is expected to provide support for clinical decision-making,disease diagnosis and personalized medical treatment of stroke diseases.

作者谢忠壤王牧雨范世玉李一晨陈卉 XIE Zhongrang;WANG Muyu;FAN Shiyu;LI Yichen;CHEN Hui(School of Biomedical Engineering,Capital Medical University,Beijing 100069,China;Beijing Key Laboratory of Basic Research in Applied Clinical Biomechanics,Capital Medical University,Beijing 100069,China)

机构地区首都医科大学生物医学工程学院首都医科大学临床生物力学应用基础研究北京市重点实验室

出处《中国医疗设备》 2025年第6期44-48,共5页 China Medical Devices

基金国家自然科学基金项目(82372094) 北京市自然科学基金(7252278)。

关键词知识图谱电子病历脑卒中生物医学信息本体系统患者表示预测模型 knowledge graph electronic medical record stroke biomedical information ontology system patient stated predictive model

分类号 R197.39 [医药卫生—卫生事业管理]

引文网络
相关文献

参考文献3

1林燕榕,张怡,刘迪,钱东平,斯海燕,姜玉苹,朱江,陆凯东,陈浩.基于肾病专科电子病历构建肾病医学知识图谱[J].西南大学学报（自然科学版）,2020,42(11):52-58. 被引量：8
2靳淑雁,王爽,黄琼,邱五七,林怿昊.基于乳腺癌专病库的知识图谱构建研究[J].医学信息学杂志,2023,44(12):65-70. 被引量：9
3黄艳群,王妮,刘红蕾,费晓璐,巍岚,陈卉.基于Skip-gram词嵌入算法的结构化患者特征表示方法研究[J].北京生物医学工程,2019,38(6):568-574. 被引量：7

二级参考文献30

1王飞,黄艺璠,汪鹏.基于多模态数据的肺癌专病库建设研究[J].中国数字医学,2021,16(12):85-88. 被引量：15
2刘俊丽,张秀梅,蒋勇青.基于文本挖掘的乙型肝炎相关文献知识图谱分析[J].医学信息学杂志,2014,35(1):48-53. 被引量：11
3赵雪娇.妇产科知识图谱构建研究与实现[J].中国数字医学,2019,14(1):3-5. 被引量：12
4刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600. 被引量：1171
5徐增林,盛泳潘,贺丽荣,王雅芳.知识图谱技术综述[J].电子科技大学学报,2016,45(4):589-606. 被引量：614
6无.电子病历应用管理规范(试行)[J].中国实用乡村医生杂志,2017,24(6):1-2. 被引量：15
7崔洁,陈德华,乐嘉锦.基于EMR的乳腺肿瘤知识图谱构建研究[J].计算机应用与软件,2017,34(12):122-126. 被引量：15
8张天齐,卞鹰.应用ICD-10编码辅助分析诊断质量[J].解放军医院管理杂志,2017,24(11):1001-1004. 被引量：4
9李伟康,李炜,吴云芳.深度学习中汉语字向量和词向量结合方式探究[J].中文信息学报,2017,31(6):140-146. 被引量：17
10翟社平,郭琳,高山,段宏宇,李兆兆,马越.一种采用贝叶斯推理的知识图谱补全方法[J].小型微型计算机系统,2018,39(5):995-999. 被引量：18

共引文献21

1孟庆春.基于N-gram特征的网络恶意代码分析方法[J].数字技术与应用,2020,38(3):49-50. 被引量：3
2黄嘉俊.基于组合语义相似度计算的疾病术语自动编码[J].微型电脑应用,2020,36(8):157-160. 被引量：5
3沈阳,李洪磊,陈杰.图数据模型及其在疫情追溯领域的应用研究[J].软件导刊,2021,20(2):13-17. 被引量：7
4刘晓聪,王华珍,何霆,缑锦,陈坚.医学文本表示学习方法与质量评测研究综述[J].计算机应用研究,2021,38(7):1930-1936. 被引量：1
5柳致远,范永胜,张万里,冯骥,李勇,黄靖.常见中文社交平台中网络欺凌语言的检测分析[J].西南师范大学学报（自然科学版）,2021,46(8):86-94. 被引量：3
6齐平平.TextRank与用户情感倾向在推荐算法中的研究[J].科技创新导报,2021,18(11):159-161.
7李梦翔,尤丽珏.基于深度主动学习的中文电子病历命名实体识别[J].微型电脑应用,2022,38(6):132-134. 被引量：8
8吴智妍,金卫,岳路,生慧.电子病历命名实体识别技术研究综述[J].计算机工程与应用,2022,58(21):13-29. 被引量：10
9卢东岳,王兴芬,李莉.基于流调数据的患者关系知识图谱构建[J].微电子学与计算机,2023,40(3):46-55. 被引量：2
10王丽丽,冯逸飞,李东方,王温,王伟忠.知识图谱在特种医学研究中的应用[J].海军军医大学学报,2024,45(1):106-112. 被引量：1

1范文文,仲佳,白桦,王志杰,张红梅,王洁.肺癌免疫治疗精准化策略中的多模态影像组学与人工智能协同研究进展[J].中国肿瘤临床与康复,2025,32(4):219-228. 被引量：2
2无.政策解读:民政部推荐性行业标准[J].大社会,2024(7):12-15.
3赵祺旸,赵旭,张颖,邝曼曼,郗群.基于改进DeepSurv模型的肺癌生存分析及其影响因素[J].中国医学物理学杂志,2025,42(6):832-840.
4陈洪丽.基于学生核心素养的初中数学课堂教学研究[J].求知导刊,2025(15):53-55.
5李硕.融合生物医学知识图谱和药物序列信息的药物-药物相互作用预测研究[J].信息技术与信息化,2025(5):73-76.
6徐爽,付怡,许丹.一种基于Python的健康知识组织与管理系统设计[J].中国科技信息,2025(11):94-97.
7张琳.基于“教—学—评”一致性的小学道德与法治高效课堂构建策略[J].红树林,2024(16):0196-0198.
8何佳睿,李勇男,李鉴,周林岩,焦作义.类器官在肝脏疾病研究中的应用[J].中华消化外科杂志,2025,24(5):657-664. 被引量：1
9袁训哲,王小璐,王彬,李健,耿建红,王炎强.1990—2021年中国饮食因素归因的脑卒中疾病负担分析[J].现代预防医学,2025,52(9):1578-1582. 被引量：2
10杨学涛,朱梦菡,张宸熙,孙一民,叶玲.抗氧化纳米材料在口腔中的应用和不足[J].中国组织工程研究,2026,30(8):2044-2053.

中国医疗设备

2025年第6期

浏览历史

内容加载中请稍等...

基于电子病历和公开医学知识图谱的专病知识图谱构建

参考文献3

二级参考文献30

共引文献21

相关作者

相关机构

相关主题

浏览历史