随着电子健康记录(electronic health record,EHR)在医学研究中的广泛应用,其多源异构性日益成为影响病例对照研究效度的关键问题。不同医疗系统在数据来源、格式、编码标准及人群覆盖方面的差异,易引发选择偏倚、信息偏倚、混杂偏倚及...随着电子健康记录(electronic health record,EHR)在医学研究中的广泛应用,其多源异构性日益成为影响病例对照研究效度的关键问题。不同医疗系统在数据来源、格式、编码标准及人群覆盖方面的差异,易引发选择偏倚、信息偏倚、混杂偏倚及不朽时间偏倚,从而削弱因果推断的可靠性。本文系统剖析了EHR异构性的来源与特征,包括数据结构差异、编码不一致及人群异质性,探讨其在各类偏倚中的作用机制,结合实证案例揭示其对研究结果的影响;随后整合数据标准化、多重插补、样本加权、倾向性评分匹配(特别是高维倾向性评分hd-PSM)、工具变量分析及DAG辅助调整等技术,构建了偏倚控制与验证的系统性框架。将标准化的数据处理流程、严谨的研究设计、先进的分析性控制策略与客观的效果验证方法融为一体的综合框架,对于从EHR数据中获得稳健可信的科学结论至关重要。展开更多
针对电子病历构建过程中难以捕捉信息抽取任务之间的关联性和医患对话上下文信息的问题,提出了一种基于Transformer交互指导的联合信息抽取方法,称为CT-JIE(collaborative Transformer for joint information extraction)。首先,该方法...针对电子病历构建过程中难以捕捉信息抽取任务之间的关联性和医患对话上下文信息的问题,提出了一种基于Transformer交互指导的联合信息抽取方法,称为CT-JIE(collaborative Transformer for joint information extraction)。首先,该方法使用滑动窗口并结合Bi-LSTM获取对话中的历史信息,利用标签感知模块捕捉对话语境中与任务标签相关的信息;其次,通过全局注意力模块提高了模型对于症状实体及其状态的上下文感知能力;最后,通过交互指导模块显式地建模了意图识别、槽位填充与状态识别三个任务之间的交互关系,以捕捉多任务之间的复杂语境和关系。实验表明,该方法在IMCS21和CMDD两个数据集上的性能均优于其他基线模型和消融模型,在处理联合信息抽取任务时具有较强的泛化能力和性能优势。展开更多
文摘随着电子健康记录(electronic health record,EHR)在医学研究中的广泛应用,其多源异构性日益成为影响病例对照研究效度的关键问题。不同医疗系统在数据来源、格式、编码标准及人群覆盖方面的差异,易引发选择偏倚、信息偏倚、混杂偏倚及不朽时间偏倚,从而削弱因果推断的可靠性。本文系统剖析了EHR异构性的来源与特征,包括数据结构差异、编码不一致及人群异质性,探讨其在各类偏倚中的作用机制,结合实证案例揭示其对研究结果的影响;随后整合数据标准化、多重插补、样本加权、倾向性评分匹配(特别是高维倾向性评分hd-PSM)、工具变量分析及DAG辅助调整等技术,构建了偏倚控制与验证的系统性框架。将标准化的数据处理流程、严谨的研究设计、先进的分析性控制策略与客观的效果验证方法融为一体的综合框架,对于从EHR数据中获得稳健可信的科学结论至关重要。
文摘针对电子病历构建过程中难以捕捉信息抽取任务之间的关联性和医患对话上下文信息的问题,提出了一种基于Transformer交互指导的联合信息抽取方法,称为CT-JIE(collaborative Transformer for joint information extraction)。首先,该方法使用滑动窗口并结合Bi-LSTM获取对话中的历史信息,利用标签感知模块捕捉对话语境中与任务标签相关的信息;其次,通过全局注意力模块提高了模型对于症状实体及其状态的上下文感知能力;最后,通过交互指导模块显式地建模了意图识别、槽位填充与状态识别三个任务之间的交互关系,以捕捉多任务之间的复杂语境和关系。实验表明,该方法在IMCS21和CMDD两个数据集上的性能均优于其他基线模型和消融模型,在处理联合信息抽取任务时具有较强的泛化能力和性能优势。