期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于语言表达模式和自然语言处理的有机化学文献数据自动识别提取方法
1
作者 陈维明 戴静芳 +5 位作者 李英勇 周俊红 高犇 赵英莉 徐挺军 薛小松 《有机化学》 北大核心 2025年第6期2189-2198,共10页
期刊文献是科学数据的一个重要来源,以往大多采用人工标引方法识别和提取其中的科学数据.随着信息技术和人工智能方法的发展,从期刊文献资料中自动识别和提取科学数据正在逐步成为可能.研究了结合语言表达模式和基于规则的自然语言处理... 期刊文献是科学数据的一个重要来源,以往大多采用人工标引方法识别和提取其中的科学数据.随着信息技术和人工智能方法的发展,从期刊文献资料中自动识别和提取科学数据正在逐步成为可能.研究了结合语言表达模式和基于规则的自然语言处理技术(NLP)从期刊文章中自动识别提取化学数据和信息的方法,完成了2013~2022年10年《有机化学》期刊中3275篇实验研究文章中化学数据的自动识别提取,提取了包括产物特性、合成反应参数、物性数据、谱学数据等30多种化学数据,提取的数据经过处理建成对应的数据库,已经开始对外提供《有机化学》期刊知识服务.对2022年《有机化学》期刊全部422篇文章进行的方法性能测试表明,旋光数据识别提取的正确率为100%,熔点数据识别提取的正确率为99.85%,氟核磁谱识别提取的正确率为99.55%,碳核磁谱识别提取的正确率为99.80%,物质形态数据识别提取的正确率为99.47%,产物名称识别提取的正确率为98.76%(共提取4665个产物名称,其中有问题的产物名称58个).本文中产物名称自动识别提取使用了基于局部场景的无关内容排除法,如果使用化合物系统半系统命名模式,产物名称的自动识别准确率有望进一步提高.基于语言表达模式和自然语言处理技术的自动识别提取方法原则上不受学科限制,适合所有科学数据. 展开更多
关键词 化学数据 识别提取 语言表达模式 自然语言处理
原文传递
基于图式语言的传统村落空间基因识别提取方法与应用研究--以绍兴冢斜村为例
2
作者 张津豪 陶锋 +2 位作者 包伊玲 杨紫珊 杨静怡 《地理研究》 北大核心 2025年第4期988-1008,共21页
空间基因是存储传统村落空间布局特征的重要信息载体,对其进行精准识别和有效传承是赓续村落文脉的关键。立足于空间基因理论与图式语言理论的耦合逻辑,构建空间基因的图式化识别提取方法,并以中国传统村落冢斜村为例进行实证研究与空... 空间基因是存储传统村落空间布局特征的重要信息载体,对其进行精准识别和有效传承是赓续村落文脉的关键。立足于空间基因理论与图式语言理论的耦合逻辑,构建空间基因的图式化识别提取方法,并以中国传统村落冢斜村为例进行实证研究与空间基因传承途径探讨。结果表明:①通过对村落特色场景的空间语汇解构、空间语法解析,提取出空间基因特征因子的外显与内隐结构,并通过对空间语境的解读演绎特征因子的作用机制,从而将空间基因转化为空间语言单位并构建图谱,使提取出的空间基因能够切实关联村落特色。②从语境推移、语汇迭代和语法适应出发综合评估空间基因的传承适宜性,选取村落下大路与农田处的公共空间为设计试点,以特定语境下的语汇学习及增益、语法承继和应用,探讨了空间基因转译传承的在地性发展路径。藉由空间基因的图式化识别提取方法,助力传统村落空间基因研究向着规范与共识的方向发展,对于空间基因转译传承的探讨则可为传统村落的保护利用提供借鉴。 展开更多
关键词 空间基因 图式语言 识别提取 冢斜村 图谱构建 转译传承
原文传递
乳腺癌病理文本的结构化信息提取 被引量:11
3
作者 吴欢 应俊 +3 位作者 王逸飞 胡华宇 徐洪丽 郑一琼 《解放军医学院学报》 CAS 2020年第7期746-751,共6页
目的对解放军总医院第一医学中心乳腺癌病理报告进行文本结构化信息提取,以支持临床分析研究。方法通过总结解放军总医院第一医学中心2005-2017年共计1万余份乳腺癌病理报告结构及特点,结合临床科研需求和专家经验,整理结构化字段词典... 目的对解放军总医院第一医学中心乳腺癌病理报告进行文本结构化信息提取,以支持临床分析研究。方法通过总结解放军总医院第一医学中心2005-2017年共计1万余份乳腺癌病理报告结构及特点,结合临床科研需求和专家经验,整理结构化字段词典和抽取规则,利用基于规则的模式匹配抽取方法对病理报告进行信息抽取。结果利用该方法得到临床科研所需乳腺病理文本结构化指标及其值,并对随机抽样的200条病理报告进行效果评估,结构化字段的召回率和准确率均高于90%。结论基于规则的模式匹配信息提取方法在乳腺癌病理报告中具有一定适用性,可快速、有效地实现对文本信息的结构化提取。 展开更多
关键词 乳腺癌病理报告 模式匹配 正则表达式 信息抽取 自然语言处理
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部