期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于语言表达模式和自然语言处理的有机化学文献数据自动识别提取方法
1
作者
陈维明
戴静芳
+5 位作者
李英勇
周俊红
高犇
赵英莉
徐挺军
薛小松
《有机化学》
北大核心
2025年第6期2189-2198,共10页
期刊文献是科学数据的一个重要来源,以往大多采用人工标引方法识别和提取其中的科学数据.随着信息技术和人工智能方法的发展,从期刊文献资料中自动识别和提取科学数据正在逐步成为可能.研究了结合语言表达模式和基于规则的自然语言处理...
期刊文献是科学数据的一个重要来源,以往大多采用人工标引方法识别和提取其中的科学数据.随着信息技术和人工智能方法的发展,从期刊文献资料中自动识别和提取科学数据正在逐步成为可能.研究了结合语言表达模式和基于规则的自然语言处理技术(NLP)从期刊文章中自动识别提取化学数据和信息的方法,完成了2013~2022年10年《有机化学》期刊中3275篇实验研究文章中化学数据的自动识别提取,提取了包括产物特性、合成反应参数、物性数据、谱学数据等30多种化学数据,提取的数据经过处理建成对应的数据库,已经开始对外提供《有机化学》期刊知识服务.对2022年《有机化学》期刊全部422篇文章进行的方法性能测试表明,旋光数据识别提取的正确率为100%,熔点数据识别提取的正确率为99.85%,氟核磁谱识别提取的正确率为99.55%,碳核磁谱识别提取的正确率为99.80%,物质形态数据识别提取的正确率为99.47%,产物名称识别提取的正确率为98.76%(共提取4665个产物名称,其中有问题的产物名称58个).本文中产物名称自动识别提取使用了基于局部场景的无关内容排除法,如果使用化合物系统半系统命名模式,产物名称的自动识别准确率有望进一步提高.基于语言表达模式和自然语言处理技术的自动识别提取方法原则上不受学科限制,适合所有科学数据.
展开更多
关键词
化学数据
识别提取
语言表达模式
自然语言处理
原文传递
基于图式语言的传统村落空间基因识别提取方法与应用研究--以绍兴冢斜村为例
2
作者
张津豪
陶锋
+2 位作者
包伊玲
杨紫珊
杨静怡
《地理研究》
北大核心
2025年第4期988-1008,共21页
空间基因是存储传统村落空间布局特征的重要信息载体,对其进行精准识别和有效传承是赓续村落文脉的关键。立足于空间基因理论与图式语言理论的耦合逻辑,构建空间基因的图式化识别提取方法,并以中国传统村落冢斜村为例进行实证研究与空...
空间基因是存储传统村落空间布局特征的重要信息载体,对其进行精准识别和有效传承是赓续村落文脉的关键。立足于空间基因理论与图式语言理论的耦合逻辑,构建空间基因的图式化识别提取方法,并以中国传统村落冢斜村为例进行实证研究与空间基因传承途径探讨。结果表明:①通过对村落特色场景的空间语汇解构、空间语法解析,提取出空间基因特征因子的外显与内隐结构,并通过对空间语境的解读演绎特征因子的作用机制,从而将空间基因转化为空间语言单位并构建图谱,使提取出的空间基因能够切实关联村落特色。②从语境推移、语汇迭代和语法适应出发综合评估空间基因的传承适宜性,选取村落下大路与农田处的公共空间为设计试点,以特定语境下的语汇学习及增益、语法承继和应用,探讨了空间基因转译传承的在地性发展路径。藉由空间基因的图式化识别提取方法,助力传统村落空间基因研究向着规范与共识的方向发展,对于空间基因转译传承的探讨则可为传统村落的保护利用提供借鉴。
展开更多
关键词
空间基因
图式语言
识别提取
冢斜村
图谱构建
转译传承
原文传递
乳腺癌病理文本的结构化信息提取
被引量:
11
3
作者
吴欢
应俊
+3 位作者
王逸飞
胡华宇
徐洪丽
郑一琼
《解放军医学院学报》
CAS
2020年第7期746-751,共6页
目的对解放军总医院第一医学中心乳腺癌病理报告进行文本结构化信息提取,以支持临床分析研究。方法通过总结解放军总医院第一医学中心2005-2017年共计1万余份乳腺癌病理报告结构及特点,结合临床科研需求和专家经验,整理结构化字段词典...
目的对解放军总医院第一医学中心乳腺癌病理报告进行文本结构化信息提取,以支持临床分析研究。方法通过总结解放军总医院第一医学中心2005-2017年共计1万余份乳腺癌病理报告结构及特点,结合临床科研需求和专家经验,整理结构化字段词典和抽取规则,利用基于规则的模式匹配抽取方法对病理报告进行信息抽取。结果利用该方法得到临床科研所需乳腺病理文本结构化指标及其值,并对随机抽样的200条病理报告进行效果评估,结构化字段的召回率和准确率均高于90%。结论基于规则的模式匹配信息提取方法在乳腺癌病理报告中具有一定适用性,可快速、有效地实现对文本信息的结构化提取。
展开更多
关键词
乳腺癌病理报告
模式匹配
正则表达式
信息抽取
自然语言处理
在线阅读
下载PDF
职称材料
题名
基于语言表达模式和自然语言处理的有机化学文献数据自动识别提取方法
1
作者
陈维明
戴静芳
李英勇
周俊红
高犇
赵英莉
徐挺军
薛小松
机构
中国科学院上海有机化学研究所、先进氟氮材料全国重点实验室
出处
《有机化学》
北大核心
2025年第6期2189-2198,共10页
基金
中国科学院2020年度科学传播项目
国家重点研发计划(No.2021YFF0701700)
+2 种基金
国家自然科学基金(Nos.22122104,22193012和21933004)
中国科学院先导专项(No.XDB0590000)
稳定支持基础研究领域青年团队计划(Nos.YSBR-052,YSBR-095)资助项目。
文摘
期刊文献是科学数据的一个重要来源,以往大多采用人工标引方法识别和提取其中的科学数据.随着信息技术和人工智能方法的发展,从期刊文献资料中自动识别和提取科学数据正在逐步成为可能.研究了结合语言表达模式和基于规则的自然语言处理技术(NLP)从期刊文章中自动识别提取化学数据和信息的方法,完成了2013~2022年10年《有机化学》期刊中3275篇实验研究文章中化学数据的自动识别提取,提取了包括产物特性、合成反应参数、物性数据、谱学数据等30多种化学数据,提取的数据经过处理建成对应的数据库,已经开始对外提供《有机化学》期刊知识服务.对2022年《有机化学》期刊全部422篇文章进行的方法性能测试表明,旋光数据识别提取的正确率为100%,熔点数据识别提取的正确率为99.85%,氟核磁谱识别提取的正确率为99.55%,碳核磁谱识别提取的正确率为99.80%,物质形态数据识别提取的正确率为99.47%,产物名称识别提取的正确率为98.76%(共提取4665个产物名称,其中有问题的产物名称58个).本文中产物名称自动识别提取使用了基于局部场景的无关内容排除法,如果使用化合物系统半系统命名模式,产物名称的自动识别准确率有望进一步提高.基于语言表达模式和自然语言处理技术的自动识别提取方法原则上不受学科限制,适合所有科学数据.
关键词
化学数据
识别提取
语言表达模式
自然语言处理
Keywords
chemical data
identification and extraction
,
language expression pattern
natural
language
processing
分类号
O62 [理学—有机化学]
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于图式语言的传统村落空间基因识别提取方法与应用研究--以绍兴冢斜村为例
2
作者
张津豪
陶锋
包伊玲
杨紫珊
杨静怡
机构
宁波大学潘天寿建筑与艺术设计学院
出处
《地理研究》
北大核心
2025年第4期988-1008,共21页
基金
浙江省哲学社会科学规划项目(24NDJC061YB)
浙江省高校重大人文社科攻关计划项目(2023QN027)
+2 种基金
浙江省教育厅普通本科高校“十四五”教学改革项目(JG20220166)
浙江省教育科学规划项目(2023SCG121)
浙江省教育厅(研究生专项)科研项目(Y202353635)。
文摘
空间基因是存储传统村落空间布局特征的重要信息载体,对其进行精准识别和有效传承是赓续村落文脉的关键。立足于空间基因理论与图式语言理论的耦合逻辑,构建空间基因的图式化识别提取方法,并以中国传统村落冢斜村为例进行实证研究与空间基因传承途径探讨。结果表明:①通过对村落特色场景的空间语汇解构、空间语法解析,提取出空间基因特征因子的外显与内隐结构,并通过对空间语境的解读演绎特征因子的作用机制,从而将空间基因转化为空间语言单位并构建图谱,使提取出的空间基因能够切实关联村落特色。②从语境推移、语汇迭代和语法适应出发综合评估空间基因的传承适宜性,选取村落下大路与农田处的公共空间为设计试点,以特定语境下的语汇学习及增益、语法承继和应用,探讨了空间基因转译传承的在地性发展路径。藉由空间基因的图式化识别提取方法,助力传统村落空间基因研究向着规范与共识的方向发展,对于空间基因转译传承的探讨则可为传统村落的保护利用提供借鉴。
关键词
空间基因
图式语言
识别提取
冢斜村
图谱构建
转译传承
Keywords
space gene
pattern
language
identification and extraction
Zhongxie village
map construction
translation
and
inheritance
分类号
TU982.29 [建筑科学—城市规划与设计]
原文传递
题名
乳腺癌病理文本的结构化信息提取
被引量:
11
3
作者
吴欢
应俊
王逸飞
胡华宇
徐洪丽
郑一琼
机构
解放军总医院医学大数据研究中心
南开大学医学院
解放军总医院第一医学中心普外科
出处
《解放军医学院学报》
CAS
2020年第7期746-751,共6页
基金
解放军总医院医疗大数据中心研发项目(2016MBD-018,2018MBD-005)
文摘
目的对解放军总医院第一医学中心乳腺癌病理报告进行文本结构化信息提取,以支持临床分析研究。方法通过总结解放军总医院第一医学中心2005-2017年共计1万余份乳腺癌病理报告结构及特点,结合临床科研需求和专家经验,整理结构化字段词典和抽取规则,利用基于规则的模式匹配抽取方法对病理报告进行信息抽取。结果利用该方法得到临床科研所需乳腺病理文本结构化指标及其值,并对随机抽样的200条病理报告进行效果评估,结构化字段的召回率和准确率均高于90%。结论基于规则的模式匹配信息提取方法在乳腺癌病理报告中具有一定适用性,可快速、有效地实现对文本信息的结构化提取。
关键词
乳腺癌病理报告
模式匹配
正则表达式
信息抽取
自然语言处理
Keywords
breast cancer pathological reports
pattern
matching
regular
expression
information
extraction
natural
language
processing
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
R737.9 [医药卫生—肿瘤]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于语言表达模式和自然语言处理的有机化学文献数据自动识别提取方法
陈维明
戴静芳
李英勇
周俊红
高犇
赵英莉
徐挺军
薛小松
《有机化学》
北大核心
2025
0
原文传递
2
基于图式语言的传统村落空间基因识别提取方法与应用研究--以绍兴冢斜村为例
张津豪
陶锋
包伊玲
杨紫珊
杨静怡
《地理研究》
北大核心
2025
0
原文传递
3
乳腺癌病理文本的结构化信息提取
吴欢
应俊
王逸飞
胡华宇
徐洪丽
郑一琼
《解放军医学院学报》
CAS
2020
11
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部