期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于分层神经网络的科技文献摘要结构要素自动识别方法研究
1
作者 杨冬菊 张兆娜 赵卓峰 《北方工业大学学报》 2025年第3期14-27,共14页
本文提出了一种分层神经网络模型,其通过整合词级和句子级的上下文信息,并运用注意力机制与条件随机场(Conditional Random Fields, CRF)优化标签序列,从而实现对科技文献摘要中结构要素的高效自动识别。为解决本研究领域缺少公开中文... 本文提出了一种分层神经网络模型,其通过整合词级和句子级的上下文信息,并运用注意力机制与条件随机场(Conditional Random Fields, CRF)优化标签序列,从而实现对科技文献摘要中结构要素的高效自动识别。为解决本研究领域缺少公开中文数据集的问题,本文构建并公开发布了中文科技文献结构式摘要数据集CSL Structed 2K,该数据集包含了工学和医学领域的2 000篇摘要,共计8 584条句子,每条句子被标注为以下类别之一:背景、目的、方法、结果、结论。本文提出的分层神经网络模型,在基于公开英文数据集Pubmed 20k上实验验证的Weighted F1值为93.38%、Macro F1值为88.40%,在基于CSL Structed 2K数据集上验证的Weighted F1值为88.69%、Macro F1值为88.86%。对比目前的其他模型发现,在基准数据集上的性能,本文的模型超过了目前最先进的结果(约提升0.60%~1.30%),验证了本方法在科技文献摘要结构要素自动识别任务中具有良好的性能。本研究的数据集发布在:https://github.com/zhangzhaona/CSL-Structed-2K.git。 展开更多
关键词 摘要结构要素识别 csl structed 2k 分层神经网络 科技文献摘要
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部