期刊文献+
共找到59篇文章
< 1 2 3 >
每页显示 20 50 100
Automatic Event Trigger Word Extraction in Chinese Event 被引量:1
1
作者 Long Tian Wen Ma Wen Zhou 《Journal of Software Engineering and Applications》 2012年第12期208-212,共5页
As a basic unit of knowledge representation and an important means for information organization, event has drawn growing number of people’s attention, the research of event identification and extraction in natural la... As a basic unit of knowledge representation and an important means for information organization, event has drawn growing number of people’s attention, the research of event identification and extraction in natural language processing field is an important research topic in information extraction area, the recognition and extraction of event trigger word plays a decisive role in event identification and extraction. In this paper, the authors make experiment in Chinese Event Corpus CEC, and present a method of extracting event trigger word automatically that combines extended trigger word table and machine learning. The experiment result shows that the F-score of extracting event trigger word. can reach 71.2% by using this method. 展开更多
关键词 Information EXTRACTION EVENT trigger word trigger word TABLE MACHINE learning
暂未订购
利用FP-树构造多词Trigger对语言模型 被引量:2
2
作者 许永林 史晓东 蔡骏 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第B06期243-246,共4页
在语音识别系统中,Trigger模型作为语言模型的一种,用于描述长距离词与词之间的关系,然而以往的Trigger语言模型多是针对单个词的模型,本文借鉴数据挖掘中关联规则发现的Apriori算法,利用效率比较高的FP树算法产生多词Trigger对,由此构... 在语音识别系统中,Trigger模型作为语言模型的一种,用于描述长距离词与词之间的关系,然而以往的Trigger语言模型多是针对单个词的模型,本文借鉴数据挖掘中关联规则发现的Apriori算法,利用效率比较高的FP树算法产生多词Trigger对,由此构造多词Trigger对语言模型,这种模型能够更多地利用历史数据,弥补了传统N元文法语言模型描述距离小于N的缺点. 展开更多
关键词 trigger 语言模型 FP-树 构造 Apriori算法 语音识别系统 关联规则发现 er模型 数据挖掘 效率比较 模型描述 N元文法 历史数据 长距离 树算法
在线阅读 下载PDF
基于提示学习的篇章级事件论元抽取方法研究
3
作者 薛继伟 胡馨元 薛鹏杰 《计算机技术与发展》 2024年第6期125-131,共7页
事件论元抽取是指在自然语言文本中识别出事件论元及其对应的角色,是事件抽取的关键。传统事件论元抽取方法将抽取范围局限在单个句子中,在面对长文本中论元分散的情况时表现不佳。近年来,有研究者提出基于提示学习的篇章级事件论元抽... 事件论元抽取是指在自然语言文本中识别出事件论元及其对应的角色,是事件抽取的关键。传统事件论元抽取方法将抽取范围局限在单个句子中,在面对长文本中论元分散的情况时表现不佳。近年来,有研究者提出基于提示学习的篇章级事件论元抽取方法,能根据提示信息在输入文本中获取事件论元,实现事件论元抽取。然而现有基于提示学习的方法大多是由人工手动构建提示模板,模板结构固定容易导致论元抽取错误。针对以上不足,该文在以往基于提示学习研究的基础上,提出以文本触发词为关键实现模板自动构建的方法,并在输入文本中融入事件角色语义信息,使模型能更好地捕获文本语义特征,提高事件论元抽取准确率。在篇章级数据集RAMS上的实验结果表明,该模型在事件论元识别和事件论元分类的F1值分别达到54.3%和48.1%,相比最优的基准方法分别提升了1.8百分点和1.2百分点,验证了模型的有效性。 展开更多
关键词 论元抽取 提示学习 触发词 跨度选择器 预训练语言模型
在线阅读 下载PDF
基于词性标注的启发式在线日志解析方法 被引量:3
4
作者 蒋金钊 傅媛媛 徐建 《计算机应用研究》 CSCD 北大核心 2024年第1期217-221,共5页
为了解决现有启发式日志解析方法中日志特征表示区分能力不足导致解析精度低、泛化差的问题,提出了一种启发式在线日志解析方法PosParser。该方法使用来源于触发词概念的功能词序列作为特征表示,包含解决复杂日志易过度解析问题的两阶... 为了解决现有启发式日志解析方法中日志特征表示区分能力不足导致解析精度低、泛化差的问题,提出了一种启发式在线日志解析方法PosParser。该方法使用来源于触发词概念的功能词序列作为特征表示,包含解决复杂日志易过度解析问题的两阶段检测方法和处理变长参数日志的后处理流程。PosParser在16个真实日志数据集上取得了0.952的平均解析准确率,证明了功能词序列具有良好区分性、PosParser有良好的解析效果和鲁棒性。 展开更多
关键词 日志分析 日志解析 触发词提取 词性标注 系统运维
在线阅读 下载PDF
事件抽取方法综述:深度学习与预训练对比分析 被引量:2
5
作者 王嘉宾 罗俊仁 +2 位作者 周棪忠 王超 张万鹏 《计算机科学》 CSCD 北大核心 2024年第9期196-206,共11页
事件抽取是伴随着信息技术的发展而诞生的。随着人们对从繁多的日常信息中抽取出有用信息的需求日益增强,事件抽取的研究发展也越发受重视。首先,介绍了事件抽取的发展历程,理清了事件抽取的发展脉络;其次,介绍了事件抽取的2种范式,并... 事件抽取是伴随着信息技术的发展而诞生的。随着人们对从繁多的日常信息中抽取出有用信息的需求日益增强,事件抽取的研究发展也越发受重视。首先,介绍了事件抽取的发展历程,理清了事件抽取的发展脉络;其次,介绍了事件抽取的2种范式,并对管道型抽取和联合型抽取范式进行了对比分析;再次,围绕事件抽取的层级,分别从句子级事件抽取和篇章级事件抽取2个层面对近年来事件抽取的发展进行了梳理;然后,从传统型事件抽取方法、基于深度学习的事件抽取方法,以及基于预训练模型的事件抽取方法3个方面对事件抽取方法进行了对比分析;最后,介绍了事件抽取的典型应用场景,并根据事件抽取的发展现状,对未来事件抽取前沿发展进行了展望。 展开更多
关键词 事件抽取 论元 触发词 要素抽取 时序抽取 预训练
在线阅读 下载PDF
基于多头指针的司法事件检测方法
6
作者 张小丽 黄辉 +2 位作者 黄瑞章 秦永彬 陈艳平 《广西科学》 CAS 北大核心 2024年第2期335-345,共11页
针对如何解决中文司法事件检测中触发词与上下文关系不足以判定事件实例、案件触发词表述相似以及同一个案件中多个触发词识别和分类模糊的问题,本研究提出一种基于多头指针的司法事件检测方法。首先,该方法将上下文信息和罪名特征融合... 针对如何解决中文司法事件检测中触发词与上下文关系不足以判定事件实例、案件触发词表述相似以及同一个案件中多个触发词识别和分类模糊的问题,本研究提出一种基于多头指针的司法事件检测方法。首先,该方法将上下文信息和罪名特征融合作为输入,使用双向长短期记忆(Bi-directional Long Short-Term Memory,BiLSTM)网络捕获数据依赖关系,深入提取特征;然后,使用多头指针网络对字符间的依赖关系进行建模,有效捕捉句子中的触发词;最后,利用指针标注技术抽取触发词,实现司法事件的有效检测。在公开司法数据集LEVEN上实验验证该方法的有效性,其中微平均和宏平均的F1指标达到了87.53%和78.05%,优于现有模型。该方法不仅显著提高了事件触发词的识别精度,而且也增强了对复杂司法文本中事件上下文关系的把握能力。 展开更多
关键词 司法事件检测 触发词 上下文关系 罪名特征 多头指针
在线阅读 下载PDF
文档级事件抽取反向推理模型
7
作者 纪婉婷 马宇航 +2 位作者 鲁闻一 王俊陆 宋宝燕 《计算机工程与应用》 CSCD 北大核心 2024年第5期122-129,共8页
事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件... 事件抽取旨在从非结构化文本中检测事件类型并抽取事件要素。现有方法在处理文档级文本时仍存在局限性。这是因为文档级文本可能由多个事件组成,并且构成某一事件的事件要素通常分散在不同句子中。为应对上述挑战,提出了一种文档级事件抽取反向推理模型(reverse inference model for document-level event extraction,RIDEE)。基于无触发词的设计,将文档级事件抽取转化为候选事件要素抽取和事件触发推理两个子任务,并行式抽取事件要素并检测事件类型。此外,设计了一种用于存储历史事件的事件依赖池,使得模型在处理多事件文本时可以充分利用事件之间的依赖关系。公开数据集上的实验结果表明,与现有事件抽取模型相比,RIDEE在进行文档级事件抽取时具有更优的性能。 展开更多
关键词 文档级事件抽取 反向推理 无触发词 事件依赖池
在线阅读 下载PDF
两阶段问答范式的生物医学事件触发词检测 被引量:1
8
作者 行帅 熊玉洁 +1 位作者 苏前敏 黄继汉 《计算机工程与应用》 CSCD 北大核心 2024年第10期121-131,共11页
现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识... 现有的生物医学事件触发词检测存在以下缺陷:保留了与触发词无关的冗余信息;忽略了实体与事件之间的潜在关联性;传统方法容易受到数据稀缺性的影响。针对上述问题,提出了一种两阶段问答范式的生物医学事件触发词检测方法。在事件类型识别阶段,采用基于句法距离的注意力捕获更有意义的上下文特征,排除无关信息的干扰;为了有效利用实体中的潜在特征,采用全局统计的单词-实体-事件共现特征,指导事件类型感知注意力挖掘词与事件之间的强关联性。在触发词定位阶段,根据识别出的事件类型,制定问题回答该事件对应的触发词索引,从而利用丰富的问答数据库实现数据增强。在MLEE语料库上的结果表明,两阶段问答范式、句法距离和事件类型感知注意力都有效地提升了模型性能,所提出的模型取得了81.39%的F1分数,并在多个事件类型上的详细结果均优于其他基线模型。 展开更多
关键词 生物医学事件 触发词检测 句法距离 单词-实体-事件共现特征 两阶段问答范式
在线阅读 下载PDF
基于框架的护理活动事件数据集构建
9
作者 孙悦 龚雄辉 +5 位作者 陈坚 王泽锦 廖永新 周浩 何霆 王华珍 《中国数字医学》 2024年第3期92-98,共7页
护理活动具有事件语义特性,即包含事件触发词和事件论元。以事件框架为指引,即以动词为触发词,以触发词匹配的动词特征作为事件论元角色,对《护理措施分类(NIC)》第5版的护理活动文本进行事件实例抽取,构建出护理活动事件数据集(NAEV Da... 护理活动具有事件语义特性,即包含事件触发词和事件论元。以事件框架为指引,即以动词为触发词,以触发词匹配的动词特征作为事件论元角色,对《护理措施分类(NIC)》第5版的护理活动文本进行事件实例抽取,构建出护理活动事件数据集(NAEV Dataset)。NAEV包含16个护理活动事件类型、13个论元角色、15159个护理活动事件、893种触发词和33406个论元实例。基于文本构建的NAEV数据集存在事件要素重叠特性,为事件抽取任务增加了挑战性。选取事件抽取领域主流的3个模型进行数据集有效性验证。实验结果表明,不同模型在数据集上的性能差异与模型构建原理的差异性一致,这说明NAEV数据集能为事件抽取科研创新提供高质量的数据支持。NAEV数据集能够推动护理领域的事件抽取、事件对齐、事件补全、事件演化等相关研究。 展开更多
关键词 事件数据集 事件框架 触发词重叠 论元重叠 护理活动 护理措施分类
暂未订购
面向藏文文本的人物关系抽取语料库的构建
10
作者 德吉措 安见才让 《青海科技》 2024年第1期81-86,107,共7页
作为实体关系抽取研究的重要基础,构建高质量、标准化的语料库能够提高实体关系抽取任务的精确度和召回率。目前,藏文关系抽取语料库构建大多依靠传统人工标注方法且局限于特定领域,存在标注效率低且人物关系语料库相对缺乏的问题。文... 作为实体关系抽取研究的重要基础,构建高质量、标准化的语料库能够提高实体关系抽取任务的精确度和召回率。目前,藏文关系抽取语料库构建大多依靠传统人工标注方法且局限于特定领域,存在标注效率低且人物关系语料库相对缺乏的问题。文章构建了藏文人名实体识别语料库;通过分析人物关系特征和实体关系类别及其标注规范,构建触发词词典进行语料回标,生成15400条实体识别和8000条藏文人物关系抽取标注语料。为验证语料库的可用性,利用命名实体识别和关系抽取实验进行统计分析,其实体识别F1值达到67.2%,关系抽取F1值达到66.2%,结果表明该语料库的构建对后续面向藏文人物关系抽取研究提供了数据基础。 展开更多
关键词 语料库 人物关系抽取 藏文文本 触发词
在线阅读 下载PDF
基于依存分析和错误驱动的中文时间表达式识别 被引量:21
11
作者 贺瑞芳 秦兵 +2 位作者 刘挺 潘越群 李生 《中文信息学报》 CSCD 北大核心 2007年第5期36-40,共5页
时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效... 时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效果;然后,采用错误驱动学习来进一步增强识别效果,根据错误识别结果和人工标注的差异自动地获取和改进规则,使系统的性能又提高了近3.5%。最终在封闭测试集和开放测试集上,F1值达到了76.38%和76.57%。 展开更多
关键词 计算机应用 中文信息处理 时间表达式识别 触发词 依存分析 错误驱动学习
在线阅读 下载PDF
基于卷积双向长短期记忆网络的事件触发词抽取 被引量:21
12
作者 陈斌 周勇 刘兵 《计算机工程》 CAS CSCD 北大核心 2019年第1期153-158,共6页
传统事件触发词抽取方法在特征提取过程中过分依赖自然语言处理工具,容易造成误差累积。为解决该问题,在卷积双向长短期记忆网络的基础上,提出一种事件触发词抽取方法。通过卷积操作提取单词上下文语境信息,同时利用长短期记忆网络保留... 传统事件触发词抽取方法在特征提取过程中过分依赖自然语言处理工具,容易造成误差累积。为解决该问题,在卷积双向长短期记忆网络的基础上,提出一种事件触发词抽取方法。通过卷积操作提取单词上下文语境信息,同时利用长短期记忆网络保留句子级别特征,从而提高事件触发词的抽取性能。在ACE2005英文语料上的实验结果表明,该方法在事件触发词识别与分类阶段的F值达到69. 5%,具有较好的抽取性能。 展开更多
关键词 事件抽取 触发词 卷积神经网络 循环神经网络 自然语言处理 特征提取
在线阅读 下载PDF
基于深层句法分析的生物事件触发词抽取 被引量:6
13
作者 王健 吴雨 +1 位作者 林鸿飞 杨志豪 《计算机工程》 CAS CSCD 2014年第1期25-30,共6页
传统利用语义和句法信息进行生物事件抽取的方法,在触发词抽取阶段句法信息运用形式单一笼统,不能有效发挥作用。为此,提出一种基于深层句法分析的触发词抽取方法。该方法采用间接的句法信息模式,利用深层句法信息独立地进行边检测,将... 传统利用语义和句法信息进行生物事件抽取的方法,在触发词抽取阶段句法信息运用形式单一笼统,不能有效发挥作用。为此,提出一种基于深层句法分析的触发词抽取方法。该方法采用间接的句法信息模式,利用深层句法信息独立地进行边检测,将边检测结果融合于触发词抽取中,使深层句法信息得到更有效的利用。在BioNLP 2009与2011共享任务语料上进行实验,结果表明,该方法的F值达到68.8%和67.3%,具有较好的触发词抽取性能。 展开更多
关键词 生物事件 触发词 谓词参数结构 深层句法分析 边检测 事件元素
在线阅读 下载PDF
基于CRFs和跨事件的事件识别研究 被引量:12
14
作者 侯立斌 李培峰 朱巧明 《计算机工程》 CAS CSCD 2012年第24期191-195,共5页
事件检测与类型识别是事件抽取的基础,具体实施分为触发词检测和事件类型识别2个阶段。分别对2个阶段进行研究,在前一阶段,针对词形特征过拟和问题,提出利用LDA模型对词语聚类的方法,考虑到中文自动分词与标注的触发词边界的不一致性,... 事件检测与类型识别是事件抽取的基础,具体实施分为触发词检测和事件类型识别2个阶段。分别对2个阶段进行研究,在前一阶段,针对词形特征过拟和问题,提出利用LDA模型对词语聚类的方法,考虑到中文自动分词与标注的触发词边界的不一致性,提出基于CRFs模型的触发词识别方法。在后一阶段,为提高事件类型识别的效果,将跨事件理论应用于中文事件类型识别。实验结果表明,该方法能提高系统性能,F值分别提高到66.3和62.0。 展开更多
关键词 事件抽取 触发词检测 事件类型识别 跨事件 CRFs模型 LDA模型
在线阅读 下载PDF
HMM模型和句法分析相结合的事件属性信息抽取 被引量:10
15
作者 吴家皋 周凡坤 张雪英 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2014年第1期30-34,共5页
自然语言处理技术是计算机科学领域与人工智能领域中的一个重要方向,其中信息抽取是近年来新兴起的一个研究领域.由于汉语自身结构松散、语法语义灵活等特点,使得中文文本中信息抽取具有较大的难度.本文提出句法分析和隐马尔科夫模型相... 自然语言处理技术是计算机科学领域与人工智能领域中的一个重要方向,其中信息抽取是近年来新兴起的一个研究领域.由于汉语自身结构松散、语法语义灵活等特点,使得中文文本中信息抽取具有较大的难度.本文提出句法分析和隐马尔科夫模型相结合的事件属性抽取方法,其主要思想是先利用句法分析对中文文本进行分析,将得到的句法结构交给隐马尔科夫模型进行学习得到一个抽取模型,然后再由此模型对中文文本进行抽取.实验表明,该方法具有较高的准确率和召回率. 展开更多
关键词 自然语言处理 中文文本信息抽取 隐马尔科夫模型 句法分析 触发词
在线阅读 下载PDF
基于SVM的生物医学事件触发词识别研究 被引量:2
16
作者 魏培文 段德全 +1 位作者 孙印杰 毛文涛 《信阳师范学院学报(自然科学版)》 CAS 北大核心 2015年第3期446-449,共4页
研究了基于支持向量机(Support Vector Machine,SVM)方法下的生物医学事件触发词识别的问题.利用SVM对事件抽取的过程进行分类,建立相应的模型来对生物医学事件中的触发词进行识别,得到了相应的实验结果,并验证了此方法的可行性.
关键词 支持向量机(SVM) 生物医学 事件抽取 触发词识别
在线阅读 下载PDF
基于触发词优先级的事件抽取研究 被引量:1
17
作者 吉久明 王鑫 +2 位作者 李楠 陈锦辉 孙济庆 《现代情报》 CSSCI 北大核心 2016年第12期46-49,共4页
本文将触发词分为时间类和非时间类,对触发词提取算法进行改进,以一定量导电塑料行业新闻为基础语料构建两类触发词词表,并采取时间类触发词优先的事件句识别策略。基于该触发词词表对导电塑料和太阳能行业新闻语料进行事件句识别算法... 本文将触发词分为时间类和非时间类,对触发词提取算法进行改进,以一定量导电塑料行业新闻为基础语料构建两类触发词词表,并采取时间类触发词优先的事件句识别策略。基于该触发词词表对导电塑料和太阳能行业新闻语料进行事件句识别算法有效性实验,开放测试的召回率和准确率分别超过98%和95%。该结果表明:将触发词进行基于时间特性的分类,并优先使用时间类触发词提取事件句,能取得显著的效果。 展开更多
关键词 事件句 抽取 触发词优先
在线阅读 下载PDF
基于条件随机场与时间词库的中文时间表达式识别 被引量:11
18
作者 吴琼 黄德根 《中文信息学报》 CSCD 北大核心 2014年第6期169-174,189,共7页
该文提出一种统计与规则相结合的时间表达式识别方法。首先,通过分析中文文本中时间表达式的词形、词性和上下文信息,采用条件随机场识别时间单元而非时间表达式整体,避免了中文时间表达式边界定位不准确的问题;然后,从训练语料中自动... 该文提出一种统计与规则相结合的时间表达式识别方法。首先,通过分析中文文本中时间表达式的词形、词性和上下文信息,采用条件随机场识别时间单元而非时间表达式整体,避免了中文时间表达式边界定位不准确的问题;然后,从训练语料中自动获取候选触发词,并依据评价函数对候选触发词打分,筛选出正确的触发词完善触发词库;最后,根据时间触发词库与时间缀词库,制定规则对时间表达式边界进行定位。实验结果显示开式测试F1值达到98.31%。 展开更多
关键词 CRF 规则 时间触发词 时间缀词
在线阅读 下载PDF
基于依存图卷积的实体关系抽取模型 被引量:3
19
作者 刘源 刘胜全 +1 位作者 常超义 孙伟智 《现代电子技术》 2022年第13期111-117,共7页
目前大多数端到端的关系抽取方法解决了流水线方法的误差累计问题,但是仍然存在两个问题:结构特征表示不足,缺乏句法结构等信息;句子中存在着大量实体重叠关系,未考虑这些实体重叠关系的抽取导致关系三元组召回率低的问题。针对这些问题... 目前大多数端到端的关系抽取方法解决了流水线方法的误差累计问题,但是仍然存在两个问题:结构特征表示不足,缺乏句法结构等信息;句子中存在着大量实体重叠关系,未考虑这些实体重叠关系的抽取导致关系三元组召回率低的问题。针对这些问题,提出一种基于图卷积神经网络的实体关系抽取模型。使用依存句法分析对文本构图,然后通过双向GraphSage提取其结构特征,融入句法结构的特征向量在预测关系时有着更好的表现。而对于关系重叠问题,一次性将所有关系抽取较为困难,因此将该任务分为两步:第一步只抽取非重叠关系与单实体重叠关系;第二步中语言模型抽取关系触发词,并与实体词一起构建实体关系图,这一步能够提高实体对重叠关系的抽取能力。 展开更多
关键词 关系抽取 图神经网络 关系触发词 深度学习 实体重叠 依存句法树 多任务学习 预训练语言模型
在线阅读 下载PDF
中文名实体识别:基于词触发对的条件随机域方法 被引量:3
20
作者 赵健 王晓龙 +1 位作者 关毅 徐志明 《高技术通讯》 CAS CSCD 北大核心 2006年第8期795-801,共7页
首次把条件随机域(CRF)模型应用到了中文名实体识别中,且根据中文的特点,定义了多种特征模板。同时,为了解决长距离约束问题,将词语触发对融合到了CRF模型中。提出了基于词语方差(word variance)的选词方法,在词语相关性计算... 首次把条件随机域(CRF)模型应用到了中文名实体识别中,且根据中文的特点,定义了多种特征模板。同时,为了解决长距离约束问题,将词语触发对融合到了CRF模型中。提出了基于词语方差(word variance)的选词方法,在词语相关性计算上,采用了平均互信息(AMI)方法和χ^2统计量方法。通过在半年人民日报上的测试,结果表明在采用相同特征集合的条件下,条件随机域模型较其他概率模型有更好的性能表现;融合长距离触发对的条件随机域模型可以使系统的F量度提高约1.38%。 展开更多
关键词 中文名实体识别 概率模型 条件随机域 词语触发对 信息抽取 自然语言处理
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部