期刊文献+
共找到94篇文章
< 1 2 5 >
每页显示 20 50 100
基于词对信息的嵌套命名实体识别
1
作者 唐鹏 雷鸣 +1 位作者 牛保宁 宋春花 《小型微型计算机系统》 北大核心 2026年第3期539-547,共9页
命名实体识别是检测和分类文本中实体的任务.当实体彼此重叠时,该任务称为嵌套命名实体识别.基于跨度的方法处理嵌套命名实体识别是高效的,但在先前的研究中跨度表征通过融合跨度的端点词表征或者所有词表征生成,没有充分考虑跨度内不... 命名实体识别是检测和分类文本中实体的任务.当实体彼此重叠时,该任务称为嵌套命名实体识别.基于跨度的方法处理嵌套命名实体识别是高效的,但在先前的研究中跨度表征通过融合跨度的端点词表征或者所有词表征生成,没有充分考虑跨度内不同词之间的依赖.其次,利用特征矩阵进行实体预测,实体之间的依赖信息以及实体在句子中的上下文信息没有被考虑.为了解决上述问题,本文提出跨度表征增强网络(Span Enhanced Network,SEnNet).该网络利用跨度内的词对信息构建初始跨度表征,而不仅仅依赖于跨度的端点词表征或者简单融合跨度内部所有词表征.随后不同跨度之间的交互以及上下文信息的引入,初始跨度表征被逐渐丰富.在ACE04、ACE05、KBP17和CoNLL03数据集上的实验结果验证了本文提出的模型能够充分利用跨度内部的词对依赖信息和跨度外部的依赖信息以及上下文信息,提升实体识别的性能.进一步的实验表明,利用词对信息丰富跨度表征有助于长实体识别. 展开更多
关键词 嵌套命名实体识别 跨度表征 词对信息 条件规范化层 长实体识别
在线阅读 下载PDF
Word-Pair Relevance Modeling with Multi-View Neural Attention Mechanism for Sentence Alignment
2
作者 Ying Ding Jun-Hui Li +1 位作者 Zheng-Xian Gong Guo-Dong Zhou 《Journal of Computer Science & Technology》 SCIE EI CSCD 2020年第3期617-628,共12页
Sentence alignment provides multi-lingual or cross-lingual natural language processing(NLP)applications with high-quality parallel sentence pairs.Normally,an aligned sentence pair contains multiple aligned words,which... Sentence alignment provides multi-lingual or cross-lingual natural language processing(NLP)applications with high-quality parallel sentence pairs.Normally,an aligned sentence pair contains multiple aligned words,which intuitively play different roles during sentence alignment.Inspired by this intuition,we propose to deal with the problem of sentence alignment by exploring the semantic interactionship among fine-grained word pairs within the framework of neural network.In particular,we first employ various relevance measures to capture various kinds of semantic interactions among word pairs by using a word-pair relevance network,and then model their importance by using a multi-view attention network.Experimental results on both monotonic and non-monotonic bitexts show that our proposed approach significantly improves the performance of sentence alignment. 展开更多
关键词 sentence alignment neural network word-pair relevance network multi-view attention network
原文传递
细粒度标记的结点自适应方面情感三元组抽取 被引量:1
3
作者 赵园春 韩虎 徐学锋 《计算机工程与应用》 北大核心 2025年第13期208-216,共9页
情感分析在自然语言处理领域扮演着重要的角色,作为情感分析的子任务,方面情感三元组抽取能够从评论中抽取用户对产品或服务的意见,从而在商家做决策时提供关键性数据支撑,因此具有较大的研究价值。然而现有的方面情感三元组抽取方法存... 情感分析在自然语言处理领域扮演着重要的角色,作为情感分析的子任务,方面情感三元组抽取能够从评论中抽取用户对产品或服务的意见,从而在商家做决策时提供关键性数据支撑,因此具有较大的研究价值。然而现有的方面情感三元组抽取方法存在词对边界考虑不足、词对标记冗余和语言学特征利用有限的问题。为了解决这些问题,提出了一种基于细粒度标记的结点自适应方面情感三元组抽取算法。设计细粒度词对标记方案,项的首尾边界使用相异的标记,去除项中冗余的词间标记。在两个通道上使用结点自适应网络分别对句法依赖信息与句法类型信息进行挖掘,同时使用卷积注意力捕捉评论文本的全局与局部语义依赖关系,从而增强模型对语言学特征的提取。最后,使用推理层获取词间关系,使用解码层获取方面-意见-情感三元组。实验结果表明,该模型不仅解决了现有标记方案存在的问题,还能高效挖掘语言学特征,在4个公开数据集上其综合评级指标值取得了较优的结果。 展开更多
关键词 方面情感三元组抽取 细粒度词对标记 结点自适应网络 句法依赖树 卷积注意力
在线阅读 下载PDF
基于特征观点对的中文领域情感词典构建研究
4
作者 王召义 Chong Choy Yoke +1 位作者 薛晨杰 张丽媛 《荆楚理工学院学报》 2025年第3期39-51,共13页
目的:为解决通用情感词典在特定产品领域或上下文环境中无法准确辨别和区分情感信息的问题,以减少语义歧义及情感信息误判。方法:提出了一种新的中文领域情感词典构建方法,设计了一个包含实体、属性、情感词、情感倾向和情感强度的结构... 目的:为解决通用情感词典在特定产品领域或上下文环境中无法准确辨别和区分情感信息的问题,以减少语义歧义及情感信息误判。方法:提出了一种新的中文领域情感词典构建方法,设计了一个包含实体、属性、情感词、情感倾向和情感强度的结构模型,并利用依存句法技术实现该模型的构建,以核心元素特征观点对为基础来构建领域情感词典。结果:所构建的领域情感词典能够更准确地捕捉情感语义信息,并适用于不同领域的情感分析任务。结论:领域情感词典的构建方法能够有效提升情感分析的准确性,尤其是在具有领域性和上下文约束关系的产品评论中。 展开更多
关键词 领域情感词典 特征观点对 实体属性 情感词 依存句法
在线阅读 下载PDF
在线产品评论用户满意度综合评价研究 被引量:17
5
作者 吕品 钟珞 唐琨皓 《电子学报》 EI CAS CSCD 北大核心 2014年第4期740-746,共7页
文中提出一种基于灰色理论的用户满意度评价方法。基本思想:根据对各种类型的产品和对象(如旅社、酒店等)的评价具有相对性、不确定性和模糊性(这三种特性统称为灰色性)的特征,将用户满意度分为很满意,满意,一般,不满意和很不满意等五... 文中提出一种基于灰色理论的用户满意度评价方法。基本思想:根据对各种类型的产品和对象(如旅社、酒店等)的评价具有相对性、不确定性和模糊性(这三种特性统称为灰色性)的特征,将用户满意度分为很满意,满意,一般,不满意和很不满意等五种类型,克服了已有方法将情感分为满意和不满意的粗粒度定性评价缺陷。构建了用户满意度灰色评估模型,为了扩大对各类型产品评价的适应性,引用了相似性情感词匹配词对和对象对应产品的对应性热点词匹配词对来构建用户对产品和对象的满意度评测指标。以实际产品为实验数据对象,仿真结果表明:提出的方法不仅能获得产品或对象的总体满意度结论值VB,还能得到各项评测指标(影响产品或对象的因素)的量化评估结论值VBi,有效解决了定性评价方法的不足,为消费者提供了更详细的消费指导,为商业机构提供了有针对性的生产销售措施。 展开更多
关键词 在线产品评论 满意度评价 灰色理论 观点挖掘 相似性情感词匹配词对 对应性热点词匹配词对
在线阅读 下载PDF
视觉及听觉刺激诱发语言通路的fMRI初步探讨 被引量:7
6
作者 牟君 沈彤 +4 位作者 杨泽松 吕发金 李勇 罗天友 谢鹏 《第三军医大学学报》 CAS CSCD 北大核心 2006年第23期2327-2329,共3页
目的利用功能核磁共振成像(fMRI)探讨视觉刺激和听觉刺激诱发的大脑思维活动,大脑激活区域的差异。方法采用血氧水平依赖法(BOLD)组块设计,考查6例以汉语为母语的健康中国志愿者,接受中文单音节字的视觉和听觉任务刺激,通过组词来诱发... 目的利用功能核磁共振成像(fMRI)探讨视觉刺激和听觉刺激诱发的大脑思维活动,大脑激活区域的差异。方法采用血氧水平依赖法(BOLD)组块设计,考查6例以汉语为母语的健康中国志愿者,接受中文单音节字的视觉和听觉任务刺激,通过组词来诱发思维活动时,相关脑区激活特点,并分析其差异。结果视觉任务主要激活了双侧额上回、中央前回及枕叶,左侧额中回、顶上小叶,右侧颞上回;听觉任务主要激活了双侧颞上回、中央前回及枕叶,左侧顶上小叶。听觉任务见到小脑和基底节区的激活。两种任务都伴随海马激活。结论组词过程激活的脑区交叉多。颞叶和枕叶在2种任务都有激活。 展开更多
关键词 视觉 听觉 功能磁共振 组词
暂未订购
基于锚点词对的双语词对齐算法 被引量:11
7
作者 张孝飞 陈肇雄 +1 位作者 黄河燕 王建德 《小型微型计算机系统》 CSCD 北大核心 2006年第2期330-334,共5页
双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要... 双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要只使用了一部双语词典),采取多级匹配和消歧策略,将词对齐问题转化为迭代求解锚点词对的过程,使得词对齐既有较高的准确率又有较高的召回率.经过对真实语料的测试,词对齐准确率达93.0%,召回率达77.3%,F值达84.2%,基本上满足了有关应用的实际要求. 展开更多
关键词 自然语言处理 双语词对齐 语料 锚点词对
在线阅读 下载PDF
语义关系相似度计算中的数据标准化方法比较 被引量:16
8
作者 王正鹏 谢志鹏 邱培超 《计算机工程》 CAS CSCD 2012年第10期38-40,共3页
研究数据标准化处理对语义关系相似度计算的影响。从大规模文本语料中提取词法模式,生成词对-词法模式矩阵,利用3种数据标准化方式对矩阵数据进行处理,通过规律学习方法对隐含语义关系相似度进行计算。实验结果表明,不做数据标准化、z-s... 研究数据标准化处理对语义关系相似度计算的影响。从大规模文本语料中提取词法模式,生成词对-词法模式矩阵,利用3种数据标准化方式对矩阵数据进行处理,通过规律学习方法对隐含语义关系相似度进行计算。实验结果表明,不做数据标准化、z-score标准化、范围标准化、熵加权标准化处理的分类准确率分别为0.87、0.89、0.95、0.96。 展开更多
关键词 语义关系 相似度 词法模式 词对-词法模式矩阵 数据标准化 WEB数据挖掘
在线阅读 下载PDF
WM-FTBD配对交易建仓改进策略及沪深港实证检验 被引量:19
9
作者 麦永冠 王苏生 《管理评论》 CSSCI 北大核心 2014年第1期30-40,共11页
为研究建仓策略对配对交易年收益率影响,文章构建了折回首日WM-FTBD策略,结合GGR和Herlemont策略,在沪深港证券市场交易,运用三种检验方法,从理论和实证得出,FTBD策略成功率和年收益率都更高,同时发现深市年收益率呈离散、尖峰和正偏性... 为研究建仓策略对配对交易年收益率影响,文章构建了折回首日WM-FTBD策略,结合GGR和Herlemont策略,在沪深港证券市场交易,运用三种检验方法,从理论和实证得出,FTBD策略成功率和年收益率都更高,同时发现深市年收益率呈离散、尖峰和正偏性,三种方法年收益率深圳最大,上海次之,香港最小且三者差异明显。结果表明,有效建仓策略可总体改进收益,但也承担更多风险,价差动量效应和均值回复效应有助于解释价差变化和收益率差异,配对交易在成熟有效市场不一定适合,但在发展中国家有着广阔的前景。 展开更多
关键词 配对交易 统计套利 对冲 策略 检验
原文传递
基于动态窗口的微博突发话题检测方法 被引量:4
10
作者 李艳红 贾丽娜 +1 位作者 王素格 李德玉 《计算机应用与软件》 北大核心 2020年第5期30-37,共8页
微博突发话题的检测是网络舆情分析的一个重要分支,如何实时高效地发现微博文本流中的突发话题是目前亟待解决的问题。为此提出一种基于动态窗口的微博突发话题检测方法。将词对加速度作为突发特征,根据微博文本流中突发词对出现的速度... 微博突发话题的检测是网络舆情分析的一个重要分支,如何实时高效地发现微博文本流中的突发话题是目前亟待解决的问题。为此提出一种基于动态窗口的微博突发话题检测方法。将词对加速度作为突发特征,根据微博文本流中突发词对出现的速度自适应地确定突发话题窗口范围,并利用改进的非负矩阵分解聚类方法获取突发话题窗口中微博的主题结构。在微博文本流上的对比实验表明,该检测方法不但可以减少突发话题检测的时间延迟,而且能够提高检测的准确率和召回率。 展开更多
关键词 微博 突发话题 动态窗口 词对加速度 非负矩阵分解
在线阅读 下载PDF
编码非相关词对是否具有半球对称性?一项近红外光学成像的研究(英文) 被引量:3
11
作者 杨炯炯 曾少群 +5 位作者 骆清铭 管林初 匡培梓 龚辉 Lichty Wemara Chance Britton 《航天医学与医学工程》 CAS CSCD 北大核心 2005年第5期318-323,共6页
目的本研究采用近红外光学成像技术(fNIRS),探讨双侧前额叶在非相关词对的语义编码过程中的作用。方法48名被试者分别在深、浅加工2种实验条件下对非相关词对进行编码,光学成像器即时记录在前额叶皮层,波长为760nm和850nm的漫射光强变化... 目的本研究采用近红外光学成像技术(fNIRS),探讨双侧前额叶在非相关词对的语义编码过程中的作用。方法48名被试者分别在深、浅加工2种实验条件下对非相关词对进行编码,光学成像器即时记录在前额叶皮层,波长为760nm和850nm的漫射光强变化,以此推测相应脑组织的血容量变化。结果与浅加工相比,在深加工条件下,双侧前额叶中与背外侧前额叶相对应区域的血容量变化都较为明显,尤其是左侧前额叶。本研究结果并不完全支持HERA模型,但与其它相关的脑成像研究结果相似。结论材料的特异性是影响记忆编码中半球一侧化的重要因素,当需要对刺激间的联系进行加工时,右侧前额叶也会参与记忆的编码过程。本研究还提示fNIRS技术可用于记忆等脑高级认知功能的研究。 展开更多
关键词 功能近红外光学技术 前额叶 非相关词对 记忆的编码与提取半球不对称性模型 记忆
在线阅读 下载PDF
基于主题词对的文档重排方法 被引量:2
12
作者 何婷婷 许婷 +1 位作者 瞿国忠 涂新辉 《计算机工程与应用》 CSCD 北大核心 2007年第11期161-163,共3页
提出了一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。主题词对的选择采用概率潜在语义索... 提出了一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。主题词对的选择采用概率潜在语义索引的方法,并根据主题词对在文档中的分布状况对其进行重排。对NTCIR-5中文信息检索的文档集合进行测试,采用trec标准评估方法,结果表明采用该方法使得精确率在rigid和relax结果集上分别提高了53.6%和55.8%。 展开更多
关键词 主题词对 概率潜在语义索引 文档重排
在线阅读 下载PDF
领域问答系统中的文本错误自动发现方法 被引量:19
13
作者 刘亮亮 王石 +2 位作者 王东升 汪平仄 曹存根 《中文信息学报》 CSCD 北大核心 2013年第3期77-83,共7页
文本自动校对是自然语言处理的一个挑战性的研究课题,也是一个难题。该文对中文的错误类型和原因进行分析,提出了一种基于领域问答系统用户问题日志的错别字自动发现方法。该方法首先对语料进行分词,然后对分词的结果中出现的散串进行合... 文本自动校对是自然语言处理的一个挑战性的研究课题,也是一个难题。该文对中文的错误类型和原因进行分析,提出了一种基于领域问答系统用户问题日志的错别字自动发现方法。该方法首先对语料进行分词,然后对分词的结果中出现的散串进行合并,对分词中的多字词和合并的串进行相似词串聚类,对相似词串的上下文语境进行统计分析,从中自动获取错别字对。实验表明,该系统获得71.32%的召回率,82.6%的准确率。 展开更多
关键词 文本自动校对 问答系统 非词错误 真词错误 错别字对
在线阅读 下载PDF
汉英成对词比较研究 被引量:22
14
作者 曹炜 《外语与外语教学》 北大核心 2004年第1期32-34,共3页
汉英成对词在结构形式、构成成分及其结构关系等方面既存在着较多的共同点,也存在着明显的差异。就结构形式而言,英语成对词的基本结构形式为“word1+and+word2”,而汉语成对词的结构形式则有“词1+词2”式和“A1+词1+A2+词2”式等... 汉英成对词在结构形式、构成成分及其结构关系等方面既存在着较多的共同点,也存在着明显的差异。就结构形式而言,英语成对词的基本结构形式为“word1+and+word2”,而汉语成对词的结构形式则有“词1+词2”式和“A1+词1+A2+词2”式等两种形式;从汉英成对词的构成成分来看,可以是意义相关的词,也可以是同义词、反义词,甚至是同一个词;从构成成分的结构关系来看,汉语成对词均采取复合式合成词中的“联合”型构词法,内部结构简单划一,而英语成对词除了采取“联合”型构词法之外,还采用了“偏正”型构词法,且内部结构相对复杂。此外,在意义的形成途径、词的来源等方面汉英成对词也存在着异同。 展开更多
关键词 汉语 英语 成对词 比较
在线阅读 下载PDF
基于词对特征的事件新侧面探测 被引量:1
15
作者 冯礼 李芳 盛焕烨 《计算机工程》 CAS CSCD 北大核心 2009年第3期45-47,59,共4页
在基于事件框架的新闻信息抽取中,针对事件侧面被框架结构所限定的问题,提出一种事件新侧面探测方法,并定义事件新侧面的2种类型。通过去除已有的侧面内容,实现LSA聚类探测,同时在文本特征选取部分采用词对特征模型,以充分利用有限文本... 在基于事件框架的新闻信息抽取中,针对事件侧面被框架结构所限定的问题,提出一种事件新侧面探测方法,并定义事件新侧面的2种类型。通过去除已有的侧面内容,实现LSA聚类探测,同时在文本特征选取部分采用词对特征模型,以充分利用有限文本中的语法信息。在原型系统中对该方法进行测试,实验结果表明,该方法是有效的。 展开更多
关键词 新侧面探测 事件框架 词对特征 信息抽取
在线阅读 下载PDF
英汉成对词词序异同的认知与文化辨析 被引量:4
16
作者 孙欣平 《淮阴工学院学报》 CAS 2006年第4期30-32,共3页
将英汉成对词,即英语成对词与汉语联合式复合词的词序进行比较。两者的异同反映了人类认知思维发展的轨迹,以及中西方不同的民族文化心理。
关键词 成对词 词序 比较 认知思维 民族文化
在线阅读 下载PDF
参与中文配对词语联想学习记忆的脑区和神经机制--脑功能磁共振的研究 被引量:3
17
作者 郑金龙 舒斯云 +6 位作者 刘颂豪 郭周义 吴永明 包新民 张增强 金梅 马翰章 《中国工程科学》 2008年第5期38-45,共8页
通过脑功能磁共振技术,研究健康人参与语言的词语配对联想学习记忆任务的脑区和神经机制。对16名右利手健康志愿者进行一项词语配对联想学习记忆任务作业的同时,进行脑功能磁共振扫描。实验采用组块设计,实验任务(包括记忆编码相和记忆... 通过脑功能磁共振技术,研究健康人参与语言的词语配对联想学习记忆任务的脑区和神经机制。对16名右利手健康志愿者进行一项词语配对联想学习记忆任务作业的同时,进行脑功能磁共振扫描。实验采用组块设计,实验任务(包括记忆编码相和记忆提取相)与对照任务(共两个相)交替进行;数据采用SPM99软件进行数据分析和脑功能区定位。结果表明:左侧额叶,特别是左侧额叶的额中下回和枕叶的18,19区在词语联想学习记忆的编码阶段中起重要作用;而左侧顶上小叶、缘上回和角回则在进行记忆提取阶段起重要作用;左侧纹状体边缘区参与了人脑词语联想学习记忆作业的编码阶段。揭示了人大脑完成语言联想学习记忆任务时,除额、顶、枕和颞叶的皮层结构参与外,还新发现有皮层下结构如纹状体参与了词语联想学习记忆。在配对词语的编码和提取阶段,激活的脑区有所变化,显示了这两个语言阶段的神经活动变化机制。 展开更多
关键词 人脑功能磁共振 配对词语 语言 联想学习记忆 皮层和皮层下结构
暂未订购
聚合词在对外汉语教学中的意义 被引量:6
18
作者 董茜 《云南师范大学学报(对外汉语教学与研究版)》 2004年第2期28-30,共3页
在语言学习和习得中,同义表达的能力往往能表征其语言水平.在现代汉语中运用聚合词构造同义句是特有的一种词汇变化的手段.本文讨论了聚合词及其特征,并与英语中的成对词作了比较,揭示了聚合词在对外汉语教学中的教学意义.
关键词 聚合词 对外汉语教学 同义表达 语素 英语
在线阅读 下载PDF
基于网络评论情感量化的商品综合评分模型 被引量:5
19
作者 王晓耘 史玲玲 《杭州电子科技大学学报(社会科学版)》 2016年第3期8-15,共8页
传统网络商品评论的评分是五分制评分,存在评分与评论内容情感不一致问题,为修正五分制评分,本文基于Apriori算法和隶属度算法分别提取产品特征和特征观点词对,并构建了观点词本体库,在此基础上,分析程度副词和否定词对观点词的影响,量... 传统网络商品评论的评分是五分制评分,存在评分与评论内容情感不一致问题,为修正五分制评分,本文基于Apriori算法和隶属度算法分别提取产品特征和特征观点词对,并构建了观点词本体库,在此基础上,分析程度副词和否定词对观点词的影响,量化评论内容情感,最后结合各影响因素构建一种基于评论情感量化的商品综合评分模型。实验结果表明,本文提出的评分模型相比原先五分制的评分更能反映评论者的情感。 展开更多
关键词 评论挖掘 特征观点词对 情感量化 综合评分模型
在线阅读 下载PDF
基于对偶编码的中文分词算法 被引量:6
20
作者 张冰怡 魏博 +2 位作者 陈建成 魏杰 饶国政 《南京理工大学学报》 EI CAS CSCD 北大核心 2014年第4期526-530,共5页
为了提高中文分词算法的切分速度和存储效率,提出一种基于对偶编码的特征匹配算法。由中文分词的字符集和字符相邻关系提取特征值,根据此特征值在中文分词词典中进行快速匹配,基于字符的位置相邻关系提取特征值,支持模糊匹配,因此无需... 为了提高中文分词算法的切分速度和存储效率,提出一种基于对偶编码的特征匹配算法。由中文分词的字符集和字符相邻关系提取特征值,根据此特征值在中文分词词典中进行快速匹配,基于字符的位置相邻关系提取特征值,支持模糊匹配,因此无需对多字词进行单独匹配,从而有效节省匹配时间。实验仿真表明,该算法可以降低特征存储空间,有效提高中文分词精度和效率。 展开更多
关键词 对偶编码 中文分词 特征匹配 数据压缩 散列 特征值 模糊匹配
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部