期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
基于Word2Vec和TextRank的时政类新闻关键词抽取方法研究 被引量:13
1
作者 刘奇飞 沈炜域 《情报探索》 2018年第6期22-27,共6页
[目的/意义]旨在为时政类新闻关键词抽取提供参考。[方法/过程]基于融合Word2Vec和TextRank算法,在研究时政类新闻文本特征基础上,利用政治重点词库修订文本词语的初始权重,结合上下文关系确定词语之间的连接关系,并基于Word2Vec模型构... [目的/意义]旨在为时政类新闻关键词抽取提供参考。[方法/过程]基于融合Word2Vec和TextRank算法,在研究时政类新闻文本特征基础上,利用政治重点词库修订文本词语的初始权重,结合上下文关系确定词语之间的连接关系,并基于Word2Vec模型构建概率转移矩阵,提出改进的Word2Vec和TextRank算法。[结果/结论 ]运用改进的Word2Vec和TextRank算法对时政类新闻关键词进行抽取,其准确率、召回率和F值均优于传统TextRank算法及普通的融合Word2Vec和TextRank算法,抽取效果更好。 展开更多
关键词 时政新闻 关键词抽取 TextRank算法 word2Vec模型 词图
在线阅读 下载PDF
融合大模型与图嵌入模型的领域知识图谱补全研究——以生物医学为例
2
作者 张君冬 严颖 +3 位作者 王震宇 刘江峰 刘艳华 黄奇 《现代情报》 北大核心 2025年第10期39-50,共12页
[目的/意义]为提高领域知识图谱补全性能,解决现有图嵌入模型“语义理解不足”和大模型“生成偏差及计算资源浪费”并存的挑战,本文提出了一种融合大模型与图嵌入模型的领域知识图谱补全框架。[方法/过程]首先,对开源大模型进行领域语... [目的/意义]为提高领域知识图谱补全性能,解决现有图嵌入模型“语义理解不足”和大模型“生成偏差及计算资源浪费”并存的挑战,本文提出了一种融合大模型与图嵌入模型的领域知识图谱补全框架。[方法/过程]首先,对开源大模型进行领域语料的深度预训练,增强大模型在知识图谱补全时对领域术语的理解力;其次,通过传统图嵌入模型在知识图谱已有结构的基础上生成候选关系或实体,为后续利用大模型进行知识图谱补全提供高质量候选集;第三,基于不同Prompt提示词策略引导前期训练完成的领域大模型完成候选项的排序,实现知识图谱的高效补全;最后,以生物医学领域现有数据集开展实证研究,验证其可行性。[结果/结论]实验结果表明,本研究提出的方法在多个评价指标上效果显著,可为后续领域知识图谱补全提供新的思路与技术手段。 展开更多
关键词 知识图谱 大语言模型 知识图谱补全 图嵌入模型 Prompt提示词
在线阅读 下载PDF
大模型辅助的汉语文化负载词抽取与知识图谱构建 被引量:2
3
作者 张为 肖巧玲 +4 位作者 刘海江 任好 蔡子妍 苏鹏鹍 顾进广 《数字图书馆论坛》 2025年第1期33-45,共13页
文化负载词能够反映民族文化和风俗,是文化认同与情感共鸣的纽带,广泛应用于跨文化交流、教育等领域。目前研究主要集中于负载词的翻译和教学,缺乏对词汇本身的规范化定义和描述。知识图谱具有整合信息和语义关联的优势,应用于文化负载... 文化负载词能够反映民族文化和风俗,是文化认同与情感共鸣的纽带,广泛应用于跨文化交流、教育等领域。目前研究主要集中于负载词的翻译和教学,缺乏对词汇本身的规范化定义和描述。知识图谱具有整合信息和语义关联的优势,应用于文化负载词领域可推动其规范化组织,促进其在翻译、教育等方面的应用。因此,综合现有对文化负载词分类的研究,设计可扩展的汉语文化负载词本体模型,并从文献、教材以及权威网站收集相关的中文语料,利用UIE模型进行知识抽取。为描述各负载词之间的关联,使用大语言模型,根据上下文对汉语文化负载词进行层次分类以及关系补全。结果表明,基于提出的层次化可扩展本体模型构建的知识图谱,能够系统整合汉语文化负载词的相关属性,映射词汇间的文化关联,解决了传统知识图谱在处理多义词和动态表达时存在的问题,为翻译和文化教育等领域提供准确的语义支持,从而提高文化知识的解释性和实际应用效果。 展开更多
关键词 大语言模型 知识图谱构建 文化负载词 知识抽取 文本分类
在线阅读 下载PDF
面向知识体系构建的术语提取技术研究
4
作者 张岐坦 尹明辉 刘伟强 《计算机与网络》 2025年第2期142-148,共7页
术语作为知识体系的基本单元,其提取的准确率和效率直接影响到文本分析挖掘、知识图谱构建和智能信息推荐等智能应用的效果。系统总结了术语提取技术的发展现状,深入讨论了有监督、无监督、基于深度学习和基于大语言模型在内的多种术语... 术语作为知识体系的基本单元,其提取的准确率和效率直接影响到文本分析挖掘、知识图谱构建和智能信息推荐等智能应用的效果。系统总结了术语提取技术的发展现状,深入讨论了有监督、无监督、基于深度学习和基于大语言模型在内的多种术语提取方法,详细说明了面向知识体系构建的术语提取应用流程。对各种术语提取技术进行了总结与分析,说明了各自的优缺点和局限性,对术语提取技术的未来发展进行了展望和预测。 展开更多
关键词 术语提取 统计特征 词图模型 主题模型 深度学习 大语言模型 知识体系
在线阅读 下载PDF
获取适配专利知识的功能模型相似度计算方法 被引量:1
5
作者 曹国忠 李凯 《机械设计》 北大核心 2025年第4期175-181,共7页
为优化产品创新知识推送的适配性问题,在构建模型进行知识匹配与推送研究基础上,提出一种获取适配专利知识的功能模型相似度计算方法。该方法将TRIZ中的功能模型与知识推送过程相结合,根据功能模型选取待改进设计中相似度计算的要素,引... 为优化产品创新知识推送的适配性问题,在构建模型进行知识匹配与推送研究基础上,提出一种获取适配专利知识的功能模型相似度计算方法。该方法将TRIZ中的功能模型与知识推送过程相结合,根据功能模型选取待改进设计中相似度计算的要素,引入图论算法;基于功能模型计算所选要素的权重;融合专利检索与专利自然语言处理技术提取专利设计中的相似度计算要素,采用词向量模型实现相似度计算。对存在刹车导管切割长度不良问题的切管机进行实例研究,构建其功能模型,并采用计算方法匹配相似专利方案功能模型,验证该计算方法的可行性与准确性。基于该方法准确计算匹配相似专利方案功能模型,从结构层面直接对设计问题的解决进行启发,可提升产品创新知识推送的适配性,进而提高创新设计效率。 展开更多
关键词 功能模型相似度计算 适配性专利知识 图论算法 自然语言处理 词向量模型
原文传递
基于图的同义词集自动获取方法 被引量:13
6
作者 吴云芳 石静 金澎 《计算机研究与发展》 EI CSCD 北大核心 2011年第4期610-616,共7页
同义词集是重要的语言基础知识,基于大规模语料库的同义词集自动获取是自然语言处理领域的一项基础性研究课题.从大规模语料中自动获取有并列结构关联的词语对,据此形成图,采用Newman算法对图进行划分而自动聚类相似词语.着重研究在New... 同义词集是重要的语言基础知识,基于大规模语料库的同义词集自动获取是自然语言处理领域的一项基础性研究课题.从大规模语料中自动获取有并列结构关联的词语对,据此形成图,采用Newman算法对图进行划分而自动聚类相似词语.着重研究在Newman算法的基础上,充分挖掘和利用并列结构的特性和汉语的构词特点,采用6种方法对图中边的权值加以改进从而提升效果:分割语料、去除低频边、加重双向边、加重团、加重相同后字、惩罚音节不等.同义词集自动获取的准确率从初始的23.28%提升至53.12%,准确率提高了约30个百分点. 展开更多
关键词 相似词 同义词集 图模型 并列结构 Newman算法 边权值
在线阅读 下载PDF
基于词重要性的信息检索图模型 被引量:11
7
作者 王明文 洪欢 +1 位作者 江爱文 左家莉 《中文信息学报》 CSCD 北大核心 2016年第4期134-141,共8页
在信息检索建模中,确定索引词项在文档中的重要性是一项重要内容。以词袋(bag-of-word)的形式表示文档来建立检索模型的方法中大多是基于词项独立性假设,用TF和IDF的函数来计算词项的重要性,并未考虑词项之间的关系。该文采用基于词项图... 在信息检索建模中,确定索引词项在文档中的重要性是一项重要内容。以词袋(bag-of-word)的形式表示文档来建立检索模型的方法中大多是基于词项独立性假设,用TF和IDF的函数来计算词项的重要性,并未考虑词项之间的关系。该文采用基于词项图(graph-of-word)的文档表示形式来捕获词项间的依赖关系,提出了一种新的基于词重要性的信息检索图模型TI-IDF。根据词项图得到文档中词项的共现矩阵和词项间的概率转移矩阵,通过马尔科夫链计算方法来确定词项在文档中的重要性(Term Importance,TI),并以此替代索引过程中传统的词项频率TF。该模型具有更好的鲁棒性,我们在国际公开数据集上与传统的检索模型进行了比较。实验结果表明,该文提出的模型都要优于BM25,且在大多数情况下优于BM25的扩展模型、TW-IDF等模型。 展开更多
关键词 词项重要性 词项图 检索模型 TI-IDF
在线阅读 下载PDF
改进的关键词提取算法研究 被引量:8
8
作者 王涛 李明 《重庆师范大学学报(自然科学版)》 CAS 北大核心 2019年第3期98-104,共7页
【目的】针对词主题信息与词相似性信息对关键词提取的影响进行了研究,提出一种改进的TextRank关键词提取方法。【方法】首先,使用隐含狄利克雷分布(Latent Dirichlet allocation,LDA)主题模型对文档建模计算词主题信息;其次,使用FastT... 【目的】针对词主题信息与词相似性信息对关键词提取的影响进行了研究,提出一种改进的TextRank关键词提取方法。【方法】首先,使用隐含狄利克雷分布(Latent Dirichlet allocation,LDA)主题模型对文档建模计算词主题信息;其次,使用FastText生成词向量,并计算词相似性矩阵;最后,融合词主题信息与词相似性信息的综合权重来优化TextRank词汇节点的初始权重,并进行词图模型的迭代运算与关键词提取。【结果】实验表明,改进方法的提取结果优于传统方法。【结论】证明了考虑词主题信息的全局性与词相似性信息的局部性能有效提高TextRank算法提取关键词的性能。 展开更多
关键词 词向量 TextRank 图模型 LDA
原文传递
词语位置加权TextRank的关键词抽取研究 被引量:77
9
作者 夏天 《现代图书情报技术》 CSSCI 北大核心 2013年第9期30-34,共5页
把关键词抽取问题看作是构成文档词语的重要性排序问题,基于TextRank基本思想,构建候选关键词图,引入覆盖影响力、位置影响力和频度影响力用于计算词语之间的影响力概率转移矩阵,通过迭代法实现候选关键词分值计算,并挑选前N个作为关键... 把关键词抽取问题看作是构成文档词语的重要性排序问题,基于TextRank基本思想,构建候选关键词图,引入覆盖影响力、位置影响力和频度影响力用于计算词语之间的影响力概率转移矩阵,通过迭代法实现候选关键词分值计算,并挑选前N个作为关键词抽取结果。实验结果表明,对词语位置加权的TextRank方法优于传统的TextRank方法和基于LDA主题模型的关键词抽取方法。 展开更多
关键词 关键词抽取 词排序 TextRank 图模型LDA
原文传递
基于词语距离的网络图词义消歧 被引量:22
10
作者 杨陟卓 黄河燕 《软件学报》 EI CSCD 北大核心 2012年第4期776-785,共10页
传统的基于知识库的词义消歧方法,以一定窗口大小下的词语作为背景,对歧义词词义进行推断.该窗口大小下的所有词语无论距离远近,都对歧义词的词义具有相同的影响,使词义消歧效果不佳.针对此问题,提出了一种基于词语距离的网络图词义消... 传统的基于知识库的词义消歧方法,以一定窗口大小下的词语作为背景,对歧义词词义进行推断.该窗口大小下的所有词语无论距离远近,都对歧义词的词义具有相同的影响,使词义消歧效果不佳.针对此问题,提出了一种基于词语距离的网络图词义消歧模型.该模型在传统的网络图词义消歧模型的基础上,充分考虑了词语距离对消歧效果的影响.通过模型重构、优化改进、参数估计以及评测比较,论证了该模型的特点:距离歧义词较近的词语,会对其词义有较强的推荐作用;而距离较远的词,会对其词义有较弱的推荐作用.实验结果表明,该模型可以有效提高中文词义消歧性能,与SemEval-2007:task#5最好的成绩相比,该方法在MacroAve(macro-average accuracy)上提高了3.1%. 展开更多
关键词 词语距离 马尔可夫链 网络图模型 PAGERANK 参数估计
在线阅读 下载PDF
基于领域知识的图模型词义消歧方法 被引量:10
11
作者 鹿文鹏 黄河燕 吴昊 《自动化学报》 EI CSCD 北大核心 2014年第12期2836-2850,共15页
对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation,WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目... 对领域知识挖掘利用的充分与否,直接影响到面向特定领域的词义消歧(Word sense disambiguation,WSD)的性能.本文提出一种基于领域知识的图模型词义消歧方法,该方法充分挖掘领域知识,为目标领域收集文本领域关联词作为文本领域知识,为目标歧义词的各个词义获取词义领域标注作为词义领域知识;利用文本领域关联词和句子上下文词构建消歧图,并根据词义领域知识对消歧图进行调整;使用改进的图评分方法对消歧图的各个词义结点的重要度进行评分,选择正确的词义.该方法能有效地将领域知识整合到图模型中,在Koeling数据集上,取得了同类研究的最佳消歧效果.本文亦对多种图模型评分方法做了改进,进行了详细的对比实验研究. 展开更多
关键词 词义消歧 领域知识 图模型 词义领域 文本领域
在线阅读 下载PDF
基于标签传播算法的新词情感极性识别 被引量:1
12
作者 洪旭东 余正涛 +2 位作者 严馨 高盛祥 线岩团 《计算机科学与探索》 CSCD 北大核心 2015年第12期1506-1512,共7页
由于缺乏词性、语义方面的先验知识,新词的情感极性识别更加困难。将新词的极性识别看作计算新词的极性分布问题,提出了基于标鉴传播算法的新词情感极性识别方法。首先根据知网计算与新词共现的其他词汇的情感极性分布,从中挑选出具有... 由于缺乏词性、语义方面的先验知识,新词的情感极性识别更加困难。将新词的极性识别看作计算新词的极性分布问题,提出了基于标鉴传播算法的新词情感极性识别方法。首先根据知网计算与新词共现的其他词汇的情感极性分布,从中挑选出具有强烈情感倾向的词汇;然后根据新词与它们以及其他新词的相关度,利用标签传播算法对新词的极性分布进行估计;最后根据新词的极性分布,通过构建线性分类器对新词的情感极性进行识别。该方法在COAE2014评测任务中,准确率达到16.167%,召回率达到13.775%,取得了相对较好的效果。 展开更多
关键词 新词 情感极性 标签传播 知网 图模型
在线阅读 下载PDF
一种以拓扑结构信息为骨架的线缆数字化模型 被引量:4
13
作者 尚炜 宁汝新 +1 位作者 刘检华 刘佳顺 《计算机集成制造系统》 EI CSCD 北大核心 2012年第12期2588-2594,共7页
针对机电产品中复杂线缆的拓扑结构、几何和繁杂工程语义信息统一表达难的问题,提出一种以拓扑结构信息为骨架的线缆数字化模型。该模型将线缆抽象为多层次的基本元素,分别建立基本元素间的包含关系和连接关系无向图来表达其复杂的拓扑... 针对机电产品中复杂线缆的拓扑结构、几何和繁杂工程语义信息统一表达难的问题,提出一种以拓扑结构信息为骨架的线缆数字化模型。该模型将线缆抽象为多层次的基本元素,分别建立基本元素间的包含关系和连接关系无向图来表达其复杂的拓扑结构,并以此作为骨架,在不同的基本元素集合上关联线缆的几何通路、电气连通、工程材料等信息,实现了对线缆多方面工程语义信息的表达。提出了对该模型信息的检索方法,以及创建三维线缆实体模型的方法。最后,对基于该模型开发的线缆数字化取样、线缆装配仿真等软件模块进行了工程实例验证,结果表明该模型可有效表达不同应用中线缆的复杂结构和多方面的工程语义信息。 展开更多
关键词 线缆 数字化模型 拓扑结构 无向图
在线阅读 下载PDF
基于图卷积神经网络的织物分类研究 被引量:4
14
作者 彭涛 彭迪 +4 位作者 刘军平 胡新荣 张自力 陈常念 姜明华 《计算机应用研究》 CSCD 北大核心 2021年第5期1581-1585,1594,共6页
织物的分类研究在织物生产、服装设计等领域有着广泛应用。提出织物力模型,结合多帧时序信息和图卷积神经网络,给出一种用图来描述织物运动的新方法,通过分析和提取织物视频中的运动特征,实现织物的分类。该方法使用30种不同织物在风力... 织物的分类研究在织物生产、服装设计等领域有着广泛应用。提出织物力模型,结合多帧时序信息和图卷积神经网络,给出一种用图来描述织物运动的新方法,通过分析和提取织物视频中的运动特征,实现织物的分类。该方法使用30种不同织物在风力吹动下的视频作为实验数据集,将视频每一帧作为一个图节点,然后根据视频时序性连接同类织物节点的边。此外结合织物力模型对原视频图像作预处理以提取力流特征作为视觉单词存储,再依据视觉单词探索同类与不同类织物间的潜在联系,由此将欧氏织物视频数据转换为非欧氏织物图数据,最后使用图卷积神经网络进行分类处理。该方法避免了传统织物分类过程中织物纹理、颜色、外部光照等因素的影响,突破了传统分类方法只能对少数织物进行分类的限制,有较好的分类效果。 展开更多
关键词 织物 织物力模型 视觉单词 多帧时序 图卷积神经网络
在线阅读 下载PDF
鱼群启发的三维CAD模型聚类与检索 被引量:10
15
作者 皇甫中民 张树生 闫雒恒 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2016年第8期1373-1382,1392,共11页
为了提高三维CAD模型检索中模型的局部细节区别能力以及检索效率,提出一种鱼群启发的三维CAD模型聚类及检索方法.依据B-Rep形式CAD模型的属性邻接图以及图谱理论,采用一种融合空间邻接关系的词袋模式作为模型的特征描述子,用于模型聚类... 为了提高三维CAD模型检索中模型的局部细节区别能力以及检索效率,提出一种鱼群启发的三维CAD模型聚类及检索方法.依据B-Rep形式CAD模型的属性邻接图以及图谱理论,采用一种融合空间邻接关系的词袋模式作为模型的特征描述子,用于模型聚类与检索中的特征描述及相似性计算;针对模型聚类问题,受鱼群运动模式启发,提出基于全局公告信息引导及模糊c均值修正的人工鱼群聚类算法,将模型库空间聚类划分为若干子空间;模型检索采取两层检索机制:首先通过隶属度函数将索引模型定位至相应搜索子空间,然后在较小的子空间内进行相似性比较.实验结果表明,该方法的特征描述子能较好地区别模型局部细节特征,模型库聚类效果较好,检索质量和效率均有明显提高,可有效地支持CAD模型的重用. 展开更多
关键词 三维CAD模型 聚类 检索 空间词袋 图谱理论 鱼群
在线阅读 下载PDF
基于上下文语境的词义消歧方法 被引量:4
16
作者 杨陟卓 《计算机应用》 CSCD 北大核心 2015年第4期1006-1008,1012,共4页
针对传统词义消歧方法面临的数据稀疏问题,提出一种基于上下文语境的词义消歧方法。该方法假设同一篇文章中的句子之间共享一些相同的话题,首先,抽取在同一篇文章中包含相同歧义词的句子,这些句子可以作为歧义句的上下文语境,为其中的... 针对传统词义消歧方法面临的数据稀疏问题,提出一种基于上下文语境的词义消歧方法。该方法假设同一篇文章中的句子之间共享一些相同的话题,首先,抽取在同一篇文章中包含相同歧义词的句子,这些句子可以作为歧义句的上下文语境,为其中的一个歧义句子提供消歧知识;其次,通过一种无监督的词义消歧方法进行词义消歧。在真实的语料上实验结果表明,使用2个上下文语境句子,窗口大小为1时,该方法的消歧准确率比基线方法(Orig Disam)提高了3.26%。 展开更多
关键词 数据稀疏 词义消歧 上下文语境 网络图模型 参数估计
在线阅读 下载PDF
一种有效解决汉语歧义切分的方法 被引量:1
17
作者 朱鉴 张建 李淼 《计算机工程与应用》 CSCD 北大核心 2007年第11期175-177,共3页
提出了一种通过有向图和统计加规则的多层过滤方法来有效解决汉语分词过程中的交集型歧义切分问题,该方法大大提高了切分的正确率。经过65000字的开放语料测试,统计了其对交集型歧义字段的切分结果,发现该方法对交集型歧义字段的切分正... 提出了一种通过有向图和统计加规则的多层过滤方法来有效解决汉语分词过程中的交集型歧义切分问题,该方法大大提高了切分的正确率。经过65000字的开放语料测试,统计了其对交集型歧义字段的切分结果,发现该方法对交集型歧义字段的切分正确率为98.43%,以上数据表明该方法在解决汉语交集型歧义字段的问题时是行之有效的。 展开更多
关键词 有向图 统计模型 规则库 歧义字段 汉字切分
在线阅读 下载PDF
融合多信息句子图模型的多文档摘要抽取 被引量:4
18
作者 蒋亚芳 严馨 +2 位作者 徐广义 周枫 邓忠莹 《计算机工程与科学》 CSCD 北大核心 2020年第3期535-542,共8页
针对现有多文档抽取方法不能很好地利用句子主题信息和语义信息的问题,提出一种融合多信息句子图模型的多文档摘要抽取方法。首先,以句子为节点,构建句子图模型;然后,将基于句子的贝叶斯主题模型和词向量模型得到的句子主题概率分布和... 针对现有多文档抽取方法不能很好地利用句子主题信息和语义信息的问题,提出一种融合多信息句子图模型的多文档摘要抽取方法。首先,以句子为节点,构建句子图模型;然后,将基于句子的贝叶斯主题模型和词向量模型得到的句子主题概率分布和句子语义相似度相融合,得到句子最终的相关性,结合主题信息和语义信息作为句子图模型的边权重;最后,借助句子图最小支配集的摘要方法来描述多文档摘要。该方法通过融合多信息的句子图模型,将句子间的主题信息、语义信息和关系信息相结合。实验结果表明,该方法能够有效地改进抽取摘要的综合性能。 展开更多
关键词 多文档摘要 句子贝叶斯主题模型 词向量 句子图模型 最小支配集
在线阅读 下载PDF
基于图模型和多分类器的微博情感倾向性分析 被引量:9
19
作者 黄挺 姬东鸿 《计算机工程》 CAS CSCD 北大核心 2015年第4期171-175,共5页
为研究情感词对情感倾向分析的作用,提高微博情感分析性能,提出一种情感词图模型的方法,利用PageRank算法计算出情感词的褒贬权值,将其作为条件随机场模型的特征,预测具体语言环境下的情感词倾向。结合具体语境下的情感词倾向,利用支持... 为研究情感词对情感倾向分析的作用,提高微博情感分析性能,提出一种情感词图模型的方法,利用PageRank算法计算出情感词的褒贬权值,将其作为条件随机场模型的特征,预测具体语言环境下的情感词倾向。结合具体语境下的情感词倾向,利用支持向量机模型进行微博语料的主客观分类和情感倾向分类。实验结果表明,图模型构造的情感词典增加了具体语境下情感词倾向预测的准确性,具体语境下的情感词倾向预测对主客观分类和情感倾向分类有明显的改善。 展开更多
关键词 图模型 情感词 条件随机场 支持向量机 网页排序算法 倾向性分析
在线阅读 下载PDF
基于HowNet的图模型词义消歧方法 被引量:3
20
作者 孟凡擎 鹿文鹏 +1 位作者 张旭 成金勇 《齐鲁工业大学学报》 2018年第6期66-73,共8页
作为自然语言处理的一项基础性研究,词义消歧对机器翻译、信息检索、文本分类、情感分析等上层应用有重要影响。本文针对现有消歧方法中存在的对知网知识利用不充分问题,提出了一种基于How Net的图模型词义消歧方法。该方法利用依存句... 作为自然语言处理的一项基础性研究,词义消歧对机器翻译、信息检索、文本分类、情感分析等上层应用有重要影响。本文针对现有消歧方法中存在的对知网知识利用不充分问题,提出了一种基于How Net的图模型词义消歧方法。该方法利用依存句法分析获取上下文知识,构建上下文消歧图,并对How Net中有着重要词义区分能力的例句进行依存句法分析,构建依存消歧图,结合上下文消歧图和依存消歧图完成歧义词的消歧处理。实验结果表明,该方法在Sem Eval-2007 task#5数据集上取得了0.468的消歧准确率,获得优于同类方法的消歧效果。 展开更多
关键词 词义消歧 图模型 HOWNET 依存句法分析
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部