期刊文献+
共找到501篇文章
< 1 2 26 >
每页显示 20 50 100
Semantic Relation Annotation for Biomedical Text Mining Based on Recursive Directed Graph 被引量:2
1
作者 CHEN Bo Lü Chen +1 位作者 WEI Xiaomei JI Donghong 《Wuhan University Journal of Natural Sciences》 CAS CSCD 2015年第2期141-145,共5页
In this paper we propose a novel model "recursive directed graph" based on feature structure, and apply it to represent the semantic relations of postpositive attributive structures in biomedical texts. The usages o... In this paper we propose a novel model "recursive directed graph" based on feature structure, and apply it to represent the semantic relations of postpositive attributive structures in biomedical texts. The usages of postpositive attributive are complex and variable, especially three categories: present participle phrase, past participle phrase, and preposition phrase as postpositire attributive, which always bring the difficulties of automatic parsing. We summarize these categories and annotate the semantic information. Compared with dependency structure, feature structure, being recursive directed graph, enhances semantic information extraction in biomedical field. The annotation results show that recursive directed graph is more suitable to extract complex semantic relations for biomedical text mining. 展开更多
关键词 biomedical text mining semantic annotation recursive directed graph postpositive attribute
原文传递
The Refinement Algorithm Consideration in Text Clustering Scheme Based on Multilevel Graph
2
作者 CHENJian-bin DONGXiang-jun SONGHan-tao 《Wuhan University Journal of Natural Sciences》 EI CAS 2004年第5期671-675,共5页
To construct a high efficient text clustering algorithm the multilevel graph model and the refinement algorithm used in the uncoarsening phase is discussed. The model is applied to text clustering. The performance of ... To construct a high efficient text clustering algorithm the multilevel graph model and the refinement algorithm used in the uncoarsening phase is discussed. The model is applied to text clustering. The performance of clustering algorithm has to be improved with the refinement algorithm application. The experiment result demonstrated that the multilevel graph text clustering algorithm is available. Key words text clustering - multilevel coarsen graph model - refinement algorithm - high-dimensional clustering CLC number TP301 Foundation item: Supported by the National Natural Science Foundation of China (60173051)Biography: CHEN Jian-bin(1970-), male, Associate professor, Ph. D., research direction: data mining. 展开更多
关键词 text clustering multilevel coarsen graph model refinement algorithm high-dimensional clustering
在线阅读 下载PDF
基于PKUSEG-Text-GCN的肿瘤疾病预测模型
3
作者 高志玲 赵新宇 《计算机工程与科学》 北大核心 2025年第7期1303-1311,共9页
当前疾病预测模型仅关注病历文本的局部信息以及上下文信息,缺乏对全局信息的考虑,由此导致预测结果准确率不高。利用图神经网络关注全局信息的特点,提出将图卷积神经网络(GCN)用于中文电子病历的肿瘤疾病预测。首先,利用医学领域分词... 当前疾病预测模型仅关注病历文本的局部信息以及上下文信息,缺乏对全局信息的考虑,由此导致预测结果准确率不高。利用图神经网络关注全局信息的特点,提出将图卷积神经网络(GCN)用于中文电子病历的肿瘤疾病预测。首先,利用医学领域分词工具包PKUSEG对中文电子病历进行分词;其次,通过病历与词的共现关系和病历文本中词与词之间的关系,建立文本图;最后,基于该医学文本图利用图卷积神经网络(Text-GCN)对文本图的特征进行学习,将学习到的模型用于肿瘤疾病预测。实验结果显示,所提模型相比多个模型中的最优模型准确率提升了6%。同时,当数据较少的时候准确率并不会明显下降,表明该模型在电子病历较少的情况下仍具有很好的鲁棒性。 展开更多
关键词 文本图卷积神经网络 中文分词 肿瘤致病分析 肿瘤疾病预测
在线阅读 下载PDF
融合知识增强与SimCLS框架的生成式文本摘要模型
4
作者 刘佳旭 吴石 张艳菊 《计算机系统应用》 2026年第3期44-58,共15页
旨在通过理解输入的原始文本生成简洁、易读的摘要.然而,现有模型输出的摘要中仍存在语义冗余、事实性错误以及暴露偏差的问题.解决这些问题对于提升模型性能和摘要质量具有重要的研究意义.因此,提出一种融合知识增强与SimCLS框架的生... 旨在通过理解输入的原始文本生成简洁、易读的摘要.然而,现有模型输出的摘要中仍存在语义冗余、事实性错误以及暴露偏差的问题.解决这些问题对于提升模型性能和摘要质量具有重要的研究意义.因此,提出一种融合知识增强与SimCLS框架的生成式文本摘要模型.首先,设计了知识增强编码器获取源文本的结构化知识信息以维护全局上下文的结构信息,并结合文本编码器充分编码全文语义信息.其次,在解码器部分利用Copy机制,更加准确地再现原始文本中的信息.最后,使用SimCLS两阶段的对比学习训练框架,对模型生成的摘要进行评分以驱动模型生成高质量摘要.实验结果表明,相较于表现较为优异的SeqCo模型,所提模型在CNN/Daily Mail数据集上的ROUGE-1/2/L及BERTScore分别提升了1.84、0.65、2.04和0.21个百分点,在XSum数据集上分别提升了1.78、2.16、2.36和0.13个百分点,验证了模型的有效性. 展开更多
关键词 知识增强 生成式文本摘要 对比学习 语义知识 图注意力网络
在线阅读 下载PDF
基于关系导向的电力设备故障缺陷文本实体及关系联合抽取方法
5
作者 李艾青 宋辉 +2 位作者 田嘉鹏 盛戈皞 江秀臣 《高压电器》 北大核心 2026年第2期42-49,70,共9页
电力设备故障缺陷知识图谱能够有效提升设备运维的智能化、自动化水平,而实体及关系的抽取对图谱的构建至关重要。然而故障缺陷文本中的实体关系三元组往往互相重叠或嵌套,使得传统方法难以处理,并伴随着误差传递、冗余实体推断等问题... 电力设备故障缺陷知识图谱能够有效提升设备运维的智能化、自动化水平,而实体及关系的抽取对图谱的构建至关重要。然而故障缺陷文本中的实体关系三元组往往互相重叠或嵌套,使得传统方法难以处理,并伴随着误差传递、冗余实体推断等问题。针对这些问题,文中提出了一种面向电力设备故障缺陷领域的实体及关系联合抽取方法。该方法将三元组抽取任务建模为不同关系类型下头实体映射到尾实体的过程,通过首先抽取出头实体,再为已识别头实体针对每一种关系分别标记其对应的尾实体,从而有效缓解了三元组重叠嵌套及冗余推断等问题。实验表明,所提出的方法相较于基线模型在三元组出现不同程度重叠或嵌套时表现地更加鲁棒,其F1值提升了8.57%~25.19%,验证了所提模型的有效性与可行性。 展开更多
关键词 电力设备 故障缺陷文本 知识图谱 知识抽取 深度学习
在线阅读 下载PDF
基于语义图增强注意力网络的症状属性分类方法
6
作者 贾鹤鸣 李伟 +1 位作者 李波 张志东 《计算机应用研究》 北大核心 2026年第1期53-59,共7页
医疗对话中的症状属性分类是实现自动诊断系统的关键任务之一,旨在识别对话文本中描述的症状所对应的属性类别。然而,现有方法在处理长文本对话时普遍存在上下文建模能力不足、语义依赖捕捉不充分等问题,导致整体分类性能受限,尤其在少... 医疗对话中的症状属性分类是实现自动诊断系统的关键任务之一,旨在识别对话文本中描述的症状所对应的属性类别。然而,现有方法在处理长文本对话时普遍存在上下文建模能力不足、语义依赖捕捉不充分等问题,导致整体分类性能受限,尤其在少数类样本上的表现欠佳。针对上述挑战,提出一种基于语义图增强注意力网络的症状属性分类方法。该方法通过构建症状关联的文本分割方法、融合编码策略以及基于依存树的关系图注意力网络,在多个层次上增强模型对症状上下文信息的建模能力。实验结果表明,所提方法在CHIP-MDCFNPC数据集上取得了72.13%的F 1(+1.76%)和77.94%的宏平均F 1值(+1.77%)。所提方法能够显著提升长文本医疗对话中症状属性分类的效果,尤其在少数类样本上的表现更为突出,为构建高效可靠的自动诊断系统提供了有益借鉴。 展开更多
关键词 症状属性分类 文本分割 关系图注意力机制
在线阅读 下载PDF
基于文本图表征的GAI生成内容与原始 语料的对比研究
7
作者 黄炜 吴昀璟 +1 位作者 余辉 李伟卿 《情报杂志》 北大核心 2026年第2期124-130,F0003,共8页
人工智能生成内容在网络空间中日益泛滥。探究人类生成内容与人工智能生成内容的差异,为未来检测识别人工智能生成内容的研究工作提供参考。以网络新闻文本为例,首先使用依存句法分析方法提取文本语义结构,然后通过随机游走算法提取图... 人工智能生成内容在网络空间中日益泛滥。探究人类生成内容与人工智能生成内容的差异,为未来检测识别人工智能生成内容的研究工作提供参考。以网络新闻文本为例,首先使用依存句法分析方法提取文本语义结构,然后通过随机游走算法提取图向量表征,最后对比原始文本(原始语料)与经过生成式人工智能释义后文本的共性和差异性。研究结果表明,由生成式人工智能释义后的文本之间具有较强的共性,表现为相似度均在0.7以上;原始文本与生成式人工智能释义后的文本具有较强的差异性,并且差异性随模型随机性增加而增加,表现为两者相似度由0.6至0.4逐渐递减。 展开更多
关键词 生成式人工智能 文本图表征 网络新闻文本 人工智能生成内容检测 文本语义结构 依存句法
在线阅读 下载PDF
基于层次感知匹配的文本隐写分析方法
8
作者 贾江浩 张梓葳 +2 位作者 郜丽婷 文娟 薛一鸣 《计算机工程》 北大核心 2026年第2期245-252,共8页
针对现有文本隐写分析模型难以学习和提取载密数据中真实存在的多层有效信息的问题,提出一种基于层次感知匹配的文本隐写分析方法HAM-Stega。该方法利用隐写数据中的文本信息与标签信息之间相对距离的匹配关系,以层次感知的方式获取文... 针对现有文本隐写分析模型难以学习和提取载密数据中真实存在的多层有效信息的问题,提出一种基于层次感知匹配的文本隐写分析方法HAM-Stega。该方法利用隐写数据中的文本信息与标签信息之间相对距离的匹配关系,以层次感知的方式获取文本与粗粒度、细粒度标签之间的特征匹配关系,以此设计联合嵌入损失函数和匹配学习损失函数,引导文本特征表示进行分类学习,得到最终的层次分类信息。实验结果表明,HAM-Stega在更符合现实场景的多分布混合数据集Large上的检测精度比对比模型提高了1.25~7.42百分点,表明该模型在混合数据集上具有有效的隐写分析检测能力。同时,HAM-Stega对于隐写数据中存在的其他多层有效信息(载密文本的隐写算法、嵌入率、语料类型等)可以进行提取和检测,其在层次分类指标Macro-F1和Micro-F1上相较于预训练的BERT模型分别提高了5.41和4.36百分点。 展开更多
关键词 信息安全 文本隐写分析 层次感知匹配 图神经网络 BERT
在线阅读 下载PDF
面向公安侦查的社交平台用户画像构建方法研究
9
作者 韩沈飞 何芳州 《情报探索》 2026年第1期33-41,共9页
[目的/意义]旨在探索一种基于社交平台数据的用户画像构建方法,通过分析用户行为特征为公安侦查提供数据支持。[方法/过程]以微信平台为数据来源,采用图卷积神经网络GCN模型对用户朋友圈行为数据进行挖掘,提取用户社交特征;同时,利用DSR... [目的/意义]旨在探索一种基于社交平台数据的用户画像构建方法,通过分析用户行为特征为公安侦查提供数据支持。[方法/过程]以微信平台为数据来源,采用图卷积神经网络GCN模型对用户朋友圈行为数据进行挖掘,提取用户社交特征;同时,利用DSR-BGRU(Dynamic Semantic Representation-Bidirectional Gated Recurrent Unit)模型对用户聊天记录进行文本分类,提取用户兴趣标签,并结合警务数据库中的犯罪标签,构建完整的用户标签体系。[结果/结论]该方法能够有效挖掘用户的社交特征,为犯罪个体的画像构建提供了可靠的技术支持。 展开更多
关键词 用户画像 图卷积神经网络 文本分类 标签提取
在线阅读 下载PDF
融合全局异构图与标签感知联合嵌入的多标签文本分类
10
作者 王连喜 黄华煜 +1 位作者 林楠铠 陈卓玮 《情报杂志》 北大核心 2026年第3期159-166,共8页
多标签文本分类通过为文本分配多个语义标签,能有效解决传统单标签分类对复杂语义表征不足的问题,在学术文献分类、信息检索等领域具有重要应用价值。然而,现有方法普遍存在全局语义建模不充分与局部特征交互缺失的双重挑战。提出一种... 多标签文本分类通过为文本分配多个语义标签,能有效解决传统单标签分类对复杂语义表征不足的问题,在学术文献分类、信息检索等领域具有重要应用价值。然而,现有方法普遍存在全局语义建模不充分与局部特征交互缺失的双重挑战。提出一种融合全局异构图与标签感知联合嵌入的多标签文本分类方法,涵盖标签—文本联合嵌入模块、全局异构图模块、交叉注意力融合模块。通过建立文本—词汇—标签的全局异构图网络,利用图卷积聚合跨节点语义信息以捕获长程依赖;同时设计标签感知的联合嵌入机制提取局部上下文特征,并通过交叉注意力实现全局语义与局部特征的动态融合。在学术文献分类和新闻主题识别领域的三个基准数据集上的实验表明,提出的方法在Macro F1、Micro F1和Jaccard指标上分别取得1.05%~2.74%、0.13%~0.88%和0.1%~1.47%的显著提升,消融实验验证了全局图建模与联合嵌入机制的有效性。 展开更多
关键词 多标签文本分类 全局异构图 标签感知联合嵌入 交叉注意力
在线阅读 下载PDF
一种基于TextRank的单文本关键字提取算法 被引量:20
11
作者 柳林青 余瀚 +1 位作者 费宁 陈春玲 《计算机应用研究》 CSCD 北大核心 2018年第3期705-710,共6页
作为一种经典的文本关键字提取和摘要自动生成算法,TextRank将文本看做若干单词组成的集合,并通过对单词节点图的节点权值进行迭代计算,挖掘单词之间的潜在语义关系。在TextRank节点图模型的基础上,将马尔可夫状态转移模型与节点图相结... 作为一种经典的文本关键字提取和摘要自动生成算法,TextRank将文本看做若干单词组成的集合,并通过对单词节点图的节点权值进行迭代计算,挖掘单词之间的潜在语义关系。在TextRank节点图模型的基础上,将马尔可夫状态转移模型与节点图相结合,提出节点间边权为条件概率的新模型生成算法TextRank_Revised。通过对有标记和无标记的验证集进行验证,证明新的算法在不提升时间复杂度的前提下,通过计算单文本得出的单词排序结果相较于原TextRank算法更加吻合人工对文档的关键字提取结果。 展开更多
关键词 textRank 单文本关键字 提取算法 有向带权图 马尔可夫状态转移模型
在线阅读 下载PDF
KG和RAG协同知识增强的数学古籍领域智能体
12
作者 赵学东 林民 +2 位作者 唐邦洋 董杰 白胡日查 《计算机工程与应用》 北大核心 2026年第4期124-136,共13页
通用大语言模型(large language model,LLM)在数学古籍领域常因专业术语识别不准确、上下文关系理解偏差、知识推理不全和计算过程错误而产生严重的幻觉(hallucination)问题,包括事实性幻觉、忠实性幻觉和逻辑性幻觉。检索增强生成(retr... 通用大语言模型(large language model,LLM)在数学古籍领域常因专业术语识别不准确、上下文关系理解偏差、知识推理不全和计算过程错误而产生严重的幻觉(hallucination)问题,包括事实性幻觉、忠实性幻觉和逻辑性幻觉。检索增强生成(retrieval-augmented generation,RAG)技术引入外部领域文本,目前是缓解大语言模型领域事实性幻觉的一种有效方法。然而RAG的检索内容存在噪声,且知识片段之间缺乏深层关联,使得RAG在缓解忠实性幻觉和逻辑性幻觉方面的能力较为有限。领域知识图谱(domain knowledge graph,DKG)具有将领域知识关联起来的能力,为此提出了DKG和RAG协同知识增强框架(collaborative knowledge augmentation between domain knowledge graph and retrieval-augmented generation,CogKAG),并构建数学古籍《九章算术》领域智能体。CogKAG框架智能体旨在通过检索DKG的结构化领域关联知识和利用RAG检索非结构化领域文本构建动态结构化综合上下文提示,增强LLM的上下文关系及逻辑推理计算能力,从而有效缓解其在数学古籍领域中的忠实性、逻辑性幻觉问题。实验结果证明,CogKAG框架智能体可以显著减轻LLM在数学古籍领域上的幻觉,从而提升在问答(question and answer,QA)任务上的性能。 展开更多
关键词 大语言模型 领域知识图谱 检索增强生成 智能体 数学古籍 《九章算术》
在线阅读 下载PDF
融合嵌入信息与AHGCN模型的电网项目多标签文本分类方法
13
作者 张艳 张执 +2 位作者 刘明红 韩立芝 柏广宇 《控制工程》 北大核心 2026年第1期57-65,共9页
为了解决传统多标签文本分类方法难以综合考虑文本与标签之间复杂关系的问题,提出了融合嵌入信息与自适应异构图卷积网络(adaptive heterogeneous graph convolutional network,AHGCN)模型的多标签文本分类方法。首先,采用全局词频统计... 为了解决传统多标签文本分类方法难以综合考虑文本与标签之间复杂关系的问题,提出了融合嵌入信息与自适应异构图卷积网络(adaptive heterogeneous graph convolutional network,AHGCN)模型的多标签文本分类方法。首先,采用全局词频统计的词表征模型进行文本表示,结合双向长短期记忆神经网络与自注意力机制提取多层次语义特征;然后,构建AHGCN模型,通过多尺度卷积核融合文本和标签的全局与局部信息,建立文本-标签异构图以捕捉二者的潜在关联;最后,拼接不同层级特征,利用分类器实现文本分类。实验将所提方法与目前的主流多标签文本分类方法进行了比较。实验结果表明,在大规模数据集的多标签文本分类中,所提方法的汉明损失最小且准确率最高。在实际电网项目的应用中,所提方法的多标签文本分类准确率可达96.85%。 展开更多
关键词 嵌入信息 图卷积 注意力机制 电网项目 文本分类
原文传递
基于GraphSAGE网络的藏文短文本分类研究 被引量:1
14
作者 敬容 杨逸民 +3 位作者 万福成 国旗 于洪志 马宁 《中文信息学报》 CSCD 北大核心 2024年第9期58-65,共8页
文本分类是自然语言处理领域的重要研究方向,由于藏文数据的稀缺性、语言学特征抽取的复杂性、篇章结构的多样性等因素导致藏文文本分类任务进展缓慢。因此,该文以图神经作为基础模型进行改进。首先,在“音节-音节”“音节-文档”建模... 文本分类是自然语言处理领域的重要研究方向,由于藏文数据的稀缺性、语言学特征抽取的复杂性、篇章结构的多样性等因素导致藏文文本分类任务进展缓慢。因此,该文以图神经作为基础模型进行改进。首先,在“音节-音节”“音节-文档”建模的基础上,融合文档特征,采用二元分类模型动态网络构建“文档-文档”边,以充分挖掘短文本的全局特征,增加滑动窗口,减少模型的计算复杂度并寻找最优窗口取值。其次,针对藏文短文本的音节稀疏性,首次引入GraphSAGE作为基础模型,并探究不同聚合方式在藏文短文本分类上的性能差异。最后,为捕获节点间关系的异质性,对邻居节点进行特征加权再平均池化以增强模型的特征提取能力。在TNCC标题文本数据集上,该文模型的分类准确率达到了62.50%,与传统GCN、原始GraphSAGE和预训练语言模型CINO相比,该方法在分类准确率上分别提高了2.56%、1%和2.4%。 展开更多
关键词 图神经网络 藏文文本分类 TNCC数据集
在线阅读 下载PDF
基于语义增强模式链接的Text-to-SQL模型 被引量:1
15
作者 吴相岚 肖洋 +1 位作者 刘梦莹 刘明铭 《计算机应用》 CSCD 北大核心 2024年第9期2689-2695,共7页
为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加... 为优化基于异构图编码器的Text-to-SQL生成效果,提出SELSQL模型。首先,模型采用端到端的学习框架,使用双曲空间下的庞加莱距离度量替代欧氏距离度量,以此优化使用探针技术从预训练语言模型中构建的语义增强的模式链接图;其次,利用K头加权的余弦相似度以及图正则化方法学习相似度度量图使得初始模式链接图在训练中迭代优化;最后,使用改良的关系图注意力网络(RGAT)图编码器以及多头注意力机制对两个模块的联合语义模式链接图进行编码,并且使用基于语法的神经语义解码器和预定义的结构化语言进行结构化查询语言(SQL)语句解码。在Spider数据集上的实验结果表明,使用ELECTRA-large预训练模型时,SELSQL模型比最佳基线模型的准确率提升了2.5个百分点,对于复杂SQL语句生成的提升效果很大。 展开更多
关键词 模式链接 图结构学习 预训练语言模型 text-to-SQL 异构图
在线阅读 下载PDF
耕地“非粮化”调查监测成果知识图谱构建与应用研究
16
作者 董宽林 郑晓莉 +1 位作者 周吾珍 慎利 《自然资源信息化》 2026年第1期9-16,共8页
耕地“非粮化”一直是粮食安全不可回避的重大问题。第三次全国国土调查及2023年度全国国土变更调查已经获取部分耕地“非粮化”相关数据,但这些数据仍未经过系统性整合,无法融合地理和专业知识并推理产生高价值的知识性输出,使政府在... 耕地“非粮化”一直是粮食安全不可回避的重大问题。第三次全国国土调查及2023年度全国国土变更调查已经获取部分耕地“非粮化”相关数据,但这些数据仍未经过系统性整合,无法融合地理和专业知识并推理产生高价值的知识性输出,使政府在面临海量数据时难以作出最佳判断和决策。本文针对这一问题提出了耕地“非粮化”调查监测成果知识图谱的构建流程和技术框架,旨在为耕地“非粮化”防护提供综合性高质量服务。采用RoBERTa-BiLSTM-CRF深度学习算法对多源异构的各类耕地“非粮化”调查监测数据进行知识抽取,得到耕地“非粮化”业务知识,并据此构建耕地“非粮化”知识系统;以RoBERTa模型为基础开发知识问答系统,实现可交互、高效率、高精度的自然语言问答和分析,实现耕地“非粮化”调查监测成果知识图谱构建与应用;对耕地“非粮化”本体自动化构建、知识抽取、高度自动化完善和更新知识库进行了总结与展望。 展开更多
关键词 知识图谱 耕地 “非粮化” 实体抽取 文本分类 RoBERTa
在线阅读 下载PDF
一种改进GraphRNN的多标签文本分类方法 被引量:1
17
作者 刘汉东 钟学燕 +1 位作者 陈雁 王欣 《小型微型计算机系统》 CSCD 北大核心 2023年第5期947-953,共7页
多标签文本分类旨在为文本分配多个标签,其关键挑战在于如何利用标签之间的关联性.目前方法主要采用循环神经网络相比传统方法能更好地建模标签高阶关联,但存在难以确定标签顺序的问题,以及缺乏对标签关联程度进行建模.为此,论文提出一... 多标签文本分类旨在为文本分配多个标签,其关键挑战在于如何利用标签之间的关联性.目前方法主要采用循环神经网络相比传统方法能更好地建模标签高阶关联,但存在难以确定标签顺序的问题,以及缺乏对标签关联程度进行建模.为此,论文提出一种基于改进图循环神经网络的多标签文本分类方法.首先,根据标签共现构建标签图数据,然后将多标签分类转换为标签图生成,最后通过广度优先搜索将生成的标签图转回为标签集,作为分类结果.相关实验表明,论文提出的模型在instance-F1和label-F1指标上优于基线模型,细粒度建模了标签关联,同时减少了模型对于标签顺序的依赖. 展开更多
关键词 多标签分类 文本分类 图生成 标签关联
在线阅读 下载PDF
Using Luhn’s Automatic Abstract Method to Create Graphs of Words for Document Visualization
18
作者 Luiz Cláudio Santos Silva Renelson Ribeiro Sampaio 《Social Networking》 2014年第2期65-70,共6页
Visualization methods for single documents are either too simple, considering word frequency only, or depend on syntactic and semantic information bases to be more useful. This paper presents an intermediary approach,... Visualization methods for single documents are either too simple, considering word frequency only, or depend on syntactic and semantic information bases to be more useful. This paper presents an intermediary approach, based on H. P. Luhn’s automatic abstract creation algorithm, and intends to aggregate more information to document visualization than word counting methods do without the need of external sources. The method takes pairs of relevant words and computes the linkage force between them. Relevant words become vertices and links become edges in the resulting graph. 展开更多
关键词 text VISUALIZATION graph of WORDS
暂未订购
图神经网络在Text-to-SQL解析中的技术研究 被引量:3
19
作者 曹合心 赵亮 李雪峰 《计算机科学》 CSCD 北大核心 2022年第4期110-115,共6页
语义解析领域中的Text-to-SQL任务对实现基于数据库的自动问答具有重要意义。现有深度学习模型,如Seq2Seq的序列生成模型在单表SQL查询中已取得显著效果,但无法解决多表SQL查询的问题。图神经网络能够有效提取数据库表和问句之间的关联... 语义解析领域中的Text-to-SQL任务对实现基于数据库的自动问答具有重要意义。现有深度学习模型,如Seq2Seq的序列生成模型在单表SQL查询中已取得显著效果,但无法解决多表SQL查询的问题。图神经网络能够有效提取数据库表和问句之间的关联信息,丰富解析过程中的语义信息,从而提升多表SQL查询的准确率。文中提出一种自适应的图构建方式和图编码方式,在现有Text-to-SQL模型中引入问句信息,通过对问句和数据库的拼接词向量进行卷积操作生成图网络初始化权重,对同种类型下的不同数据库可实现统一训练。采用IRNet框架和关系扩充的方式进行整体模型设计,在当前开放的Text-to-SQL数据集Spider上进行验证。结果表明,该技术能够有效提升多表SQL语句生成的匹配准确率,同时算法对图神经网络在Text-to-SQL领域的研究具有重要的参考价值。 展开更多
关键词 text-to-SQL解析 深度学习 图构建 图神经网络 多表SQL语句生成
在线阅读 下载PDF
结合对比学习和双流网络融合知识图谱摘要模型 被引量:3
20
作者 赵霞 王钊 《计算机应用研究》 北大核心 2025年第3期720-727,共8页
提出了一种融合对比学习与双流网络的新型知识图谱摘要模型(KGDR-CLSUM),旨在解决现有模型在生成摘要时存在的事实性错误和信息提取不足的问题。该模型通过设计双流网络同时处理文本特征和知识图谱特征,并采用对比学习来强化这两类特征... 提出了一种融合对比学习与双流网络的新型知识图谱摘要模型(KGDR-CLSUM),旨在解决现有模型在生成摘要时存在的事实性错误和信息提取不足的问题。该模型通过设计双流网络同时处理文本特征和知识图谱特征,并采用对比学习来强化这两类特征的有效融合。此外,引入动量蒸馏策略以降低知识图谱中的数据噪声,从而提升摘要生成的质量和准确性。在CNN/Daily Mail数据集上,KGDR-CLSUM相较于基线模型PEGASUS BASE,在ROUGE-1、ROUGE-2和ROUGE-L指标上分别提升了3.03%、3.42%和2.56%,在XSum数据集上更是达到了7.54%、8.78%和8.51%的显著提升。此外,人工评分显著高于ChatGPT,进一步证明了该模型的优越性能。结果表明,KGDR-CLSUM在生成摘要时,尤其在短文本生成任务中,能够有效降低错误信息,并显著提高摘要的质量。 展开更多
关键词 文本摘要 知识图谱 动量蒸馏 对比学习 双流网络
在线阅读 下载PDF
上一页 1 2 26 下一页 到第
使用帮助 返回顶部