期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
Constructing a taxonomy to support multi-document summarization of dissertation abstracts
1
作者 KHOO Christopher S.G. GOH Dion H. 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第11期1258-1267,共10页
This paper reports part of a study to develop a method for automatic multi-document summarization. The current focus is on dissertation abstracts in the field of sociology. The summarization method uses macro-level an... This paper reports part of a study to develop a method for automatic multi-document summarization. The current focus is on dissertation abstracts in the field of sociology. The summarization method uses macro-level and micro-level discourse structure to identify important information that can be extracted from dissertation abstracts, and then uses a variable-based framework to integrate and organize extracted information across dissertation abstracts. This framework focuses more on research concepts and their research relationships found in sociology dissertation abstracts and has a hierarchical structure. A taxonomy is constructed to support the summarization process in two ways: (1) helping to identify important concepts and relations expressed in the text, and (2) providing a structure for linking similar concepts in different abstracts. This paper describes the variable-based framework and the summarization process, and then reports the construction of the taxonomy for supporting the summarization process. An example is provided to show how to use the constructed taxonomy to identify important concepts and integrate the concepts extracted from different abstracts. 展开更多
关键词 Text summarization automatic multi-document summarization Variable-based framework Digital library
在线阅读 下载PDF
Weakly Supervised Abstractive Summarization with Enhancing Factual Consistency for Chinese Complaint Reports
2
作者 Ren Tao Chen Shuang 《Computers, Materials & Continua》 SCIE EI 2023年第6期6201-6217,共17页
A large variety of complaint reports reflect subjective information expressed by citizens.A key challenge of text summarization for complaint reports is to ensure the factual consistency of generated summary.Therefore... A large variety of complaint reports reflect subjective information expressed by citizens.A key challenge of text summarization for complaint reports is to ensure the factual consistency of generated summary.Therefore,in this paper,a simple and weakly supervised framework considering factual consistency is proposed to generate a summary of city-based complaint reports without pre-labeled sentences/words.Furthermore,it considers the importance of entity in complaint reports to ensure factual consistency of summary.Experimental results on the customer review datasets(Yelp and Amazon)and complaint report dataset(complaint reports of Shenyang in China)show that the proposed framework outperforms state-of-the-art approaches in ROUGE scores and human evaluation.It unveils the effectiveness of our approach to helping in dealing with complaint reports. 展开更多
关键词 automatic summarization abstractive summarization weakly supervised training entity recognition
在线阅读 下载PDF
基于改进Graph2Seq的实体融合摘要生成模型
3
作者 陶源 钱惠敏 《计算机与现代化》 2025年第6期1-8,共8页
针对现有摘要生成模型占用计算资源大和对关键命名实体信息关注不足的问题,基于Graph2Seq模型提出一种融合实体和稀疏注意力的文摘生成模型(ESG2S)。首先,将原始文本构建为句法依存图,并进行实体节点增强,得到图数据;其次,将构建好的图... 针对现有摘要生成模型占用计算资源大和对关键命名实体信息关注不足的问题,基于Graph2Seq模型提出一种融合实体和稀疏注意力的文摘生成模型(ESG2S)。首先,将原始文本构建为句法依存图,并进行实体节点增强,得到图数据;其次,将构建好的图数据送入编码器,进行文本结构的学习;最后,将编码后的图数据送入融合了对称散度增强稀疏注意力的LSTM解码器,生成多条摘要。在CNN/DM数据集上进行实验,结果表明本文模型效果优于近年的一些主流方法,并在实体信息保留上取得了成效,生成的摘要可读性和信息全面性更佳。 展开更多
关键词 关键词摘要生成 Graph2Seq 命名实体 稀疏注意力
在线阅读 下载PDF
基于名实体的新闻专题自动综述系统研究与实现 被引量:2
4
作者 索红光 安迪 李健 《情报学报》 CSSCI 北大核心 2010年第1期32-37,共6页
自动综述是指针对特定的主题进行多文档自动摘要,最终提供简洁、重要的信息。新闻专题自动综述是多文档自动摘要的一种应用形式,它可以帮助人们快速了解某个新闻事件的概貌。提出了一种基于名实体的新闻专题自动综述方法。该方法首先... 自动综述是指针对特定的主题进行多文档自动摘要,最终提供简洁、重要的信息。新闻专题自动综述是多文档自动摘要的一种应用形式,它可以帮助人们快速了解某个新闻事件的概貌。提出了一种基于名实体的新闻专题自动综述方法。该方法首先从新闻专题的文章集合中识别并挑选出代表新闻要素的时间、地点、人物、机构等名实体,经过语义处理后进行名实体的频率统计。然后根据句子中名实体的频率,结合句子位置、长度等因素计算句子的综合权值选出摘要句,最后根据句子的时间戳信息对句子排序输出得到最终的新闻专题综述。实验结果表明,该方法是有效的,具有实用价值。 展开更多
关键词 自动综述 多文档自动摘要 名实体
在线阅读 下载PDF
命名实体识别和指代消解在文摘系统中的应用 被引量:7
5
作者 于海滨 秦兵 +1 位作者 刘挺 郎君 《计算机应用研究》 CSCD 北大核心 2006年第4期180-182,195,共4页
介绍了一个基于句子抽取的单文档自动文摘系统,在该系统基础上应用了命名实体识别和指代消解技术,最后通过人工评价和自动评价结果讨论命名实体识别和指代消解对文摘系统的贡献。
关键词 自动文摘 命名实体识别 指代消解
在线阅读 下载PDF
基于实体名的文本自动综述研究 被引量:2
6
作者 葛加银 黄萱菁 吴立德 《计算机科学》 CSCD 北大核心 2004年第9期161-164,共4页
自动文摘是自然语言处理的一个重要分支,在信息检索领域中有着重要的用途,文本自动综述是自动文摘在多文档上的推广。本文提出了基于实体名扩展的自动综述方法,这种方法认为综述中的实体名个数反映其中所蕴合信息量的多少。我们用该方... 自动文摘是自然语言处理的一个重要分支,在信息检索领域中有着重要的用途,文本自动综述是自动文摘在多文档上的推广。本文提出了基于实体名扩展的自动综述方法,这种方法认为综述中的实体名个数反映其中所蕴合信息量的多少。我们用该方法实现针对事件的自动综述生成,并参加了2003年文本理解会议(Document UnderstandingConference,DUC)进行统一评测,DUC反馈的评测结果显示这种方法是有效的。此外,本文还对文本理解会议的任务、评测方法和测试结果做了简单介绍。 展开更多
关键词 文档 评测方法 实体 自然语言处理 事件 显示 文本 自动文摘 理解 信息检索
在线阅读 下载PDF
基于篇章修辞结构的自动文摘连贯性研究 被引量:3
7
作者 刘凯 王红玲 《中文信息学报》 CSCD 北大核心 2019年第1期77-84,共8页
尽管抽取式自动文摘方法是目前自动文摘领域的主流方法,并且取得了长足的进步,但抽取式自动文摘形成的摘要由于缺乏句子之间的合理指代或篇章结构,使得文摘缺乏连贯性而影响可读性。为提高自动摘要的可读性,该文尝试将篇章修辞结构信息... 尽管抽取式自动文摘方法是目前自动文摘领域的主流方法,并且取得了长足的进步,但抽取式自动文摘形成的摘要由于缺乏句子之间的合理指代或篇章结构,使得文摘缺乏连贯性而影响可读性。为提高自动摘要的可读性,该文尝试将篇章修辞结构信息应用于中文自动文摘。首先,基于汉语篇章修辞结构抽取摘要,然后使用基于LSTM的方法对文本连贯性进行建模,并使用该模型对文摘的连贯性做出评价。实验结果表明:在摘要抽取方面,基于篇章修辞结构的自动文摘相比于传统的抽取方法具有更好的ROUGE评价值;在使用基于LSTM连贯性模型评价摘要连贯性方面,篇章结构信息在自动抽取文摘时可以很好地提炼出文章的主旨,同时使摘要具有更好的结果。 展开更多
关键词 篇章修辞结构 中文自动文摘 连贯性 可读性 实体网格模型 LSTM
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部