期刊文献+
共找到277篇文章
< 1 2 14 >
每页显示 20 50 100
Insertion of Ontological Knowledge to Improve Automatic Summarization Extraction Methods
1
作者 Jésus Antonio Motta Laurence Capus Nicole Tourigny 《Journal of Intelligent Learning Systems and Applications》 2011年第3期131-138,共8页
The vast availability of information sources has created a need for research on automatic summarization. Current methods perform either by extraction or abstraction. The extraction methods are interesting, because the... The vast availability of information sources has created a need for research on automatic summarization. Current methods perform either by extraction or abstraction. The extraction methods are interesting, because they are robust and independent of the language used. An extractive summary is obtained by selecting sentences of the original source based on information content. This selection can be automated using a classification function induced by a machine learning algorithm. This function classifies sentences into two groups: important or non-important. The important sentences then form the summary. But, the efficiency of this function directly depends on the used training set to induce it. This paper proposes an original way of optimizing this training set by inserting lexemes obtained from ontological knowledge bases. The training set optimized is reinforced by ontological knowledge. An experiment with four machine learning algorithms was made to validate this proposition. The improvement achieved is clearly significant for each of these algorithms. 展开更多
关键词 automatic summarization ONTOLOGY MACHINE Learning Extraction Method
暂未订购
Using LSA and text segmentation to improve automatic Chinese dialogue text summarization 被引量:3
2
作者 LIU Chuan-han WANG Yong-cheng +1 位作者 ZHENG Fei LIU De-rong 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2007年第1期79-87,共9页
Automatic Chinese text summarization for dialogue style is a relatively new research area. In this paper, Latent Semantic Analysis (LSA) is first used to extract semantic knowledge from a given document, all questio... Automatic Chinese text summarization for dialogue style is a relatively new research area. In this paper, Latent Semantic Analysis (LSA) is first used to extract semantic knowledge from a given document, all question paragraphs are identified, an automatic text segmentation approach analogous to Text'filing is exploited to improve the precision of correlating question paragraphs and answer paragraphs, and finally some "important" sentences are extracted from the generic content and the question-answer pairs to generate a complete summary. Experimental results showed that our approach is highly efficient and improves significantly the coherence of the summary while not compromising informativeness. 展开更多
关键词 automatic text summarization Latent semantic analysis (LSA) Text segmentation Dialogue style COHERENCE Question-answer pairs
在线阅读 下载PDF
Study on controllability of semantic accessibility scale from the internet-based system of automatic text summarization and evaluation 被引量:2
3
作者 DU Jia-li YU Ping-fang +1 位作者 ZHAO Hong-yan XU Jing 《通讯和计算机(中英文版)》 2008年第9期54-60,共7页
关键词 通信技术 计算机技术 控制方法 自动化系统
在线阅读 下载PDF
Weakly Supervised Abstractive Summarization with Enhancing Factual Consistency for Chinese Complaint Reports
4
作者 Ren Tao Chen Shuang 《Computers, Materials & Continua》 SCIE EI 2023年第6期6201-6217,共17页
A large variety of complaint reports reflect subjective information expressed by citizens.A key challenge of text summarization for complaint reports is to ensure the factual consistency of generated summary.Therefore... A large variety of complaint reports reflect subjective information expressed by citizens.A key challenge of text summarization for complaint reports is to ensure the factual consistency of generated summary.Therefore,in this paper,a simple and weakly supervised framework considering factual consistency is proposed to generate a summary of city-based complaint reports without pre-labeled sentences/words.Furthermore,it considers the importance of entity in complaint reports to ensure factual consistency of summary.Experimental results on the customer review datasets(Yelp and Amazon)and complaint report dataset(complaint reports of Shenyang in China)show that the proposed framework outperforms state-of-the-art approaches in ROUGE scores and human evaluation.It unveils the effectiveness of our approach to helping in dealing with complaint reports. 展开更多
关键词 automatic summarization abstractive summarization weakly supervised training entity recognition
在线阅读 下载PDF
Support Vector Machine Based Handwritten Hindi Character Recognition and Summarization
5
作者 Sunil Dhankhar Mukesh Kumar Gupta +3 位作者 Fida Hussain Memon Surbhi Bhatia Pankaj Dadheech Arwa Mashat 《Computer Systems Science & Engineering》 SCIE EI 2022年第10期397-412,共16页
In today’s digital era,the text may be in form of images.This research aims to deal with the problem by recognizing such text and utilizing the support vector machine(SVM).A lot of work has been done on the English l... In today’s digital era,the text may be in form of images.This research aims to deal with the problem by recognizing such text and utilizing the support vector machine(SVM).A lot of work has been done on the English language for handwritten character recognition but very less work on the under-resourced Hindi language.A method is developed for identifying Hindi language characters that use morphology,edge detection,histograms of oriented gradients(HOG),and SVM classes for summary creation.SVM rank employs the summary to extract essential phrases based on paragraph position,phrase position,numerical data,inverted comma,sentence length,and keywords features.The primary goal of the SVM optimization function is to reduce the number of features by eliminating unnecessary and redundant features.The second goal is to maintain or improve the classification system’s performance.The experiment included news articles from various genres,such as Bollywood,politics,and sports.The proposed method’s accuracy for Hindi character recognition is 96.97%,which is good compared with baseline approaches,and system-generated summaries are compared to human summaries.The evaluated results show a precision of 72%at a compression ratio of 50%and a precision of 60%at a compression ratio of 25%,in comparison to state-of-the-art methods,this is a decent result. 展开更多
关键词 Support vector machine(SVM) optimization PRECISION Hindi character recognition optical character recognition(OCR) automatic summarization and compression ratio
在线阅读 下载PDF
Constructing a taxonomy to support multi-document summarization of dissertation abstracts
6
作者 KHOO Christopher S.G. GOH Dion H. 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2005年第11期1258-1267,共10页
This paper reports part of a study to develop a method for automatic multi-document summarization. The current focus is on dissertation abstracts in the field of sociology. The summarization method uses macro-level an... This paper reports part of a study to develop a method for automatic multi-document summarization. The current focus is on dissertation abstracts in the field of sociology. The summarization method uses macro-level and micro-level discourse structure to identify important information that can be extracted from dissertation abstracts, and then uses a variable-based framework to integrate and organize extracted information across dissertation abstracts. This framework focuses more on research concepts and their research relationships found in sociology dissertation abstracts and has a hierarchical structure. A taxonomy is constructed to support the summarization process in two ways: (1) helping to identify important concepts and relations expressed in the text, and (2) providing a structure for linking similar concepts in different abstracts. This paper describes the variable-based framework and the summarization process, and then reports the construction of the taxonomy for supporting the summarization process. An example is provided to show how to use the constructed taxonomy to identify important concepts and integrate the concepts extracted from different abstracts. 展开更多
关键词 Text summarization automatic multi-document summarization Variable-based framework Digital library
在线阅读 下载PDF
嵌入司法要素事实一致性评测的中文司法裁判文书摘要生成研究 被引量:1
7
作者 向博文 柴梦丹 向卓元 《数据分析与知识发现》 北大核心 2025年第8期73-85,共13页
【目的】鉴于司法裁判文书摘要需要与原文在基于案件事实、法律适用等要素方面保持一致,提出嵌入司法要素事实一致性评测的中文司法裁判文书摘要生成方法。【方法】定义司法裁判文书摘要事实一致性判定的原则和方法;确定数据增加、事实... 【目的】鉴于司法裁判文书摘要需要与原文在基于案件事实、法律适用等要素方面保持一致,提出嵌入司法要素事实一致性评测的中文司法裁判文书摘要生成方法。【方法】定义司法裁判文书摘要事实一致性判定的原则和方法;确定数据增加、事实一致性纠错和测评等预处理流程;分别构建分段抽取模型和引入司法要素知识图的生成式摘要模型,并在CAIL2020数据集上进行实验。【结果】本文提出的FC-JDSM模型生成的摘要在指标ROUGE-N(N=1、2、L)、SRO、EM-FCJS上分别为67.98%、55.40%、64.14%、78.54%、90.01%,均优于比较模型。消融实验证实了分块抽取和事实信息引入的有效性。【局限】事实一致性评测模型中的数据增强方案得到的数据与真实数据存在偏差。【结论】将司法要素融入一致性评测和摘要生成过程中,能提高中文司法裁判文书摘要一致性,有利于司法工作的公正性。 展开更多
关键词 司法文书 自动摘要 事实一致性 评测指标 摘要生成模型
原文传递
融合知识和语义信息的双编码器自动摘要模型 被引量:1
8
作者 贾莉 马廷淮 +1 位作者 桑晨扬 潘倩 《计算机工程与应用》 北大核心 2025年第7期213-221,共9页
为了解决自动文本摘要任务存在的文本语义信息不能充分编码、生成的摘要语义冗余、原始语义信息丢失等语义问题,提出了一种融合知识和文本语义信息的双编码器自动摘要模型(dual-encoder automatic summarization model incorporating kn... 为了解决自动文本摘要任务存在的文本语义信息不能充分编码、生成的摘要语义冗余、原始语义信息丢失等语义问题,提出了一种融合知识和文本语义信息的双编码器自动摘要模型(dual-encoder automatic summarization model incorporating knowledge and semantic information,KSDASum)。该方法采用双编码器对原文语义信息进行充分编码,文本编码器获取全文的语义信息,图结构编码器维护全文上下文结构信息。解码器部分采用基于Transformer结构和指针网络,更好地捕捉文本和结构信息进行交互,并利用指针网络的优势提高生成摘要的准确性。同时,训练过程中采用强化学习中自我批判的策略梯度优化模型能力。该方法在CNN/Daily Mail和XSum公开数据集上与GSUM生成式摘要方法相比,在评价指标上均获得最优的结果,证明了所提模型能够有效地利用知识和语义信息,提升了生成文本摘要的能力。 展开更多
关键词 知识图谱编码器 图注意力机制 指针网络 增强训练 自动摘要
在线阅读 下载PDF
结合主题分割和自动文摘的演示文稿生成方法
9
作者 王鑫 李宁 田英爱 《计算机应用与软件》 北大核心 2025年第8期35-40,共6页
通过演示文稿传播学术成果是一种常见做法,然而手工制作演示文稿过于繁琐。该文以学术论文为蓝本,提出一种结合主题分割和自动文摘的演示文稿生成方法。该方法首先在论文章节结构的基础上对正文进行主题分割,构建演示文稿层次结构,再利... 通过演示文稿传播学术成果是一种常见做法,然而手工制作演示文稿过于繁琐。该文以学术论文为蓝本,提出一种结合主题分割和自动文摘的演示文稿生成方法。该方法首先在论文章节结构的基础上对正文进行主题分割,构建演示文稿层次结构,再利用自动文摘抽取论文中的重要文本,基于主题生成演示文稿。实验证明,该方法生成的演示文稿不仅体现论文的行文逻辑,在ROUGE-1、ROUGE-2、ROUGE-L三个指标上也均有所提高。 展开更多
关键词 演示文稿生成 主题分割 自动文摘 ROUGE指标
在线阅读 下载PDF
基于深度学习的自动文本摘要研究综述 被引量:1
10
作者 其其日力格 斯琴图 王斯日古楞 《计算机工程与应用》 北大核心 2025年第18期24-40,共17页
自动文本摘要技术是自然语言处理领域的重要研究方向,旨在实现信息的高效压缩与核心语义的保留。随着深度学习技术的快速发展,基于该技术的自动文本摘要方法逐渐成为主流。从抽取式与生成式两大技术路线出发,系统梳理了序列标注、图神... 自动文本摘要技术是自然语言处理领域的重要研究方向,旨在实现信息的高效压缩与核心语义的保留。随着深度学习技术的快速发展,基于该技术的自动文本摘要方法逐渐成为主流。从抽取式与生成式两大技术路线出发,系统梳理了序列标注、图神经网络、预训练语言模型、序列到序列模型和强化学习等技术在自动文本摘要中的应用,并分析了各类模型的优缺点;介绍了自动文本摘要领域常用的公开数据集、国内低资源语言数据集及评价指标。通过多维度实验对比分析总结了现有技术面临的问题,提出了相应的改进方案。最后,探讨了自动文本摘要的未来研究方向,为后续研究提供参考。 展开更多
关键词 自动文本摘要 深度学习 生成式摘要 抽取式摘要 自然语言处理
在线阅读 下载PDF
中文大模型生成式摘要能力评估 被引量:1
11
作者 王俊超 樊可汗 霍智恒 《中文信息学报》 北大核心 2025年第1期1-15,共15页
从传统的纸带机到当今大语言模型时代,自动文本摘要技术发展经历了多次质的飞跃并不断提升。但在中文摘要方面,由于其语言特点及叙述方式,机器生成的摘要难以与人工撰写的相媲美。如今,众多国产开源大模型均加强了对中文语料的训练并展... 从传统的纸带机到当今大语言模型时代,自动文本摘要技术发展经历了多次质的飞跃并不断提升。但在中文摘要方面,由于其语言特点及叙述方式,机器生成的摘要难以与人工撰写的相媲美。如今,众多国产开源大模型均加强了对中文语料的训练并展示出较为优秀的成果。为了评估这些开源大模型在中文摘要任务上的实际表现,该文筛选ChatGLM2-6B、Baichuan2-7B和InternLM-7B等中文大模型作为研究对象,在中文摘要数据集上采用不同提示词生成零样本和少样本摘要,通过自动评估和人工比对的方法详细分析了它们在自动文本摘要任务上的表现及其不足之处。评估结果表明,ChatGLM2-6B和Baichuan2-7B通过零样本的方法通常能够总结出语句通顺叙述详尽的摘要,但在凝练程度上仍有不足;而少样本的方法可以使大模型生成更为精炼的摘要,但对重点信息的把握程度明显下降。此外,大模型也存在陷入重复、出现幻觉、与事实矛盾等问题。 展开更多
关键词 自动文本摘要 大语言模型 能力评估
在线阅读 下载PDF
论民事争议焦点自动生成的正当性
12
作者 刘韵 《中国海洋大学学报(社会科学版)》 2025年第5期94-103,共10页
民事争议焦点自动生成是人工智能技术赋能下的一种本案争议焦点自动整理和确定的方式。在外部需求层面上,争议焦点自动生成为“人案矛盾”“争议焦点整理形式化”等困境提供了现代化的解决方案,契合司法改革方向。在民事诉讼内部体系的... 民事争议焦点自动生成是人工智能技术赋能下的一种本案争议焦点自动整理和确定的方式。在外部需求层面上,争议焦点自动生成为“人案矛盾”“争议焦点整理形式化”等困境提供了现代化的解决方案,契合司法改革方向。在民事诉讼内部体系的协调层面上,一方面,争议焦点自动生成可平衡公正和效率价值之间的张力,在保障平等原则实质化的同时,推动处分原则、辩论原则的时代化发展;另一方面,在“审前+庭审”两阶段程序构造下,本案争议焦点在审前程序中自动生成与审前程序的目的及阶段性权利保护程度相匹配。在技术支撑层面上,民事争议焦点自动生成内在的请求权基础思维、攻击防御体系的对抗式过程场景,与计算机的线性程序模式和标准化决策结构契合,具有技术可行性。 展开更多
关键词 争议焦点整理 争议焦点自动生成 正当性基础 程序相称 程序保障
在线阅读 下载PDF
自动文摘综述 被引量:24
13
作者 郭燕慧 钟义信 +1 位作者 马志勇 姚均勇 《情报学报》 CSSCI 北大核心 2002年第5期582-591,共10页
本文概述了自动文摘的发展历史和研究状况 ,给出当前自动文摘领域主要的研究方法和策略 ,剖析了它们的优点和不足。进一步结合自动文摘自身的特点和难点 ,提出近期自动文摘的研究重点是基于篇章话语形式的浅层分析方法生成指示型文摘。
关键词 研究方法 研究重点 指示型文摘 自动文摘 话语形式 浅层分析 指示型文摘
在线阅读 下载PDF
Internet上文本的自动摘要技术 被引量:13
14
作者 尹存燕 戴新宇 陈家骏 《计算机工程》 EI CAS CSCD 北大核心 2006年第3期88-90,共3页
主要研究了Internet上的文本自动摘要,介绍了自动摘要的主流技术;讨论Internet上文本摘要的新需求以及网页上与自动摘要相关的信息,介绍了摘要处理过程和当前自动摘要的主要评估方法;对Internet上文本的自动摘要作出了总结和展望。
关键词 自动摘要 抽取型摘要 概括型摘要 互联网
在线阅读 下载PDF
自动摘要方法综述 被引量:9
15
作者 谭翀 陈跃新 《情报学报》 CSSCI 北大核心 2008年第1期62-68,共7页
自动摘要是计算机语言学领域的一个研究重点,自动摘要的研究和应用受到了计算机学、语言学、认知心理学等相关学科的广泛关注。本文讨论了摘要的定义及其分类。依据自动摘要的特点对其分类,并作为构造自动摘要系统和思考自动摘要技术... 自动摘要是计算机语言学领域的一个研究重点,自动摘要的研究和应用受到了计算机学、语言学、认知心理学等相关学科的广泛关注。本文讨论了摘要的定义及其分类。依据自动摘要的特点对其分类,并作为构造自动摘要系统和思考自动摘要技术发展的参考和启示。本文概述了自动摘要的发展历史和研究现状。并将现有的自动摘要方法分为三类,分别阐述了这三类方法的基本特征和研究方法,并剖析了它们的优点和不足。本文着重讨论了基于篇章结构的方法的几个不同研究方向及其局限和趋势。最后,文章讨论了自动摘要研究存在的问题,并指出自动摘要的研究趋势。 展开更多
关键词 自动摘要 方法论 计算机语言学 篇章结构
在线阅读 下载PDF
自动文本摘要方法 被引量:13
16
作者 江开忠 李子成 顾君忠 《计算机工程》 CAS CSCD 北大核心 2008年第1期221-223,共3页
自动文本是继信息检索之后信息或知识获取的一个重要步骤,对高质量的文档文摘十分重要。该文提出以句子为基本抽取单位,以位置和标题关键词为句子的加权特征,对句子基于潜语义聚类,提出语义结构的方法。同时给出了较为客观和有效的评价... 自动文本是继信息检索之后信息或知识获取的一个重要步骤,对高质量的文档文摘十分重要。该文提出以句子为基本抽取单位,以位置和标题关键词为句子的加权特征,对句子基于潜语义聚类,提出语义结构的方法。同时给出了较为客观和有效的评价方法。实验表明了该方法的有效性。 展开更多
关键词 自动文本摘要 语义结构 摘要评价
在线阅读 下载PDF
基于知识的文本摘要系统研究与实现 被引量:19
17
作者 孙春葵 李蕾 +1 位作者 杨晓兰 钟义信 《计算机研究与发展》 EI CSCD 北大核心 2000年第7期874-881,共8页
提出了一个基于知识的文摘系统模型 ,并基于这种模型实现了一个文本摘要系统 L ADIES.另外 ,还提出了一种文摘系统的评估方法 .
关键词 中文信息处理 知识 文本摘要系统
在线阅读 下载PDF
自动文摘系统评价方法的研究与实践 被引量:8
18
作者 沈洲 王永成 +1 位作者 许一震 方澈 《情报学报》 CSSCI 北大核心 2001年第1期66-72,共7页
自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的问题 ,随后综述了... 自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的问题 ,随后综述了当前国内外自动文摘的评价方法 。 展开更多
关键词 自然语言处理 自动文摘系统 评价方法 内部评价方法 外部评价方法
在线阅读 下载PDF
一种基于词共现图的文档自动摘要研究 被引量:15
19
作者 耿焕同 蔡庆生 +1 位作者 赵鹏 于琨 《情报学报》 CSSCI 北大核心 2005年第6期651-656,共6页
本文提出了一种基于词共现图的文档自动摘要算法.该算法以统计方法为基础,又利用词共现图形成的主题信息以及不同主题间的连接特征信息,旨在能够有效地生成既全面反映文档的主要内容,又不受领域限制的文档摘要;同时该方法能动态地确定... 本文提出了一种基于词共现图的文档自动摘要算法.该算法以统计方法为基础,又利用词共现图形成的主题信息以及不同主题间的连接特征信息,旨在能够有效地生成既全面反映文档的主要内容,又不受领域限制的文档摘要;同时该方法能动态地确定文档摘要长度.在实验评估中,该文档自动摘要方法取得了令人满意的摘要效果. 展开更多
关键词 自动摘要 词共现图 主题 自然语言处理
在线阅读 下载PDF
基于主题词权重和句子特征的自动文摘 被引量:17
20
作者 蒋昌金 彭宏 +1 位作者 陈建超 马千里 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第7期50-55,共6页
为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的... 为获得高质量的自动文摘,在组合词识别算法的基础上,充分考虑词的频率、词性、词的位置、词长等因素,构建了一个词语权重计算公式,该公式能使表达主题的词和短语具有较高的权重.对句子权重的计算,则考虑了句子的内容、位置以及线索词的作用和用户偏好等.摘要的生成充分考虑了候选文摘句的相似性,避免了冗余信息的加入.对摘要的评估进行了从句子粒度到词语粒度的改进,提出了一种基于词语粒度的准确率和召回率计算方法.实验证明,该算法生成的自动文摘有着较高的质量,平均准确率达到77.1%. 展开更多
关键词 主题词 自动文摘 组合词 权重计算 句子特征
在线阅读 下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部