期刊文献+
共找到45篇文章
< 1 2 3 >
每页显示 20 50 100
Study on controllability of semantic accessibility scale from the internet-based system of automatic text summarization and evaluation 被引量:2
1
作者 DU Jia-li YU Ping-fang +1 位作者 ZHAO Hong-yan XU Jing 《通讯和计算机(中英文版)》 2008年第9期54-60,共7页
关键词 通信技术 计算机技术 控制方法 自动化系统
在线阅读 下载PDF
Intrinsic and Extrinsic Automatic Evaluation Strategies for Paraphrase Generation Systems
2
作者 Tulu Tilahun Hailu Junqing Yu Tessfu Geteye Fantaye 《Journal of Computer and Communications》 2020年第2期1-16,共16页
Paraphrase is an expression of a text with alternative words and orders to achieve a better clarity. Paraphrases have been found vital for augmenting training dataset, which aid to enhance performance of machine learn... Paraphrase is an expression of a text with alternative words and orders to achieve a better clarity. Paraphrases have been found vital for augmenting training dataset, which aid to enhance performance of machine learning models that intended for various natural language processing (NLP) tasks. Thus, recently, automatic paraphrase generation has received increasing attention. However, evaluating quality of generated paraphrases is technically challenging. In the literature, the importance of generated paraphrases is tended to be determined by their impact on the performance of other NLP tasks. This kind of evaluation is referred as extrinsic evaluation, which requires high computational resources to train and test the models. So far, very little attention has been paid to the role of intrinsic evaluation in which quality of generated paraphrase is judged against predefined ground truth (reference paraphrases). In fact, it is also very challenging to find ideal and complete reference paraphrases. Therefore, in this study, we propose semantic or meaning oriented automatic evaluation metric that helps to evaluate quality of generated paraphrases against the original text, which is an intrinsic evaluation approach. Further, we evaluate quality of the paraphrases by assessing their impact on other NLP tasks, which is an extrinsic evaluation method. The goal is to explore the relationship between intrinsic and extrinsic evaluation methods. To ensure the effectiveness of proposed evaluation methods, extensive experiments are done on different publicly available datasets. The experimental results demonstrate that our proposed intrinsic and extrinsic evaluation strategies are promising. The results further reveal that there is a significant correlation between intrinsic and extrinsic evaluation approaches. 展开更多
关键词 PARAPHRASE PARAPHRASE Generation natural language processing INTRINSIC EXTRINSIC automatic evaluation Word Embedding SENTIMENT Analysis
在线阅读 下载PDF
基于内部评价法的建筑施工坍塌事故致因体系的分层聚类研究
3
作者 李珏 孟娟 潘悦 《土木工程与管理学报》 2025年第4期48-55,100,共9页
研究针对中国建筑施工坍塌事故的复杂致因体系,通过分析2018—2024年203份调查报告,运用文本挖掘与自然语言处理技术,将数据划分为直接原因、间接原因、追责人员、防范措施四类。采用向量化方法构建1023维向量空间,结合分层聚类及轮廓... 研究针对中国建筑施工坍塌事故的复杂致因体系,通过分析2018—2024年203份调查报告,运用文本挖掘与自然语言处理技术,将数据划分为直接原因、间接原因、追责人员、防范措施四类。采用向量化方法构建1023维向量空间,结合分层聚类及轮廓系数、加利福特-哈拉巴斯指数和戴维森堡丁指数确定最优聚类结构,并利用扎根理论解析安全因素关联性。结果表明:二级指标间无线性相关性,而一级指标存在共现可能。其中直接原因“安全意识淡薄”(DirCau1)与防范措施“完善管理体系,强化责任落实与安全监督”(PreRec1)呈现显著统计关联,当事故直接原因为DirCau1时,对应整改措施为PreRec1的概率最高。研究结果为事故初步评估提供了快速且精准的方法论支持,加速了应急响应流程的启动,并为建筑安全管理提供了参考。 展开更多
关键词 坍塌事故 自然语言处理 分层聚类 内部评价法 线性相关性 致因体系
在线阅读 下载PDF
基于深度学习的自动文本摘要研究综述 被引量:1
4
作者 其其日力格 斯琴图 王斯日古楞 《计算机工程与应用》 北大核心 2025年第18期24-40,共17页
自动文本摘要技术是自然语言处理领域的重要研究方向,旨在实现信息的高效压缩与核心语义的保留。随着深度学习技术的快速发展,基于该技术的自动文本摘要方法逐渐成为主流。从抽取式与生成式两大技术路线出发,系统梳理了序列标注、图神... 自动文本摘要技术是自然语言处理领域的重要研究方向,旨在实现信息的高效压缩与核心语义的保留。随着深度学习技术的快速发展,基于该技术的自动文本摘要方法逐渐成为主流。从抽取式与生成式两大技术路线出发,系统梳理了序列标注、图神经网络、预训练语言模型、序列到序列模型和强化学习等技术在自动文本摘要中的应用,并分析了各类模型的优缺点;介绍了自动文本摘要领域常用的公开数据集、国内低资源语言数据集及评价指标。通过多维度实验对比分析总结了现有技术面临的问题,提出了相应的改进方案。最后,探讨了自动文本摘要的未来研究方向,为后续研究提供参考。 展开更多
关键词 自动文本摘要 深度学习 生成式摘要 抽取式摘要 自然语言处理
在线阅读 下载PDF
自然语言处理下通信网络数据自动检索方法
5
作者 陈亚峰 《长江信息通信》 2025年第6期191-193,共3页
通信网络数据中包含了大量的文本信息,这些非结构化数据具有复杂性和多样性,难以通过简单的关键词搜索准确提取有价值的信息。为此,研究自然语言处理下通信网络数据自动检索方法。设计并构建通信网络数据索引结构,该结构利用Kibana系统... 通信网络数据中包含了大量的文本信息,这些非结构化数据具有复杂性和多样性,难以通过简单的关键词搜索准确提取有价值的信息。为此,研究自然语言处理下通信网络数据自动检索方法。设计并构建通信网络数据索引结构,该结构利用Kibana系统和B树式结构,进行索引的实时更新和数据同步。针对通信网络数据中的大量文本信息,利用自然语言处理技术提取关键词。在建立了数据索引结构和提取了关键词之后,计算关键词在索引结构内的匹配度,并根据匹配度的计算结果,将最相关的数据项排在前面,以便用户能够快速找到所需信息。实验结果表明,该通信网络数据检索方法在NDCG值和查全率上均具有较高值,表现出显著优势,证明了其在通信网络数据检索中的高准确性和全面性。 展开更多
关键词 自然语言处理 通信网络数据 数据检索 自动检索 检索方法
在线阅读 下载PDF
自动文摘系统评价方法的研究与实践 被引量:8
6
作者 沈洲 王永成 +1 位作者 许一震 方澈 《情报学报》 CSSCI 北大核心 2001年第1期66-72,共7页
自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的问题 ,随后综述了... 自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的问题 ,随后综述了当前国内外自动文摘的评价方法 。 展开更多
关键词 自然语言处理 自动文摘系统 评价方法 内部评价方法 外部评价方法
在线阅读 下载PDF
一种基于词共现图的文档自动摘要研究 被引量:15
7
作者 耿焕同 蔡庆生 +1 位作者 赵鹏 于琨 《情报学报》 CSSCI 北大核心 2005年第6期651-656,共6页
本文提出了一种基于词共现图的文档自动摘要算法.该算法以统计方法为基础,又利用词共现图形成的主题信息以及不同主题间的连接特征信息,旨在能够有效地生成既全面反映文档的主要内容,又不受领域限制的文档摘要;同时该方法能动态地确定... 本文提出了一种基于词共现图的文档自动摘要算法.该算法以统计方法为基础,又利用词共现图形成的主题信息以及不同主题间的连接特征信息,旨在能够有效地生成既全面反映文档的主要内容,又不受领域限制的文档摘要;同时该方法能动态地确定文档摘要长度.在实验评估中,该文档自动摘要方法取得了令人满意的摘要效果. 展开更多
关键词 自动摘要 词共现图 主题 自然语言处理
在线阅读 下载PDF
自动文摘评价方法综述 被引量:12
8
作者 张瑾 王小磊 许洪波 《中文信息学报》 CSCD 北大核心 2008年第3期81-88,共8页
评价是自动文摘领域长期关注的焦点,对自动文摘技术的发展起着积极的促进作用。本文首先介绍了自动文摘评价方法的应用背景和面临的困难;然后对自动文摘评价方法进行了简单介绍和评价;接着在了解国内外研究现状的基础上详细分析了文摘... 评价是自动文摘领域长期关注的焦点,对自动文摘技术的发展起着积极的促进作用。本文首先介绍了自动文摘评价方法的应用背景和面临的困难;然后对自动文摘评价方法进行了简单介绍和评价;接着在了解国内外研究现状的基础上详细分析了文摘评价方法的关键技术;最后对自动文摘评价方法未来的发展趋势进行了展望。 展开更多
关键词 计算机应用 中文信息处理 文本挖掘 自动文摘 自然语言处理 多文档文摘 文摘评价方法
在线阅读 下载PDF
一种基于文章主题和内容的自动摘要方法 被引量:12
9
作者 陈燕敏 王晓龙 +1 位作者 刘远超 楼喜中 《计算机工程与应用》 CSCD 北大核心 2004年第33期11-14,共4页
文章介绍了一种新的使用自然语言处理技术的自动系统。通过融合基于内容的方法和基于主题的方法,将主题与内容相结合,生成具有良好连贯性和流畅性的。该方法首先对主题词进行分析,动态地处理具有抽象标题和具体标题的文档;然后采用词汇... 文章介绍了一种新的使用自然语言处理技术的自动系统。通过融合基于内容的方法和基于主题的方法,将主题与内容相结合,生成具有良好连贯性和流畅性的。该方法首先对主题词进行分析,动态地处理具有抽象标题和具体标题的文档;然后采用词汇、语法、语义分析等自然语言处理技术,对文章的文本内容进行深入分析;再根据线性加权融合两种分析得到的结果,生成;最后采用指代消解技术使生成的更连贯流畅。与仅基于内容的自动文摘系统相比较,评测结果显示,该系统生成的质量有明显提高。 展开更多
关键词 自动文摘 自然语言处理 主题分析 内容分析 融合
在线阅读 下载PDF
一种主题句发现的中文自动文摘研究 被引量:8
10
作者 王萌 李春贵 +1 位作者 唐培和 王晓荣 《计算机工程》 CAS CSCD 北大核心 2007年第8期180-181,189,共3页
提出了一种基于主题句发现的中文自动文摘方法。该方法使用术语代替传统的词语作为最小语义单位,采用术语长度术语频率方法进行术语权重计算,获得特征词。利用一种改进的k-means聚类算法进行句子聚类,根据聚类结果进行主题句发现。实验... 提出了一种基于主题句发现的中文自动文摘方法。该方法使用术语代替传统的词语作为最小语义单位,采用术语长度术语频率方法进行术语权重计算,获得特征词。利用一种改进的k-means聚类算法进行句子聚类,根据聚类结果进行主题句发现。实验表明,该算法所得到的文摘,在各项指标上优于传统的文摘。 展开更多
关键词 主题句发现 自动文摘 句子聚类 自然语言处理
在线阅读 下载PDF
一种面向新闻文献的自动摘要系统的研究与实践 被引量:3
11
作者 沈洲 王永成 +1 位作者 许一震 吴芳芳 《计算机工程》 CAS CSCD 北大核心 2000年第9期70-72,共3页
主要介绍了一种面向新闻文献的自动摘要系统的研究与实践.阐述了面向新闻文献的自动摘要原理,在建立新闻文献主题提取规则库过程中的几点体会,又简要地介绍了系统的流程,最后给出了对该系统进行大规模黑箱测试的结果.评测结果显示... 主要介绍了一种面向新闻文献的自动摘要系统的研究与实践.阐述了面向新闻文献的自动摘要原理,在建立新闻文献主题提取规则库过程中的几点体会,又简要地介绍了系统的流程,最后给出了对该系统进行大规模黑箱测试的结果.评测结果显示该系统已经基本成熟,可以用于实际应用中. 展开更多
关键词 自然语言处理 自动摘要系统 新闻文献
在线阅读 下载PDF
基于统计语义和结构特征的自动文摘 被引量:8
12
作者 黄丽琼 何中市 《广西师范大学学报(自然科学版)》 CAS 北大核心 2006年第4期187-190,共4页
在分析自动文摘现有方法优缺点的基础上,提出了一种基于统计、语义和结构特征的自动文摘方法。用这些特征构成句子向量表示,并用机器学习的方法对其进行训练得到器,从而把自动文摘转换为分类问题。实验表明,该方法具有较好的重合率。同... 在分析自动文摘现有方法优缺点的基础上,提出了一种基于统计、语义和结构特征的自动文摘方法。用这些特征构成句子向量表示,并用机器学习的方法对其进行训练得到器,从而把自动文摘转换为分类问题。实验表明,该方法具有较好的重合率。同时,为了解决文摘的冗余和不连贯缺点,进行了一系列的后期处理,提高了文摘的质量。 展开更多
关键词 机器学习 自动文摘 句子相似度 自然语言处理
在线阅读 下载PDF
一种基于LDA的CRF自动文摘方法 被引量:13
13
作者 吴晓锋 宗成庆 《中文信息学报》 CSCD 北大核心 2009年第6期39-45,共7页
浅层狄利赫雷分配(Latent Dirichlet Allocation,LDA)方法近年来被广泛应用于文本聚类、分类、段落切分等等,并且也有人将其应用于基于提问的无监督的多文档自动摘要。该方法被认为能较好地对文本进行浅层语义建模。该文在前人工作基础... 浅层狄利赫雷分配(Latent Dirichlet Allocation,LDA)方法近年来被广泛应用于文本聚类、分类、段落切分等等,并且也有人将其应用于基于提问的无监督的多文档自动摘要。该方法被认为能较好地对文本进行浅层语义建模。该文在前人工作基础上提出了基于LDA的条件随机场(Conditional Random Field,CRF)自动文摘(LCAS)方法,研究了LDA在有监督的单文档自动文摘中的作用,提出了将LDA提取的主题(Topic)作为特征加入CRF模型中进行训练的方法,并分析研究了在不同Topic下LDA对摘要结果的影响。实验结果表明,加入LDA特征后,能够有效地提高以传统特征为输入的CRF文摘系统的质量。 展开更多
关键词 计算机应用 中文信息处理 自然语言处理 自动文摘 狄利赫雷分布 条件随机场
在线阅读 下载PDF
基于深度学习的文本自动摘要方案 被引量:11
14
作者 张克君 李伟男 +2 位作者 钱榕 史泰猛 焦萌 《计算机应用》 CSCD 北大核心 2019年第2期311-315,共5页
针对自然语言处理(NLP)生成式自动摘要领域的语义理解不充分、摘要语句不通顺和摘要准确度不够高的问题,提出了一种新的生成式自动摘要解决方案,包括一种改进的词向量生成技术和一个生成式自动摘要模型。改进的词向量生成技术以Skip-Gra... 针对自然语言处理(NLP)生成式自动摘要领域的语义理解不充分、摘要语句不通顺和摘要准确度不够高的问题,提出了一种新的生成式自动摘要解决方案,包括一种改进的词向量生成技术和一个生成式自动摘要模型。改进的词向量生成技术以Skip-Gram方法生成的词向量为基础,结合摘要的特点,引入词性、词频和逆文本频率三个词特征,有效地提高了词语的理解;而提出的Bi-MulRnn+生成式自动摘要模型以序列映射(seq2seq)与自编码器结构为基础,引入注意力机制、门控循环单元(GRU)结构、双向循环神经网络(BiRnn)、多层循环神经网络(MultiRnn)和集束搜索,提高了生成式摘要准确性与语句流畅度。基于大规模中文短文本摘要(LCSTS)数据集的实验结果表明,该方案能够有效地解决短文本生成式摘要问题,并在Rouge标准评价体系中表现良好,提高了摘要准确性与语句流畅度。 展开更多
关键词 自然语言处理 生成式文本自动摘要 序列映射 自编码器 词向量 循环神经网络
在线阅读 下载PDF
一种基于主题敏感辞分析的新闻文献自动摘要系统的研究与实践 被引量:2
15
作者 沈洲 王永成 韩客松 《高技术通讯》 EI CAS CSCD 2001年第9期28-32,共5页
介绍了一种基于主题敏感辞分析的新闻文献自动摘要系统的研究与实践。首先阐述了主题敏感辞分析的心理语言学基础 ,然后详细介绍了系统中的主题敏感辞的获取、敏感辞修饰关系分析、敏感辞同现关系分析等步骤 ,最后给出了该系统与原有摘... 介绍了一种基于主题敏感辞分析的新闻文献自动摘要系统的研究与实践。首先阐述了主题敏感辞分析的心理语言学基础 ,然后详细介绍了系统中的主题敏感辞的获取、敏感辞修饰关系分析、敏感辞同现关系分析等步骤 ,最后给出了该系统与原有摘要系统评价测试对比结果。评测结果显示 。 展开更多
关键词 自然语言处理 主题敏感辞分析 自动摘要系统 心理语言学 网络新闻 电子信息
在线阅读 下载PDF
自动引文摘要研究述评 被引量:3
16
作者 刘天祎 步一 +1 位作者 赵丹群 黄文彬 《现代图书情报技术》 CSSCI 2016年第5期1-8,共8页
【目的】对引文摘要领域的国外主流研究方法和步骤进行综述分析。【文献范围】选取2007年以来引文摘要领域的重要研究及此前自动摘要、引文分析领域的研究进展。【方法】基于文献调研,介绍该领域的基本概念以及自然语言处理的方法在引... 【目的】对引文摘要领域的国外主流研究方法和步骤进行综述分析。【文献范围】选取2007年以来引文摘要领域的重要研究及此前自动摘要、引文分析领域的研究进展。【方法】基于文献调研,介绍该领域的基本概念以及自然语言处理的方法在引文摘要中的应用。【结果】引文句在摘要实践中起到重要的概括作用、指示作用和关联作用,具有一定的优越性。【局限】缺乏对引文摘要领域现有成果和可能达成的理想情况的比较。【结论】引文摘要拓展了自动摘要和传统的信息计量学的研究方向,并对改进自动摘要原有的评估方案提出要求,同时产生了有关引文窗口扩展、语料库构建等一系列新问题。本文对这些问题进行探讨,并对引文摘要未来的研究发展进行展望。 展开更多
关键词 自动摘要 引文摘要 引文句 自然语言处理
原文传递
基于Siamese LSTM的中文多文档自动文摘模型 被引量:3
17
作者 龚永罡 王嘉欣 +1 位作者 廉小亲 裴晨晨 《计算机应用与软件》 北大核心 2021年第3期287-290,326,共5页
在文本信息数量迅速增长的环境下,为提升阅读效率,提出一种基于深度学习的多文档自动文本摘要模型。在传统文摘模型的基础上将Siamese LSTM深度学习网络应用到文本相似度计算中,计算曼哈顿距离来表征文本相似度,并采用去除停用词的方法... 在文本信息数量迅速增长的环境下,为提升阅读效率,提出一种基于深度学习的多文档自动文本摘要模型。在传统文摘模型的基础上将Siamese LSTM深度学习网络应用到文本相似度计算中,计算曼哈顿距离来表征文本相似度,并采用去除停用词的方法改进该网络模型以提升计算效率。实验结果表明,使用Siamese LSTM与传统余弦相似度等方法相比,生成的文摘在语义方面更贴近主题,质量更高,整个文摘系统的工作效率也显著提升。 展开更多
关键词 中文自动文摘 Siamese LSTM 自然语言处理 深度学习
在线阅读 下载PDF
基于认知心理学模型的自动文本摘要生成技术 被引量:1
18
作者 马汉华 邵志清 过弋 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第6期886-891,共6页
自动文本摘要生成(ATS)与计算机科学和认知心理学密切相关。提出了一个自动文本摘要生成系统(EI-ATS)。该系统借助句法和词法分析,将认知心理学中的事件-索引(Event-indexing)模型运用到自动文本摘要生成。评价结果表明:该系统在多文件... 自动文本摘要生成(ATS)与计算机科学和认知心理学密切相关。提出了一个自动文本摘要生成系统(EI-ATS)。该系统借助句法和词法分析,将认知心理学中的事件-索引(Event-indexing)模型运用到自动文本摘要生成。评价结果表明:该系统在多文件摘要生成方面表现良好,成为整合两个相异但相关领域知识的研究范例。 展开更多
关键词 自然语言处理 自动文本生成
在线阅读 下载PDF
基于选择倾向性的词汇获取方法 被引量:1
19
作者 王大亮 蒋宏潮 +2 位作者 涂序彦 郑雪峰 佟子健 《计算机工程》 CAS CSCD 北大核心 2008年第12期169-171,共3页
通过分析几种统计评价方法发现,互信息法可用于衡量二元独立性,淘汰机会二元组;χ2检验能更合理地评价词汇组合的选择倾向性,获取频繁二元组发现;对数似然比检验可以有效获取稀疏二元组,弥补其他方法无法克服的稀疏数据问题。将互信息、... 通过分析几种统计评价方法发现,互信息法可用于衡量二元独立性,淘汰机会二元组;χ2检验能更合理地评价词汇组合的选择倾向性,获取频繁二元组发现;对数似然比检验可以有效获取稀疏二元组,弥补其他方法无法克服的稀疏数据问题。将互信息、χ2检验、对数似然比检验组合,并加入词汇子范畴框架的启发式规则,提出一个层次分明的综合多种统计评价方法的词汇获取方法。 展开更多
关键词 自然语言处理 词汇获取 新词发现 选择倾向性 统计评价方法
在线阅读 下载PDF
多文档自动摘要方法的进展研究 被引量:5
20
作者 黄文彬 倪少康 《情报科学》 CSSCI 北大核心 2017年第4期160-165,共6页
【目的/意义】多文档自动摘要技术的目的是从一组文档中精炼出重要信息摘要,减轻用户从文档中获取与理解信息的负担,是自然语言理解领域的重要研究方向之一。【方法/过程】本文提取十五年内的多文档自动摘要研究文献并筛选出至少50篇关... 【目的/意义】多文档自动摘要技术的目的是从一组文档中精炼出重要信息摘要,减轻用户从文档中获取与理解信息的负担,是自然语言理解领域的重要研究方向之一。【方法/过程】本文提取十五年内的多文档自动摘要研究文献并筛选出至少50篇关键影响文章,梳理多文档自动摘要的概念与研究进展,揭示了最新的技术实现与实践情况。【结果/结论】基于不同技术方法对单词、句子或段落作为主要数据处理对象,找出多文档自动摘要的技术特征与难点,明确该领域的发展趋势,为未来的研究奠定了基础。 展开更多
关键词 自动摘要 多文档处理 自然语言处理
原文传递
上一页 1 2 3 下一页 到第
使用帮助 返回顶部