期刊文献+
共找到79篇文章
< 1 2 4 >
每页显示 20 50 100
一种基于词共现图的文档自动摘要研究 被引量:15
1
作者 耿焕同 蔡庆生 +1 位作者 赵鹏 于琨 《情报学报》 CSSCI 北大核心 2005年第6期651-656,共6页
本文提出了一种基于词共现图的文档自动摘要算法.该算法以统计方法为基础,又利用词共现图形成的主题信息以及不同主题间的连接特征信息,旨在能够有效地生成既全面反映文档的主要内容,又不受领域限制的文档摘要;同时该方法能动态地确定... 本文提出了一种基于词共现图的文档自动摘要算法.该算法以统计方法为基础,又利用词共现图形成的主题信息以及不同主题间的连接特征信息,旨在能够有效地生成既全面反映文档的主要内容,又不受领域限制的文档摘要;同时该方法能动态地确定文档摘要长度.在实验评估中,该文档自动摘要方法取得了令人满意的摘要效果. 展开更多
关键词 自动摘要 词共现图 主题 自然语言处理
在线阅读 下载PDF
基于潜在语义索引的文本摘要方法 被引量:17
2
作者 林鸿飞 高仁璟 《大连理工大学学报》 CAS CSCD 北大核心 2001年第6期744-748,共5页
因特网上的在线文本自动编制摘要可以帮助用户有选择地阅读 .给出了基于潜在语义索引的文本摘要方法 .它采用向量空间模型作为文本表示方法 ,利用潜在语义索引来减少词汇间的“斜交”现象 ,在语义空间上进行项、句子、段落与文本之间的... 因特网上的在线文本自动编制摘要可以帮助用户有选择地阅读 .给出了基于潜在语义索引的文本摘要方法 .它采用向量空间模型作为文本表示方法 ,利用潜在语义索引来减少词汇间的“斜交”现象 ,在语义空间上进行项、句子、段落与文本之间的相似度计算 ,而不是单纯地依赖于特征项的频率信息 .依据对于文本主题的表现能力来确定摘要的各个组成部分及其组成方式 .此外 ,给出了文本摘要的评估方法 . 展开更多
关键词 人工智能 语义信息 文本摘要 潜在语义索引 微量空间模型 特征抽取 摘要评价 因特网
在线阅读 下载PDF
基于信息抽取和文本生成的自动文摘系统设计 被引量:13
3
作者 刘挺 吴岩 王开铸 《情报学报》 CSSCI 北大核心 1997年第S1期31-36,共6页
本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文... 本文提出了一种自动文摘系统的设计方案,该方案将文摘过程分解为信息抽取和文本生成两个子过程。信息抽取过程对原文进行词语频率、词语分布和修辞结构的分析,并在此基础上参考用户对摘要的需求,抽取原文的部分内容填写文摘框架。文本生成过程对文摘框架中的句子进行加工、组织。 展开更多
关键词 自动文摘 信息抽取 文本生成
在线阅读 下载PDF
自动文摘的四种主要方法 被引量:55
4
作者 刘挺 王开铸 《情报学报》 CSSCI 北大核心 1999年第1期10-19,共10页
本文将现有的自动文摘方法概括为四种:自动摘录、基于理解的自动文摘、信息抽取和基于结构的自动文摘,并详细介绍了这四种方法的基本原理,剖析了它们的优点和不足。最后,概述了中文自动文摘的研究状况。
关键词 自然语言处理 情报科学 自动文摘
在线阅读 下载PDF
全信息理论在自动文摘系统中的应用 被引量:13
5
作者 李蕾 钟义信 郭祥昊 《计算机工程与应用》 CSCD 北大核心 2000年第1期4-7,共4页
该文介绍了全信息理论提出的背景及其主要内容,并将其应用到一种智能业务──自动文摘系统中,设计实现了一个基于理解的、面向神经网络学习算法领域的中文9动文摘系统 Ladies。该系统综合利用语法信息和语义信息来理解原文的... 该文介绍了全信息理论提出的背景及其主要内容,并将其应用到一种智能业务──自动文摘系统中,设计实现了一个基于理解的、面向神经网络学习算法领域的中文9动文摘系统 Ladies。该系统综合利用语法信息和语义信息来理解原文的句法和含义,并通过语用信息制导,对原文进行文摘信息的过滤、提取和生成高质量的文摘。实验结果证明,这一方法是行之有效的。 展开更多
关键词 自动文摘系统 全信息理论 神经网络
在线阅读 下载PDF
OA中文文献自动摘要系统 被引量:26
6
作者 王永成 许慧敏 《情报学报》 CSSCI 北大核心 1997年第2期128-132,共5页
本文概括地介绍了研究与开发中文文献自动摘要系统的必要性、突破口的选择、发展进化的简史。
关键词 中文文献 自动摘要系统 计算机应用 文摘
在线阅读 下载PDF
基于控制词集的中文信息动态自动聚类研究 被引量:4
7
作者 马张华 陈文广 +3 位作者 金海燕 朱剑俊 崔会娟 刘贞君 《大学图书馆学报》 CSSCI 北大核心 2006年第6期54-60,共7页
以专用词典为切分工具,建立以概念为基础的、具有主题分类特点的类目结构是中文信息动态自动聚类的一种适用方式。该文探索了基于控制词集的中文信息动态自动聚类技术,包括专用控制词集的构建,动态有限环境下的自动聚类程序、聚类算法,... 以专用词典为切分工具,建立以概念为基础的、具有主题分类特点的类目结构是中文信息动态自动聚类的一种适用方式。该文探索了基于控制词集的中文信息动态自动聚类技术,包括专用控制词集的构建,动态有限环境下的自动聚类程序、聚类算法,以及结合控制词集对聚类结果进行优化控制等,最后对实验结果给出了概要评价。 展开更多
关键词 动态自动聚类 中文自动分类 专用切分词典 词汇控制
在线阅读 下载PDF
自动文摘综述 被引量:10
8
作者 刘挺 吴岩 王开铸 《情报科学》 CSSCI 1998年第1期63-69,共7页
本文回顾了自动文摘技术的发展历史,介绍了三种主要的文摘方法,即基于文本物理信息分析的方法、基于自然语言理解的方法以及基于文本结构分析的方法。同时指出了自动文摘技术目前存在的问题,包括摘要内容冗余的问题、摘要的语言缺乏连... 本文回顾了自动文摘技术的发展历史,介绍了三种主要的文摘方法,即基于文本物理信息分析的方法、基于自然语言理解的方法以及基于文本结构分析的方法。同时指出了自动文摘技术目前存在的问题,包括摘要内容冗余的问题、摘要的语言缺乏连贯性的问题等,并探讨了文摘技术未来的发展方向。 展开更多
关键词 情报科学 自然语言处理 自动文摘 文摘 计算机
在线阅读 下载PDF
HIT-97Ⅰ型英文自动文摘系统 被引量:14
9
作者 吴岩 李秀坤 王开铸 《情报学报》 CSSCI 北大核心 1998年第5期358-364,共7页
本文介绍了HIT—97Ⅰ型英文自动文摘系统,给出了该系统的设计思想和控制结构。然后叙述了本系统的处理步骤,即词频统计、词类标记、意义段划分、确定关键词、关键句提取、关键句压缩、文摘结果生成。
关键词 机械文摘 自动文摘系统 HIT-971型 英文
在线阅读 下载PDF
基于篇章理解的自动文摘研究 被引量:12
10
作者 王建波 杜春玲 王开铸 《中文信息学报》 CSCD 1995年第3期33-42,共10页
本文在自然语言理解的基础上,对自动文摘系统进行研究。研究在两级上进行,一级是基于中心名词,中心动词同其修饰成分间关系研究,实现句子成分过滤,完成句子主干提取。一级是上下文级,基于篇章文体结构,句子语义关联,分别实现摘... 本文在自然语言理解的基础上,对自动文摘系统进行研究。研究在两级上进行,一级是基于中心名词,中心动词同其修饰成分间关系研究,实现句子成分过滤,完成句子主干提取。一级是上下文级,基于篇章文体结构,句子语义关联,分别实现摘要基集产生算法,摘要基集扩充算法及摘要集合生成算法。摘要基集的产生依赖于中心段,中心句选取,摘要基集扩充和摘要集合产生依赖于模糊语义距离的测试。 展开更多
关键词 自然语言理解 自动文摘 信息处理 篇章理解
在线阅读 下载PDF
面向特定领域的理解型中文自动文摘系统 被引量:14
11
作者 李蕾 钟义信 郭祥昊 《计算机研究与发展》 EI CSCD 北大核心 2000年第4期493-497,共5页
自动文摘是计算机通信网提供智能业务的关键技术之一 .介绍了一个面向特定领域——神经网络学习算法的理解型中文自动文摘系统 .与其他文摘系统相比 ,该系统首次采用了基于全信息模型的自然语言理解理论 ,通过设计义块组配的方法避开了... 自动文摘是计算机通信网提供智能业务的关键技术之一 .介绍了一个面向特定领域——神经网络学习算法的理解型中文自动文摘系统 .与其他文摘系统相比 ,该系统首次采用了基于全信息模型的自然语言理解理论 ,通过设计义块组配的方法避开了传统的语法语义分析系统所遇到的各种难题 ,并通过语用信息制导 ,将语句理解与文摘信息提取直接相连 ,大大提高了理解的效率和文摘生成的速度 .测试结果表明该系统的整套方法是行之有效的 . 展开更多
关键词 中文自动文摘系统 计算机通信网 全信息词典
在线阅读 下载PDF
查询优化与动态自动聚类系统 被引量:7
12
作者 马张华 陈文广 《大学图书馆学报》 CSSCI 北大核心 2005年第3期34-40,共7页
查询优化在大型检索系统中是十分必要的。查询优化包括静态形式、结合词集的形式和动态自动聚类形式。文章概要分析了AlltheWeb、Teoma、Vivisimo、GuideBeam等动态自动聚类的特点和机制,并提出了建立动态自动聚类系统的一些建议。
关键词 自动聚类 动态 优化 查询 检索系统
在线阅读 下载PDF
基于篇章多级依存结构的自动文摘研究 被引量:7
13
作者 刘挺 王开铸 《计算机研究与发展》 EI CSCD 北大核心 1999年第4期479-488,共10页
自动文摘是自然语言处理领域的一项重要的研究内容,其研究目的是探索人类从自然语言篇章中获取信息,提炼信息的思维机制,并在此基础上开发出能够自动编写文献摘要的软件,从而提高信息检索、传播的效率.文中提出了一种基于篇章多级... 自动文摘是自然语言处理领域的一项重要的研究内容,其研究目的是探索人类从自然语言篇章中获取信息,提炼信息的思维机制,并在此基础上开发出能够自动编写文献摘要的软件,从而提高信息检索、传播的效率.文中提出了一种基于篇章多级依存结构的自动文摘方法,这种方法既克服了机械文摘的表层性,又克服了理解文摘的领域局限性.文中给出了篇章多级依存结构的形式化描述,证明了篇章多级依存结构具有非常适合于自动文摘的优点,给出了如何识别、化简篇章结构,如何从压缩了的篇章结构中生成摘要的方法.实验结果达到了预期的效果,验证了该方法的可行性。 展开更多
关键词 自然语言处理 自动文摘 篇章结构 计算机
在线阅读 下载PDF
自动摘要方法综述 被引量:9
14
作者 谭翀 陈跃新 《情报学报》 CSSCI 北大核心 2008年第1期62-68,共7页
自动摘要是计算机语言学领域的一个研究重点,自动摘要的研究和应用受到了计算机学、语言学、认知心理学等相关学科的广泛关注。本文讨论了摘要的定义及其分类。依据自动摘要的特点对其分类,并作为构造自动摘要系统和思考自动摘要技术... 自动摘要是计算机语言学领域的一个研究重点,自动摘要的研究和应用受到了计算机学、语言学、认知心理学等相关学科的广泛关注。本文讨论了摘要的定义及其分类。依据自动摘要的特点对其分类,并作为构造自动摘要系统和思考自动摘要技术发展的参考和启示。本文概述了自动摘要的发展历史和研究现状。并将现有的自动摘要方法分为三类,分别阐述了这三类方法的基本特征和研究方法,并剖析了它们的优点和不足。本文着重讨论了基于篇章结构的方法的几个不同研究方向及其局限和趋势。最后,文章讨论了自动摘要研究存在的问题,并指出自动摘要的研究趋势。 展开更多
关键词 自动摘要 方法论 计算机语言学 篇章结构
在线阅读 下载PDF
中文文献摘要的自动编制 被引量:15
15
作者 莫燕 王永成 《现代图书情报技术》 CSSCI 北大核心 1993年第3期10-12,共3页
本文简要地介绍了对自动编制中文科技文献文摘系统的改进和对其应用领域的扩充 ,以形成中文文献摘要的自动编制系统 ,并着重介绍了自动编制主题词词典、自动选取摘要句以及自动形成中文文献摘要的基本设计思想。
关键词 文摘 自动编文摘 关键词 类主题词
在线阅读 下载PDF
字串去重的快速算法研究 被引量:4
16
作者 陈桂林 王永成 《情报学报》 CSSCI 北大核心 2000年第3期254-258,共5页
针对文本处理中的字串去重问题 ,本文提出了四种有效的快速算法 ,其平均时间复杂度为O(nlogn) ,空间复杂度为O(n)。其中利用首字hash方法的去重算法比直接利用快速排序算法具有更好的性能 ,其思想可用于改进快速排序算法。
关键词 字串去重 文本处理 快速排序 时间复杂度 空间复杂度 首字HASH方法 去重算法
在线阅读 下载PDF
中文自动文摘系统CAAS的研究与实现 被引量:2
17
作者 刘挺 吴岩 王开铸 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 1999年第6期59-62,共4页
介绍了一种中文自动文摘系统;该系统在高精度的汉语自动分词、关键词自动抽取等算法的基础上,引入了文本结构的统计分析和句间指代关系的识别等技术,使得生成的摘要更加准确、全面、连贯. 该系统适用于科技文献、政论文、公文等实... 介绍了一种中文自动文摘系统;该系统在高精度的汉语自动分词、关键词自动抽取等算法的基础上,引入了文本结构的统计分析和句间指代关系的识别等技术,使得生成的摘要更加准确、全面、连贯. 该系统适用于科技文献、政论文、公文等实用文体的摘要生成. 展开更多
关键词 中文信息处理 应用软件 自动文摘 CAAS 自动分词
在线阅读 下载PDF
英文文献自动摘要系统研究 被引量:4
18
作者 史磊 王永成 《情报学报》 CSSCI 北大核心 1999年第6期504-508,共5页
信息爆炸和Internet的迅速普及 ,使得英文文献摘要的自动编制工作越来越重要。本文对英文文献自动摘要系统的结构进行了研究 ,介绍了该系统的体系结构、主要构成、设计思想及其基本原理。
关键词 英文文献 自动摘要 仿人算法 摘要系统
在线阅读 下载PDF
利用语料库技术的中文自动文摘系统 被引量:4
19
作者 姜贤塔 陈根才 《中文信息学报》 CSCD 北大核心 1999年第2期16-23,共8页
本文着重介绍利用“后邻字符树”的方法在领域语料库中生成字符树库,用于自动文摘候选句子选取时提高精度,介绍了后邻字符树的构造。
关键词 字符树 字频统计 语料库 自动文摘系统 中文
在线阅读 下载PDF
基于全信息词典的自动文摘系统研究与实现 被引量:3
20
作者 杨晓兰 钟义信 《情报学报》 CSSCI 北大核心 1997年第6期408-414,共7页
本文根据文摘与文本结构的关系,提出了一个以文摘框架为核心的文摘系统模型。系统的运行是建立在一部对词语进行了语法、语义、语用三个层面描写的全信息词典的基础上。文本分析器在其作用下,能有效地对与文摘有关的文本部分进行分析... 本文根据文摘与文本结构的关系,提出了一个以文摘框架为核心的文摘系统模型。系统的运行是建立在一部对词语进行了语法、语义、语用三个层面描写的全信息词典的基础上。文本分析器在其作用下,能有效地对与文摘有关的文本部分进行分析,填充预定的文摘框架,最后生成风格一致的文摘。基于上述理论的研究,设计并实现了计算机病毒领域的自动文摘实验系统,其效果较为理想。 展开更多
关键词 自动文摘 文摘框架 全信息词典 文本分析器
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部