期刊文献+
共找到252篇文章
< 1 2 13 >
每页显示 20 50 100
基于Topic Maps的语义Web服务组合引擎研究 被引量:4
1
作者 周相兵 马洪江 常桂娟 《计算机应用》 CSCD 北大核心 2010年第1期162-166,174,共6页
针对Web服务组合流程控制、服务组合吞吐率等问题,提出一种基于主题图的语义Web服务组合引擎方法,通过基于本体的语义Web服务描述,并将Web服务与主题图进行抽象,用一种服务主题去表示语义Web服务,以便使用主题图的特征,而主题图可方便... 针对Web服务组合流程控制、服务组合吞吐率等问题,提出一种基于主题图的语义Web服务组合引擎方法,通过基于本体的语义Web服务描述,并将Web服务与主题图进行抽象,用一种服务主题去表示语义Web服务,以便使用主题图的特征,而主题图可方便地实现语义服务导航定位,使得Web服务所处状态可定,目标明确。因此该语义Web服务组合引擎是从UDDI注册(UDDIr)和查询能力(UDDIs),语法检测(GD)和语义识别(SI)能力,服务主题图的相似度(STS)、匹配度(STM)和适应度(STF),服务主题特征刻面分类能力(SFC),服务主题权限访问程度(STP),刻面深度判定(FDD),服务主题协同能力(STC)角度去建立;并通过数学方法进行定义。最后通过用Java编程实现实验模型表明,该方法可行且有效。 展开更多
关键词 语义web服务 主题图 web服务主题 服务组合引擎 本体
在线阅读 下载PDF
利用Topic-Group构建Web服务
2
作者 陈磊 吴海波 《滁州学院学报》 2010年第5期29-31,共3页
针对传统Web服务机制的注册集中、标注语义缺乏和自动处理困难的问题,提出了一种基于主题组(Topic-Group)的Web服务机制;以基于超节点的peer-to-peer作为网络架构,OWL-S/UDDI作为服务注册平台,用语义Web服务技术对传统的Web服务机制进... 针对传统Web服务机制的注册集中、标注语义缺乏和自动处理困难的问题,提出了一种基于主题组(Topic-Group)的Web服务机制;以基于超节点的peer-to-peer作为网络架构,OWL-S/UDDI作为服务注册平台,用语义Web服务技术对传统的Web服务机制进行了改进。研究表明,模型提高了Web服务的注册、发现和匹配的自动化处理能力。 展开更多
关键词 主题组 Peer-to—Peer web服务 OWL-S
在线阅读 下载PDF
基于Web知识本体的Topic Maps研究 被引量:1
3
作者 孔德玉 刘懿德 刘鲁 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第A01期280-283,共4页
针对复杂产品设计行业信息系统应用集成中存在的Web知识的检索、共享、集成和重用问题,研究了复杂产品设计行业中异构设计本体和异构应用本体的抽象特征,提出了一种基于知识本体与Web服务的主题图(Topic Maps)概念,构建了复杂产品设计... 针对复杂产品设计行业信息系统应用集成中存在的Web知识的检索、共享、集成和重用问题,研究了复杂产品设计行业中异构设计本体和异构应用本体的抽象特征,提出了一种基于知识本体与Web服务的主题图(Topic Maps)概念,构建了复杂产品设计行业知识本体的主题图,以复杂产品设计中的若干知识为例说明用主题图构建复杂产品知识本体库的方法.利用主题图对复杂产品设计领域的知识进行知识类型描述、信息抽取与表示,建立了复杂产品设计的本体库,实现了对知识的快速高效检索和对异构、分散知识的共享和重用. 展开更多
关键词 主题图 知识本体 web服务
在线阅读 下载PDF
一种基于LDA的Web论坛低质量回帖检测方法 被引量:4
4
作者 韩晓晖 马军 +1 位作者 邵海敏 薛冉 《计算机研究与发展》 EI CSCD 北大核心 2012年第9期1937-1946,共10页
为了过滤Web论坛中的低质量回帖,提出了一种新的基于LDA(latent Dirichlet allocation)的低质量回帖检测方法.不同于以往的方法,该方法在对回帖进行质量分类时使用了两类特征:语义特征和统计特征.提出并定义了垃圾/非重要(J/Ⅰ)主题比... 为了过滤Web论坛中的低质量回帖,提出了一种新的基于LDA(latent Dirichlet allocation)的低质量回帖检测方法.不同于以往的方法,该方法在对回帖进行质量分类时使用了两类特征:语义特征和统计特征.提出并定义了垃圾/非重要(J/Ⅰ)主题比例、主题不确定度和主题相关度3种语义特征.为克服TF·IDF方法在表示稀疏文本语义上的局限性,语义特征在LDA主题空间上计算.另外,统计特征包括浅层特征、句法特征和论坛专有特征.由于检测回帖质量可被看作二元分类问题,训练SVM分类器来区分出低质量回帖.在3个不同数据集上的实验结果表明,新方法在精确率、查全率和F1测度上均优于已知的方法. 展开更多
关键词 web论坛 主题模型 主题分布 低质量回帖 语义特征 分类
在线阅读 下载PDF
改进的PageRank在Web信息搜集中的应用 被引量:12
5
作者 秦拯 张玲 李娜 《计算机研究与发展》 EI CSCD 北大核心 2006年第6期1044-1049,共6页
PageRank是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性·但由于它对每条出链赋予相同的权值,忽略了网页与主题的相关性,容易造成主题漂移现象·在分析了几种PageRank算法基础上,提出了一种新的基于主... PageRank是一种用于网页排序的算法,它利用网页间的相互引用关系评价网页的重要性·但由于它对每条出链赋予相同的权值,忽略了网页与主题的相关性,容易造成主题漂移现象·在分析了几种PageRank算法基础上,提出了一种新的基于主题分块的PageRank算法·该算法按照网页结构对网页进行分块,依照各块与主题的相关性大小对块中的链接传递不同的PageRank值,并能根据已访问的链接对块进行相关性反馈·实验表明,所提出的算法能较好地改进搜索结果的精确度· 展开更多
关键词 PAGERANK算法 主题分块 web信息搜集
在线阅读 下载PDF
一种结合Web内容主题的会话识别及切分方法 被引量:2
6
作者 李超 谢坤武 +1 位作者 文黎明 向军 《计算机应用与软件》 CSCD 2011年第6期167-169,共3页
通过Web日志文件,识别用户及用户会话序列,然后提取会话序列所对应的Web页面内容,得到Web页面内容的核心概念,用核心概念描述会话主题,基于会话主题实现会话的切分。最后结合一个消费平台消费者的会话记录及Web内容,验证了该方法的准确性。
关键词 web日志 web主题 会话识别 会话切分
在线阅读 下载PDF
基于扩散理论的HITS算法在Web挖掘中的研究与优化 被引量:10
7
作者 马瑞新 邓贵仕 王晓 《计算机应用研究》 CSCD 北大核心 2012年第1期145-147,共3页
传统的HITS算法单纯地对网页的链接结构进行分析,忽视了页面内容分析和网页的链接增幅,导致了主题偏离和搜索精度不高的问题。针对上述问题进行研究与分析,将超链接信息检索方法与页面内容相结合,根据优先情节和增长定律,提出了一种改... 传统的HITS算法单纯地对网页的链接结构进行分析,忽视了页面内容分析和网页的链接增幅,导致了主题偏离和搜索精度不高的问题。针对上述问题进行研究与分析,将超链接信息检索方法与页面内容相结合,根据优先情节和增长定律,提出了一种改进的基于扩散理论的HITS算法。实验结果表明,与传统的HITS和SALSA算法相比,该HITS算法能够有效地限制主题偏离,提高搜索精度,具有较高的实用价值。 展开更多
关键词 HITS 网页链接增幅 主题偏离 优先情节 扩散理论
在线阅读 下载PDF
Web主题信息采集中信息主题的识别 被引量:4
8
作者 邵晓良 刘红 《现代图书情报技术》 CSSCI 北大核心 2004年第10期51-54,共4页
主要介绍了我们设计的 Web主题信息采集系统的一项核心工作—— Web信息主题的识别 ,主题识别算法从构造专业性较强的主题词典着手 ,充分分析和考虑 Web网页文本的特点 ,从而大大提高了主题信息采集的效率和精度 。
关键词 web 主题信息 主题识别 信息采集
在线阅读 下载PDF
基于主题的Web文本聚类方法 被引量:4
9
作者 张万山 肖瑶 +1 位作者 梁俊杰 余敦辉 《计算机应用》 CSCD 北大核心 2014年第11期3144-3146,3151,共4页
针对传统Web文本聚类算法没有考虑Web文本主题信息导致对多主题Web文本聚类结果准确率不高的问题,提出基于主题的Web文本聚类方法。该方法通过主题提取、特征抽取、文本聚类三个步骤实现对多主题Web文本的聚类。相对于传统的Web文本聚... 针对传统Web文本聚类算法没有考虑Web文本主题信息导致对多主题Web文本聚类结果准确率不高的问题,提出基于主题的Web文本聚类方法。该方法通过主题提取、特征抽取、文本聚类三个步骤实现对多主题Web文本的聚类。相对于传统的Web文本聚类算法,所提方法充分考虑了Web文本的主题信息。实验结果表明,对多主题Web文本聚类,所提方法的准确率比基于K-means的文本聚类方法和基于《知网》的文本聚类方法要好。 展开更多
关键词 多主题 web文本 聚类 特征词 准确率
在线阅读 下载PDF
基于本体的Web信息采集 被引量:2
10
作者 徐德智 王庆涛 王斌 《现代图书情报技术》 CSSCI 北大核心 2007年第2期53-55,共3页
将语义网技术同传统的信息检索技术相结合,给出基于本体的Web信息采集框架结构,提出利用主题本体及对应词典判断主题相关度的方法,并得出实验结果和评价。
关键词 信息采集 本体 语义网 主题相关性
在线阅读 下载PDF
改进多分类器集成AdaBoost算法的Web主题分类 被引量:2
11
作者 伍杰华 倪振声 《计算机应用与软件》 CSCD 北大核心 2013年第11期64-67,共4页
现有的Web主题分类算法一般基于单一模型构建或者仅仅把多个单一模型简单叠加进行决策。针对该问题,提出一种基于多分类器集成的改进AdaBoost算法的Web主题分类方法。算法先采用VIPS算法获取页面分块并获取其视觉特征和文本特征,根据每... 现有的Web主题分类算法一般基于单一模型构建或者仅仅把多个单一模型简单叠加进行决策。针对该问题,提出一种基于多分类器集成的改进AdaBoost算法的Web主题分类方法。算法先采用VIPS算法获取页面分块并获取其视觉特征和文本特征,根据每一类特征的维度分别训练弱分类器,然后计算其对应的错误率,修改错误判别的拒绝策略,从而针对不同特征产生相应的最优分类器,最后对两类最优分类器级联决策。实验结果表明,该方法能提高AdaBoost算法对复杂Web主题信息的分类准确率,同时也为Web主题分类领域的研究提供一种新的方案。 展开更多
关键词 web主题 ADABOOST 分类器 分类集成 特征分类 主题切分
在线阅读 下载PDF
基于群体智慧的Web访问日志会话主题识别研究 被引量:5
12
作者 方奇 刘奕群 +2 位作者 张敏 茹立云 马少平 《中文信息学报》 CSCD 北大核心 2011年第1期35-40,共6页
Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列。会话主题(topic)是指会话中具有相同用户意图的部分。从会话中进一步识别出能体现用户意图的处理单元(topic)是进行用户访问行为分析的重要基础。目前... Web访问日志中的会话(session)是指特定用户在一定时间范围内的访问行为的连续序列。会话主题(topic)是指会话中具有相同用户意图的部分。从会话中进一步识别出能体现用户意图的处理单元(topic)是进行用户访问行为分析的重要基础。目前相关工作主要集中在边界识别上,无法处理用户意图交叉情况。为了解决该问题,该文重新形式化定义了session和topic的相关概念,提出最大划分的求解任务,并设计出了基于用户群体智慧的会话主题识别算法。在使用大规模真实Web访问日志的实验中,我们的算法取得了不错的效果。 展开更多
关键词 会话主题识别 web访问日志
在线阅读 下载PDF
基于主题相关度的地理信息Web服务爬虫研究 被引量:12
13
作者 武昊 廖安平 +1 位作者 何超英 侯东阳 《地理与地理信息科学》 CSCD 北大核心 2012年第2期27-30,共4页
针对通用搜索引擎对于地理信息Web服务检索存在的不足,提出了一种基于主题相关度的服务爬虫方法,利用向量空间模型表示主题特征,通过引入特征值权重的计算方法分析页面内容与主题的相关度,过滤与主题无关的页面;并利用改进的PageRank算... 针对通用搜索引擎对于地理信息Web服务检索存在的不足,提出了一种基于主题相关度的服务爬虫方法,利用向量空间模型表示主题特征,通过引入特征值权重的计算方法分析页面内容与主题的相关度,过滤与主题无关的页面;并利用改进的PageRank算法从URL和锚文本两方面分析链接的重要性,优化爬取队列。实验表明,该方法在服务检索效率和抓取能力上都取得了良好的效果。 展开更多
关键词 地理信息web服务 服务检索 爬虫 主题相关度
在线阅读 下载PDF
基于动态主题建模的Web论坛文档摘要 被引量:8
14
作者 任昭春 马军 陈竹敏 《计算机研究与发展》 EI CSCD 北大核心 2012年第11期2359-2367,共9页
针对论坛文档由于自身特点缺乏有效的文档摘要方法的现状,提出一种基于LDA主题模型的论坛文档摘要方法.在主题建模中考虑了Web论坛文档中帖子和帖子之间的回复关系,并把主题的分布变为随文档变化而变化的一个动态过程,来解决主题的依赖... 针对论坛文档由于自身特点缺乏有效的文档摘要方法的现状,提出一种基于LDA主题模型的论坛文档摘要方法.在主题建模中考虑了Web论坛文档中帖子和帖子之间的回复关系,并把主题的分布变为随文档变化而变化的一个动态过程,来解决主题的依赖和偏移问题.在使用GibbsEM采样算法来确定动态主题模型的参数后,通过计算句子中主题权重之和来确定各个主题的重要程度;最后根据动态主题模型中主题的概率分布计算各句子的权重并得到文档的摘要.实验结果表明,新方法在各个ROUGE评测标准上均优于其他各种对比的摘要方法. 展开更多
关键词 web论坛 论坛文档摘要 主题建模 Gibbs EM采样 文档摘要
在线阅读 下载PDF
主题模型在数字图书馆Web服务中的应用 被引量:5
15
作者 王朝飞 王凯 《情报理论与实践》 CSSCI 北大核心 2010年第2期118-120,123,共4页
本文以主题模型描述数据为基础,提出了数字图书馆基于主题的Web服务理念,为数字图书馆网站设计了新的Web服务模式,也给数字图书馆网站的发展提供一种新思路。
关键词 数字图书馆 主题模型 web服务
原文传递
Web结构挖掘 被引量:20
16
作者 杨炳儒 李岩 +1 位作者 陈新中 王霞 《计算机工程》 CAS CSCD 北大核心 2003年第20期28-30,共3页
概述了Web结构挖掘的有关概念和相关应用,详细分析和比较了基于超链接结构分析的网页排序的最权威算法,提出了有关Web结构挖掘技术的几个新的研究方向,供感兴趣的同行参考。
关键词 web结构挖掘 PAGERANK HITS SALSA 超链接 网页排序
在线阅读 下载PDF
基于主题模型的结构化Web服务发现机制 被引量:7
17
作者 陈江锋 于建军 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2008年第6期734-738,共5页
提出了基于主题模型(topic model)的结构化Web服务发现机制.利用LDA(Latent Dirichlet Allocation)生成概率模型,将Web服务(Web service)建模为结构化文本文档.一个文档视作主题的概率分布,主题又由关键词的概率分布组成,从而提供基于... 提出了基于主题模型(topic model)的结构化Web服务发现机制.利用LDA(Latent Dirichlet Allocation)生成概率模型,将Web服务(Web service)建模为结构化文本文档.一个文档视作主题的概率分布,主题又由关键词的概率分布组成,从而提供基于主题的Web服务检索.同时,利用Web服务的结构化特性,将Web服务描述文档表示为有向无环图,利用n阶谱核测量Web服务文档的相似度,实现Web服务结构化信息的发现.通过实验分析对比,基于主题模型的结构化Web服务发现机制有效提高了Web服务发现的效率和精确率. 展开更多
关键词 主题模型 web服务 n阶谱核 服务发现
在线阅读 下载PDF
Web网页信息文本分类的研究 被引量:5
18
作者 李净 袁小华 沈晓晶 《计算机工程与设计》 CSCD 北大核心 2008年第23期6026-6028,共3页
面对海量的信息如何挖掘出有用的知识是当前研究的热点问题,对Web文本进行分类预处理,可在一定程度上解决此问题。针对Web文档的多主题特性,采用了多分类器模型,根据Web文档具有结构信息的特点,提出了系统的分类框架,对于短小文档采用Bo... 面对海量的信息如何挖掘出有用的知识是当前研究的热点问题,对Web文本进行分类预处理,可在一定程度上解决此问题。针对Web文档的多主题特性,采用了多分类器模型,根据Web文档具有结构信息的特点,提出了系统的分类框架,对于短小文档采用Boosting和Web文档结构Bayesian分类模型,而对于长文档采用Boosting和综合Bayesian分类模型。实验结果表明,此分类框架具有较好的分类效果。 展开更多
关键词 web文本分类 多主题 多分类器 BOOSTING算法 综合Bayesian分类法
在线阅读 下载PDF
Web图像搜索系统设计 被引量:3
19
作者 杨晓娟 孟祥增 《山东师范大学学报(自然科学版)》 CAS 2007年第1期71-72,75,共3页
Web图像是网络资源的重要组成部分,研究Web图像搜索方法对充分利用网络资源具有实践意义.提出一种面向专题领域、综合利用关键词和基于内容特征的搜索方法,以此为基础设计Web图像搜索系统,给出了系统结构和图像检索的关键算法,实现了原... Web图像是网络资源的重要组成部分,研究Web图像搜索方法对充分利用网络资源具有实践意义.提出一种面向专题领域、综合利用关键词和基于内容特征的搜索方法,以此为基础设计Web图像搜索系统,给出了系统结构和图像检索的关键算法,实现了原型实验系统.经初步实验表明,该系统在专题领域具有较高的图像检索准确率. 展开更多
关键词 web图像 专题搜索 原型系统
在线阅读 下载PDF
Inherit/Feedback:一种新的Web主题挖掘方法 被引量:4
20
作者 杨沛 郑启伦 彭宏 《计算机研究与发展》 EI CSCD 北大核心 2004年第5期807-811,共5页
经典链接分析方法 (如PageRank和HITS)更多地关注的是网页的权威度 ,而不是其主题相关度 ,所以在引导主题搜索的过程中 ,很快就发生主题漂移 为此 ,在构建主题关联拓扑模型的基础上 ,提出了Inherit/Feedback方法 ,以用于Web主题挖掘 ... 经典链接分析方法 (如PageRank和HITS)更多地关注的是网页的权威度 ,而不是其主题相关度 ,所以在引导主题搜索的过程中 ,很快就发生主题漂移 为此 ,在构建主题关联拓扑模型的基础上 ,提出了Inherit/Feedback方法 ,以用于Web主题挖掘 基本思想是 :在搜索路径上 ,一个结点继承其父辈结点的主题相关度 ,并且将其主题相关度反馈给父辈结点 同时 ,提出了基于Inherit/Feedback的主题搜索算法 (IFC) 实验结果表明 ,这种方法能有效地引导主题搜索 。 展开更多
关键词 链接分析 主题搜索 web挖掘
在线阅读 下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部