期刊文献+
共找到94篇文章
< 1 2 5 >
每页显示 20 50 100
基于WTD-PSR数据处理与GSM-SVR模型的地铁沉降预测
1
作者 戎密仁 冯超 +5 位作者 庞银萍 罗澜鑫 袁颖 耿东阳 郑永瑞 李佳音 《隧道建设(中英文)》 北大核心 2025年第11期2033-2043,共11页
为提升地铁施工过程中周边地表沉降预测的精度与可靠性,基于某市轨道交通1号线工程数据,提出一种基于小波去噪(WTD)、相空间重构(PSR)和网格搜索优化支持向量机回归(GSM-SVR)的组合预测模型,实现地表沉降预测的精细化研究。首先,利用小... 为提升地铁施工过程中周边地表沉降预测的精度与可靠性,基于某市轨道交通1号线工程数据,提出一种基于小波去噪(WTD)、相空间重构(PSR)和网格搜索优化支持向量机回归(GSM-SVR)的组合预测模型,实现地表沉降预测的精细化研究。首先,利用小波阈值去噪法(db4函数)对原始监测数据进行预处理,有效剔除噪声和奇异值,信噪比(R_(SNR))提升至11.8144,均方根误差(E_(RMSE))降至0.37383;其次,通过相空间重构(嵌入维数m=5,延迟时间τ=1)将静态时间序列转化为多维动态特征数据,增强数据的非线性表征能力;最后,采用网格搜索法(GSM)优化SVR模型的超参数(惩罚参数c=50,核参数g=0.38),构建GSM-SVR预测模型,并采用传统SVR、PSO-SVR、GWO-SVR等6种模型进行对比分析,检验GSM-SVR模型的优劣度。结果表明:1)WTD-PSR有效地剔除了噪声和奇异值,且提升了数据多维动态特征;2)GSM-SVR模型预测结果与其他6种模型相比,预测误差(E_(MAPE)、E_(MAE)、E_(RMSE))降低了8.44%~64.35%,拟合度(R^(2))提高了0.51%~22.08%,平均误差仅3.68%;3)去噪处理使模型性能显著提升,预测误差降低了12.33%~19.70%,可对地铁施工沉降进行有效的预测。 展开更多
关键词 地铁 沉降预测 小波去噪 相空间重构 动态特征 GSM-SVR模型
在线阅读 下载PDF
一种基于向量空间模型的质谱谱库检索算法 被引量:6
2
作者 黄超 蒋学慧 +2 位作者 代丽 汪曣 赵学玒 《真空科学与技术学报》 EI CAS CSCD 北大核心 2010年第6期637-640,共4页
本文基于向量空间模型,提出了一种质谱谱库检索算法。该算法将质谱图数据向量化,并定义一个质量数向量空间,质谱图被表示成质量数空间内的一组向量,并利用向量间的相似性计算方法,实现质谱谱库的检索。并且,将(m/e)m.In作为权重进行质... 本文基于向量空间模型,提出了一种质谱谱库检索算法。该算法将质谱图数据向量化,并定义一个质量数向量空间,质谱图被表示成质量数空间内的一组向量,并利用向量间的相似性计算方法,实现质谱谱库的检索。并且,将(m/e)m.In作为权重进行质谱图相似性的计算,而不仅仅是(m/e)。通过试验,该算法的检索结果与NIST 05检索软件的检索结果一致。 展开更多
关键词 质谱 向量空间模型 库检索 算法
原文传递
基于N层向量空间模型的信息检索算法 被引量:17
3
作者 陈治平 林亚平 童调生 《计算机研究与发展》 EI CSCD 北大核心 2002年第10期1233-1237,共5页
N层向量空间模型是在传统向量空间模型的基础上提出的一种新的信息检索算法模型 ,这种模型将一篇文档从逻辑上划分为 N个相对独立的文本段 ,然后按照文本段的内容建立文本特征向量以及文本权值向量 .在此模型的基础上 ,更为精确地定义... N层向量空间模型是在传统向量空间模型的基础上提出的一种新的信息检索算法模型 ,这种模型将一篇文档从逻辑上划分为 N个相对独立的文本段 ,然后按照文本段的内容建立文本特征向量以及文本权值向量 .在此模型的基础上 ,更为精确地定义了特征值向量和相似度的计算方法 ,使之能比较好地适应文档集合的动态扩充 .理论分析和实验结果表明 。 展开更多
关键词 N层向量空间模型 信息检索算法 搜索引擎 查准率 查全率 信息资源 WWW
在线阅读 下载PDF
一种基于向量空间模型的个性化搜索引擎研究 被引量:16
4
作者 张元馨 赵仲孟 沈钧毅 《微电子学与计算机》 CSCD 北大核心 2003年第11期52-55,共4页
传统的检索模型同时被不准确不完全的查询结果和不一致的文档相关性所困扰。基于这种现状,文章提出了一种基于向量空间模型个性化搜索算法,设计了一个能够可执行个性化搜索进程,以适应不同用户需求的检索系统。最后还给出了两种实现算... 传统的检索模型同时被不准确不完全的查询结果和不一致的文档相关性所困扰。基于这种现状,文章提出了一种基于向量空间模型个性化搜索算法,设计了一个能够可执行个性化搜索进程,以适应不同用户需求的检索系统。最后还给出了两种实现算法的比较。 展开更多
关键词 向量空间模型 个性化 搜索引擎 WWW 信息检索 信息资源 数据库
在线阅读 下载PDF
利用分区和距离实现高维空间快速KNN查询 被引量:4
5
作者 梁俊杰 王长磊 《计算机研究与发展》 EI CSCD 北大核心 2007年第11期1980-1985,共6页
在高维空间KNN查询算法中,近似向量和一维转换表示法能有效克服维数灾难,结合这两种思想,提出一种基于区位码和距离的索引结构(BD)以实现快速KNN查询.根据高维空间向量分布特点,合理分区使得大量分布在空间表面的点尽可能地划分到不同... 在高维空间KNN查询算法中,近似向量和一维转换表示法能有效克服维数灾难,结合这两种思想,提出一种基于区位码和距离的索引结构(BD)以实现快速KNN查询.根据高维空间向量分布特点,合理分区使得大量分布在空间表面的点尽可能地划分到不同的分区中,提高检索剪枝效率.引入区位码概念和转换函数,将高维向量近似表示并转换为一维数值形式,组织成B+树索引.利用快速KNN查询算法,实现两层过滤,缩小搜索范围,降低树搜索代价.采用模拟数据和真实数据,大量实验验证了BD比其他同类索引具有更高的检索效率. 展开更多
关键词 高维向量空间 KNN查询 区位码 近似向量 索引结构
在线阅读 下载PDF
支持语义的P2P搜索研究 被引量:7
6
作者 王志晓 张大陆 +1 位作者 刘雷 姚传茂 《计算机工程与应用》 CSCD 北大核心 2007年第3期8-11,共4页
传统的P2P系统基于单特征词搜索,且不支持语义,有一定的局限性。向量空间模型VSM技术的应用解决了P2P系统中多特征词搜索的问题;标识符空间的分割,使相似文档在邻近的节点范围内聚集,提高了搜索的速度;语义思想的应用,使P2P系统能够理... 传统的P2P系统基于单特征词搜索,且不支持语义,有一定的局限性。向量空间模型VSM技术的应用解决了P2P系统中多特征词搜索的问题;标识符空间的分割,使相似文档在邻近的节点范围内聚集,提高了搜索的速度;语义思想的应用,使P2P系统能够理解搜索请求,有利于检索性能,特别是查全率的提高。仿真实验的结果表明:实现了多特征词的搜索;搜索收敛的速度较快;支持语义,检索性能得到了提高;节点达到了较好的负载平衡。 展开更多
关键词 对等网 语义 多特征词搜索 向量空间模型 负载平衡
在线阅读 下载PDF
文本自动分类技术及其应用 被引量:8
7
作者 方兰 王明文 《计算机与现代化》 2004年第7期25-28,共4页
综述了实现文本自动分类过程中的关键技术以及各种文本分类器,并给出了它在搜索引擎中的应用。最后对文本自动分类技术的进一步发展作了展望。
关键词 文本分类 向量空间模型 支持向量机 搜索引擎
在线阅读 下载PDF
基于本体的P2P复杂搜索 被引量:3
8
作者 王志晓 张大陆 +1 位作者 刘雷 姚传茂 《计算机应用》 CSCD 北大核心 2007年第4期780-783,共4页
传统的DHT-P2P系统有一定的局限性,如基于单特征词搜索,计算机不理解用户搜索请求的含义等。对基于本体的P2P复杂搜索进行了研究。应用向量空间模型理论去描述文档,同时对P2P标识符空间进行分割,使相似文档在邻近的节点范围内聚集,不但... 传统的DHT-P2P系统有一定的局限性,如基于单特征词搜索,计算机不理解用户搜索请求的含义等。对基于本体的P2P复杂搜索进行了研究。应用向量空间模型理论去描述文档,同时对P2P标识符空间进行分割,使相似文档在邻近的节点范围内聚集,不但解决了多特征词复杂搜索的问题,而且提高了搜索的速度。利用本体知识的帮助去理解用户的搜索请求,合理扩大搜索范围,避免搜索结果出现遗漏。实验结果表明,依据该理论构建的仿真系统实现了复杂搜索,搜索速度较快,提高了查全率,且节点达到了较好的负载平衡。 展开更多
关键词 对等网 复杂搜索 向量空间模型 本体 负载平衡
在线阅读 下载PDF
融合VSM技术的PageRank算法研究与应用 被引量:4
9
作者 李卫东 陆玲 《计算机与现代化》 2011年第7期96-98,101,104,共5页
为解决PageRank算法存在的"主题漂移"问题,本文提出一种融合VSM(向量空间模型)技术的改进方法。首先根据网页的链接结构计算PageRank值,然后建立网页的内容特征向量空间,计算主题内容相似度,最后将这两个值按一定的权重系数... 为解决PageRank算法存在的"主题漂移"问题,本文提出一种融合VSM(向量空间模型)技术的改进方法。首先根据网页的链接结构计算PageRank值,然后建立网页的内容特征向量空间,计算主题内容相似度,最后将这两个值按一定的权重系数进行融合计算,产生新的PageRank值。经过对比实验证明,改进后的PageRank算法减少了无关网页的数量,为搜索引擎提供了更好的排序结果。 展开更多
关键词 PAGERANK算法 链接分析 向量空间模型 搜索引擎
在线阅读 下载PDF
基于VSM和LSA的微博搜索排序方法研究 被引量:4
10
作者 叶施仁 严水歌 杨长春 《情报科学》 CSSCI 北大核心 2015年第7期98-101,112,共5页
为研究基于向量空间模型以及基于潜在语义分析的微博搜索排序算法,以新浪微博为例,通过建立实验系统,利用新浪微博公共开放平台提供的API获取实验数据。研究利用向量空间模型以及潜在语义分析方法,构建"索引词-博文"矩阵,对... 为研究基于向量空间模型以及基于潜在语义分析的微博搜索排序算法,以新浪微博为例,通过建立实验系统,利用新浪微博公共开放平台提供的API获取实验数据。研究利用向量空间模型以及潜在语义分析方法,构建"索引词-博文"矩阵,对博文进行分词和向量化。衡量博文和查询的相关度转化成计算博文向量和查询向量之间的相似度。使用博文向量和查询向量之间的夹角余弦值来计算它们之间的相似度。把对博文和查询的处理简化为向量空间中向量的运算。由实验得知基于潜在语义分析的微博搜索排序算法有效地提高了博文的检索效率。 展开更多
关键词 微博 向量空间模型 潜在语义分析 搜索排序
原文传递
高维空间数据索引技术研究 被引量:6
11
作者 夏宇 朱欣焰 《测绘科学》 CSCD 北大核心 2009年第1期60-62,68,共4页
目前空间数据相似性查询有着广泛的应用需求,解决相似性查询问题的一项关键技术就是高维空间数据索引。从分析高维空间数据的分布特性入手,探讨相似性查询中的高维空间数据检索问题,在此基础上,提出一种针对相似性查询的高维空间数据索... 目前空间数据相似性查询有着广泛的应用需求,解决相似性查询问题的一项关键技术就是高维空间数据索引。从分析高维空间数据的分布特性入手,探讨相似性查询中的高维空间数据检索问题,在此基础上,提出一种针对相似性查询的高维空间数据索引的分类方法,将高维空间数据索引分为三类:向量空间树型索引、基于向量近似的索引以及基于距离的索引,这种分类初步理顺了高维空间数据索引与相似性查询的关系,并以各类方法的代表性索引结构为例,分析指出各类高维索引方法的实现机理及其适应性,为相似性查询中索引技术的研究奠定了基础。 展开更多
关键词 相似性查询 向量空间 度量空间 向量近似 高维索引
原文传递
信息检索向量空间模型中特征提取的研究 被引量:13
12
作者 陶跃华 王锡钢 王云爱 《云南师范大学学报(自然科学版)》 2000年第6期18-20,共3页
介绍了向量空间模型中文档向量及查询向量的表示 ,以及索引词—文档矩阵的含义 ,在此基础上讨论了索引词权重的计算公式及选择方法 (特征提取 )。
关键词 特征提取 向量空间模型 信息检索 搜索引擎
在线阅读 下载PDF
个性化Web信息代理的研究与开发 被引量:6
13
作者 陈世平 丁山山 +1 位作者 胡成梅 游方强 《上海理工大学学报》 CAS 北大核心 2004年第6期575-579,共5页
介绍了在Web信息检索过程中通过个性化信息代理(Agent)实现个性化信息反馈的工作.提出了信息Agent模型,涉及元搜索引擎的实现和个性化偏好模型的建立,且通过主动服务代理实现个人偏好查询结果的推送.提高了在Web信息检索过程中系统随用... 介绍了在Web信息检索过程中通过个性化信息代理(Agent)实现个性化信息反馈的工作.提出了信息Agent模型,涉及元搜索引擎的实现和个性化偏好模型的建立,且通过主动服务代理实现个人偏好查询结果的推送.提高了在Web信息检索过程中系统随用户关注程度和关注领域不断变化而调整信息反馈的能力,并在此设计基础上实现了一个原型系统. 展开更多
关键词 信息AGENT 个性化检索 元搜索引擎 向量空间模型 机器学习
在线阅读 下载PDF
结构化向量空间模型及其在Web信息检索中的应用 被引量:2
14
作者 李玉鑑 操卫平 周兰珍 《北京工业大学学报》 EI CAS CSCD 北大核心 2008年第4期441-444,共4页
针对Web信息检索的特点,通过分析传统向量空间模型在Web检索中存在的若干问题,对传统向量空间模型进行改进,并提出结构化向量空间模型,其基本思想是将Web文档表达为具有一定逻辑结构的向量,即结构化向量组.每个结构化向量组由若干子向... 针对Web信息检索的特点,通过分析传统向量空间模型在Web检索中存在的若干问题,对传统向量空间模型进行改进,并提出结构化向量空间模型,其基本思想是将Web文档表达为具有一定逻辑结构的向量,即结构化向量组.每个结构化向量组由若干子向量构成,每个子向量对应Web文档中相对应独立的文本段.理论分析和实验证明,该方法能提高向量空间模型在信息检索精度和召回率方面的性能. 展开更多
关键词 向量空间模型 信息检索 相似度 搜索引擎
在线阅读 下载PDF
近似镜像网页检测算法的研究与评价 被引量:21
15
作者 王建勇 谢正茂 +1 位作者 雷鸣 李晓明 《电子学报》 EI CAS CSCD 北大核心 2000年第z1期130-132,129,共3页
当前在WWW上有众多的近似镜像web页面 ,如何快速准确地发现这些内容上相似的网页已经成为提高搜索引擎服务质量的关键技术之一 .为基于关键词匹配的搜索引擎系统提出了 5种近似镜像网页检测算法 ,并利用“天网”系统对这 5种算法进行了... 当前在WWW上有众多的近似镜像web页面 ,如何快速准确地发现这些内容上相似的网页已经成为提高搜索引擎服务质量的关键技术之一 .为基于关键词匹配的搜索引擎系统提出了 5种近似镜像网页检测算法 ,并利用“天网”系统对这 5种算法进行了实际评测 .另外还将它们与现有的方法进行了对比分析 .本文所论述的近似镜像检测算法已成功地被用于消除“天网”系统的重复网页 。 展开更多
关键词 万维网 搜索引擎 近似镜像 向量空间模型 MD5
在线阅读 下载PDF
主题搜索引擎中爬虫搜索策略的研究 被引量:15
16
作者 史宝明 贺元香 吴崇正 《计算机工程与应用》 CSCD 2014年第2期116-119,128,共5页
为了解决传统主题爬虫效率偏低的问题,传统主题爬虫会选择最有价值的链接进行访问,仅简单地计算链接的相关性,却忽视待分析URL之间的相关性关系,致使主题爬虫爬取效率较低。提出一种基于链接模型的相关性判别算法,综合利用有标种子URL... 为了解决传统主题爬虫效率偏低的问题,传统主题爬虫会选择最有价值的链接进行访问,仅简单地计算链接的相关性,却忽视待分析URL之间的相关性关系,致使主题爬虫爬取效率较低。提出一种基于链接模型的相关性判别算法,综合利用有标种子URL和无标的待判别URL实现对无标URL的相关性判别,并推导出迭代初值选取对结果的不敏感性。实验结果表明,与传统的网络爬虫算法相关性判别方法相比,提出的方法效率更高。 展开更多
关键词 网络爬虫 主题搜索引擎 搜索策略 向量空间模型
在线阅读 下载PDF
基于空间向量模型的用户建模算法改进 被引量:6
17
作者 周彩兰 王鹏 《计算机与数字工程》 2010年第2期15-17,135,共4页
建模算法属于个性化搜索引擎的范畴,而空间向量建模是表示页面特征和用户兴趣的方法之一。建模的效率的好坏直接影响到个性化搜索的准确性。文章在基于统计学的基础上对特征词频率计算的作出了适当的调整,通过引入非线性函数使得特征词... 建模算法属于个性化搜索引擎的范畴,而空间向量建模是表示页面特征和用户兴趣的方法之一。建模的效率的好坏直接影响到个性化搜索的准确性。文章在基于统计学的基础上对特征词频率计算的作出了适当的调整,通过引入非线性函数使得特征词的权重非线性增加,更加反应了词语的频率的真实性。建模算法的改进更加考虑了特征词的所在的位置,提高用户兴趣向量的准确性,改进了计算页面特征向量和用户兴趣向量的相关性,从而提高了个性化兴趣度的准确性,使个性化搜化更加符合用户的兴趣。 展开更多
关键词 个性化搜索 建模 向量空间模型
在线阅读 下载PDF
面向计算机教育资源的垂直搜索引擎系统的设计 被引量:3
18
作者 李广丽 张红斌 《情报理论与实践》 CSSCI 北大核心 2010年第5期95-98,共4页
本文详细介绍了面向计算机教育资源的垂直搜索引擎的体系结构,重点叙述了构成垂直搜索引擎的主题爬虫的爬行策略、主题相关度算法和主题词库的设计策略。实验结果表明:软件系统中Heri-trix的最大响应时间是0.563秒,查询精度和主题相关... 本文详细介绍了面向计算机教育资源的垂直搜索引擎的体系结构,重点叙述了构成垂直搜索引擎的主题爬虫的爬行策略、主题相关度算法和主题词库的设计策略。实验结果表明:软件系统中Heri-trix的最大响应时间是0.563秒,查询精度和主题相关度判别算法的精度均达到了60%以上,可以面向Web加以应用。 展开更多
关键词 计算机 教育资源 垂直搜索引擎 向量空间 模型
原文传递
基于Internet的农业信息垂直搜索引擎的设计 被引量:6
19
作者 赵洋 滕桂法 +1 位作者 张玉新 何冬梅 《河北农业大学学报》 CAS CSCD 北大核心 2009年第6期125-128,共4页
农业信息化建设的飞速发展,使得互联网上农业信息迅速增长,但由于使用通用搜索引擎检索出的信息庞杂无序,农业主题信息的获取仍十分困难。因此,搜索引擎有向专业化、领域化方向发展的趋势。本文设立了一种基于特征词匹配算法的垂直搜索... 农业信息化建设的飞速发展,使得互联网上农业信息迅速增长,但由于使用通用搜索引擎检索出的信息庞杂无序,农业主题信息的获取仍十分困难。因此,搜索引擎有向专业化、领域化方向发展的趋势。本文设立了一种基于特征词匹配算法的垂直搜索引擎设计方案,该方案通过建立农业信息特征词词典,采用向量空间模型来对网页主题进行识别,从而提高信息检索的准确率。并采用基于超级链接分析的方法,使主题相关的URL优先得到访问,提高了搜索引擎的效率。 展开更多
关键词 垂直搜索引擎 主题识别 向量空间模型 特征词
在线阅读 下载PDF
搜索引擎PageRank算法的改进 被引量:9
20
作者 杨劲松 凌培亮 《计算机工程》 CAS CSCD 北大核心 2009年第22期35-37,共3页
为了解决企业快速决策时信息检索的问题,提出一种改进的PageRank算法。在考虑网页产生时间因素的同时,通过锚文本与网页主题的相似度分析按权重分配网页各正向链接PageRank值,产生的PageRank值更贴合主题搜索引擎的要求,并保持算法的简... 为了解决企业快速决策时信息检索的问题,提出一种改进的PageRank算法。在考虑网页产生时间因素的同时,通过锚文本与网页主题的相似度分析按权重分配网页各正向链接PageRank值,产生的PageRank值更贴合主题搜索引擎的要求,并保持算法的简洁性。实验结果证明该改进算法能有效减少主题漂移现象,恰当提升新网页PageRank值。 展开更多
关键词 搜索引擎 锚文本 向量空间模型
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部