期刊文献+
共找到407篇文章
< 1 2 21 >
每页显示 20 50 100
基于Deep Web Search技术的主题式爬虫模块研究与设计
1
作者 孟敬 刘寿强 《科技导报》 CAS CSCD 北大核心 2011年第21期31-35,共5页
随着Web技术的飞速发展,海量数据的管理与搜索变得尤为重要。海量信息的异构性和动态性特点要求信息集成需要Web爬虫来自动获取这些页面,以便进一步处理数据。而一些企业内部的资料既要保密又要供不同的内部职员使用,这种既开放又保守... 随着Web技术的飞速发展,海量数据的管理与搜索变得尤为重要。海量信息的异构性和动态性特点要求信息集成需要Web爬虫来自动获取这些页面,以便进一步处理数据。而一些企业内部的资料既要保密又要供不同的内部职员使用,这种既开放又保守的特点成为企业发展的瓶颈。为了帮助用户完成这样的任务,本文改变传统的资源共享形式,为企业提供了一个高效便利保密的资源共享管理平台--企业搜索引擎(ESE),提出了一种基于主题式爬虫的Deep Web页面的企业搜索引擎(ESE)的和基于开源Java Lucene的索引企业搜索系统设计与实现方法。通过在电信行业Deep Web站点部署实验,经运行检验,结果达到了设计指标要求,为电信行业搜索发挥了作用。并对搜索的精度、速度,以及垃圾网页反舞弊等方面研究进行了展望。 展开更多
关键词 主题式爬虫 企业搜索引擎 deepWeb搜索技术 电信 设计与实施
原文传递
Deep Web搜索技术进展综述 被引量:5
2
作者 赵志宏 黄蕾 +1 位作者 刘峰 陈振宇 《山东大学学报(工学版)》 CAS 北大核心 2009年第2期15-20,共6页
搜索技术用于帮助用户从海量网络资源中快速获取与自己当前需求相关的信息.针对传统搜索技术的局限性,对"深层网络"中的搜索技术进行了综述,并从关键技术、搜索引擎框架等方面进行了系统性的阐述.
关键词 深层网络 搜索技术 信息抽取 结果集成
原文传递
Deep Web查询接口自动识别方法 被引量:1
3
作者 郑淑丽 韩江洪 +1 位作者 程文娟 吴永忠 《郑州大学学报(理学版)》 CAS 北大核心 2009年第1期56-58,63,共4页
获取Deep Web中信息的主要途径是通过在其提供的查询接口上提交查询来获得,自动识别Deep Web查询接口是Deep Web数据集成系统中需要解决的一个关键问题.通过提取适当的表单结构特征,采用C4.5决策树和朴素贝叶斯相结合的分类算法实现对De... 获取Deep Web中信息的主要途径是通过在其提供的查询接口上提交查询来获得,自动识别Deep Web查询接口是Deep Web数据集成系统中需要解决的一个关键问题.通过提取适当的表单结构特征,采用C4.5决策树和朴素贝叶斯相结合的分类算法实现对Deep Web查询接口的自动识别,实验验证了该方案的有效性. 展开更多
关键词 深度网 查询接口 网页表单 结构特征
在线阅读 下载PDF
主题Deep Web爬虫框架研究 被引量:3
4
作者 黄聪会 张水平 胡洋 《计算机工程与设计》 CSCD 北大核心 2010年第5期929-931,935,共4页
为满足用户精确化和个性化获取信息的需要,通过分析Deep Web信息的特点,提出了一个可搜索不同主题Deep Web信息的爬虫框架。针对爬虫框架中Deep Web数据库发现和Deep Web爬虫爬行策略两个难题,分别提出了使用通用搜索引擎以加快发现不... 为满足用户精确化和个性化获取信息的需要,通过分析Deep Web信息的特点,提出了一个可搜索不同主题Deep Web信息的爬虫框架。针对爬虫框架中Deep Web数据库发现和Deep Web爬虫爬行策略两个难题,分别提出了使用通用搜索引擎以加快发现不同主题的Deep Web数据库和采用常用字最大限度下载Deep Web信息的技术。实验结果表明了该框架采用的技术是可行的。 展开更多
关键词 深网 爬虫 搜索引擎 信息抽取 常用字
在线阅读 下载PDF
基于搜索引擎的Deep Web数据源发现技术 被引量:2
5
作者 李文骏 崔志明 《计算机技术与发展》 2008年第8期58-60,64,共4页
随着Web数据库的广泛应用,Web正在不断"深化"。传统搜索引擎只能检索浅层网络,却不能直接索引到深层网络(Deep Web)的资源。为了有效地利用Deep Web资源,必须要对Deep Web数据进行大规模集成。其中,数据源发现是整合Deep Web... 随着Web数据库的广泛应用,Web正在不断"深化"。传统搜索引擎只能检索浅层网络,却不能直接索引到深层网络(Deep Web)的资源。为了有效地利用Deep Web资源,必须要对Deep Web数据进行大规模集成。其中,数据源发现是整合Deep Web资源的首要工作,能否高效地发现Deep Web站点是Deep Web数据获取的关键。提出了一种基于传统搜索引擎的Deep Web数据源发现方法,该方法通过分析返回结果来扩展查询,从而进一步提高了数据源发现的效率。实验证明该方法能得到较好的结果。 展开更多
关键词 搜索引擎 deep WEB 网页表单 查询扩展
在线阅读 下载PDF
Deep Web语义搜索系统设计
6
作者 方巍 文学志 毕硕本 《武汉理工大学学报》 CAS CSCD 北大核心 2010年第16期106-109,共4页
针对Deep Web特点,采用基于本体的信息检索方法,设计和实现了一种Deep Web语义搜索系统,方便用户获取需要的高价值信息。
关键词 deep WEB 语义搜索 本体 信息集成
原文传递
Deep Web查询接口研究
7
作者 钱程 阳小兰 《计算机与现代化》 2012年第6期161-164,168,共5页
Deep Web查询接口是Web数据库的接口,其对于Deep Web数据库集成至关重要。本文根据网页表单的结构特征定义查询接口;针对非提交查询法,给出界定Deep Web查询接口的一些规则;提出提交查询法,根据链接属性的特点进行判断,找到包含查询接... Deep Web查询接口是Web数据库的接口,其对于Deep Web数据库集成至关重要。本文根据网页表单的结构特征定义查询接口;针对非提交查询法,给出界定Deep Web查询接口的一些规则;提出提交查询法,根据链接属性的特点进行判断,找到包含查询接口的页面;采用决策树C4.5算法进行分类,并用Java语言实现Deep Web查询接口系统。 展开更多
关键词 deep WEB 查询接口 表单
在线阅读 下载PDF
基于Deep Web的地图搜索系统的研究与实现
8
作者 李继宝 李庆忠 闫中敏 《山东大学学报(理学版)》 CAS CSCD 北大核心 2007年第11期59-61,65,共4页
针对传统搜索方式和查询界面的不足,提出了基于Deep Web的地图搜索系统框架,前台采用活动地图与用户进行交互,后台采用领域本体和Deep Web爬虫进行识别和相关信息的收集。此系统应用于与地理位置相关的主题信息类网站,使用户能够直观便... 针对传统搜索方式和查询界面的不足,提出了基于Deep Web的地图搜索系统框架,前台采用活动地图与用户进行交互,后台采用领域本体和Deep Web爬虫进行识别和相关信息的收集。此系统应用于与地理位置相关的主题信息类网站,使用户能够直观便捷地搜索到所需的信息,提出了一种信息搜索的新思路。 展开更多
关键词 地图搜索系统 活动地图 深层网络 数据库 可扩展标识语言 领域本体
在线阅读 下载PDF
中文Deep Web的大小、质量及分布 被引量:1
9
作者 藕军 任明仑 +1 位作者 左春荣 章成志 《情报学报》 CSSCI 北大核心 2008年第2期256-260,共5页
Deep Web中包含着大量高质量内容,当前的搜索引擎技术还不能对其进行搜索,研究Deep Web的大小、质量及分布情况将有助于找到对其进行有效搜索的方法和技术。以网络蜘蛛采集的2006年10月的数据为样本,利用统计、概率等定量方法和定性... Deep Web中包含着大量高质量内容,当前的搜索引擎技术还不能对其进行搜索,研究Deep Web的大小、质量及分布情况将有助于找到对其进行有效搜索的方法和技术。以网络蜘蛛采集的2006年10月的数据为样本,利用统计、概率等定量方法和定性方法,首次对中文Deep Web的大小、质量及分布情况进行调查,得出概况如下:①Deep Web大小比Surface Web的大240倍以上;②包含的文件总数量和总存储量分别为507亿、11700TB;③可搜索数据库数量超过3万个;④内容质量较高;⑤内容主题分布不均匀。 展开更多
关键词 deep WEB 中文 WEB 搜索引擎
在线阅读 下载PDF
基于演化版本的Deep Web查询接口维护方法 被引量:1
10
作者 束长波 施化吉 王基 《计算机应用研究》 CSCD 北大核心 2015年第11期3345-3348,共4页
针对现有Deep Web信息集成系统没有考虑查询接口动态性的特点,造成本地接口与网络接口查询能力不对等的问题,提出一种基于演化版本的Deep Web查询接口维护方法。该方法通过构建本地接口的版本化模型来刻画接口的增量变化,识别变动比较... 针对现有Deep Web信息集成系统没有考虑查询接口动态性的特点,造成本地接口与网络接口查询能力不对等的问题,提出一种基于演化版本的Deep Web查询接口维护方法。该方法通过构建本地接口的版本化模型来刻画接口的增量变化,识别变动比较活跃的属性集合;然后采取试探性查询来构建最优查询语句,获取网络接口数据源的变动信息,演化出本地接口的下一个版本,实现对本地查询接口数据源的信息维护的迭代过程。实验结果表明,该方法降低了深网环境变化对Deep Web信息集成带来的影响,确保了Deep Web查询接口的准确率和查全率的稳定性。 展开更多
关键词 deep WEB 查询接口 演化版本 接口维护
在线阅读 下载PDF
基于Tabu的Deep Web特征选择算法 被引量:1
11
作者 谭春亮 甘丹 +1 位作者 陈丽娜 蒋运承 《计算机工程与设计》 CSCD 北大核心 2008年第13期3358-3361,3473,共5页
Deep Web分类的小样本、高维特征的特点限制了分类算法的选择,影响分类器的设计和准确度,降低了分类器的"泛化"能力,出现分类器"过拟合",所以需要进行特征选择,降低特征的维数,避免"维数灾难"。目前,没有... Deep Web分类的小样本、高维特征的特点限制了分类算法的选择,影响分类器的设计和准确度,降低了分类器的"泛化"能力,出现分类器"过拟合",所以需要进行特征选择,降低特征的维数,避免"维数灾难"。目前,没有Deep Web特征选择自动算法的相关研究。通过对Deep Web分类的特征选择进行研究,提出了基于类别可分性判据和Tabu搜索的特征选择算法,可以在2的时间复杂度内得到次优的特征子集,减小了分类器设计的难度,提高了分类器分类准确率。根据特征选择前后的特征集,利用KNN分类算法进行Deep Web分类,结果表明提高了分类器的分类准确率,降低了分类算法的时间复杂度。 展开更多
关键词 特征选择 TABU搜索算法 深层网络 信息检索 分类算法 分类器
在线阅读 下载PDF
书籍搜索领域Deep Web数据集成系统 被引量:1
12
作者 钟昕 伏玉琛 《计算机技术与发展》 2008年第9期50-52,56,共4页
随着在线数据库的迅速增长,可以访问的数据库资源大大增多,但它们的信息传统搜索引擎无法获得,它隐藏在网站背后,成为人们快速有效获取信息的障碍。为了获得Deep Web中大量有价值的隐藏信息,需要整合各在线异构数据源,以便在同一领域内... 随着在线数据库的迅速增长,可以访问的数据库资源大大增多,但它们的信息传统搜索引擎无法获得,它隐藏在网站背后,成为人们快速有效获取信息的障碍。为了获得Deep Web中大量有价值的隐藏信息,需要整合各在线异构数据源,以便在同一领域内比较某一事物的大量相关信息。目前,越来越多的人采取网上买书的消费方式,针对这个消费热点问题,设计了一个书籍搜索领域的Deep Web数据集成系统,提供一个集成的查询接口,使得用户可以方便地进行查找和比对。 展开更多
关键词 deep WEB WEB数据集成 书籍搜索
在线阅读 下载PDF
支持Ajax的Deep Web爬虫研究与设计 被引量:1
13
作者 周杨 《计算机系统应用》 2012年第2期167-171,共5页
随着互联网的迅速发展,网络资源日益丰富,如何从Web尤其是Deep Web中获取信息成为人们关注的焦点,以Ajax为基础的新一代网页信息抓取问题也逐渐成为研究热点。通过分析支持Ajax的Deep Web爬虫关键技术,提出了支持Ajax的Deep Web爬虫的... 随着互联网的迅速发展,网络资源日益丰富,如何从Web尤其是Deep Web中获取信息成为人们关注的焦点,以Ajax为基础的新一代网页信息抓取问题也逐渐成为研究热点。通过分析支持Ajax的Deep Web爬虫关键技术,提出了支持Ajax的Deep Web爬虫的体系结构,阐述了一种自动爬行Ajax网站的算法,为该爬虫的总体框架设计奠定了基础。 展开更多
关键词 deep WEB 爬虫 AJAX 搜索引擎
在线阅读 下载PDF
Deep Web数据集成中模式匹配算法的研究 被引量:1
14
作者 马玉祥 冯骁 《西安欧亚学院学报》 2009年第1期64-68,共5页
为了方便用户检索图书馆领域内的Deep Web信息,本文提出了一个Deep Web数据集成的系统结构,并依据这个系统结构对Deep Web数据集成中最为困难的"模式匹配"问题进行了深入的分析,提出了相应的模型和算法。这一算法和模型是设... 为了方便用户检索图书馆领域内的Deep Web信息,本文提出了一个Deep Web数据集成的系统结构,并依据这个系统结构对Deep Web数据集成中最为困难的"模式匹配"问题进行了深入的分析,提出了相应的模型和算法。这一算法和模型是设计与实现Deep Web馆藏图书集成查询系统的关键技术,对Deep Web数据集成有较大的应用价值。 展开更多
关键词 deep WEB 数据集成 模式匹配 集成查询系统
在线阅读 下载PDF
基于主题Deep Web数据挖掘的研究与探索
15
作者 赵昊 卫刚 赵晓东 《电脑知识与技术》 2012年第6期3792-3795,共4页
通过分析Deep Web信息的特点,提出一个可搜索不同主题Deep Web框架。针对框架中Deep Web数据库发现和DeepWeb爬虫爬行策略两个难题,分别提出了使用通用搜索引擎以加快发现不同主题的Deep Web数据库和采用常用字最大限度下载Deep Web... 通过分析Deep Web信息的特点,提出一个可搜索不同主题Deep Web框架。针对框架中Deep Web数据库发现和DeepWeb爬虫爬行策略两个难题,分别提出了使用通用搜索引擎以加快发现不同主题的Deep Web数据库和采用常用字最大限度下载Deep Web信息的技术。 展开更多
关键词 deep Web WEB数据库 数据挖掘 搜索引擎
在线阅读 下载PDF
Deep Web馆藏图书集成查询系统的研究与分析
16
作者 马玉祥 冯骁 《西安欧亚学院学报》 2009年第2期60-64,共5页
随着World Wide Web(WWW)的飞速发展,各种各样的可搜索的在线数据库极大地丰富了Web信息,然而这些信息通常隐藏在Web查询接口下,传统的搜索引擎由于技术原因不能查询Deep Web信息。上于Deep Web数据的异构性和动态性,有效地把这些信息... 随着World Wide Web(WWW)的飞速发展,各种各样的可搜索的在线数据库极大地丰富了Web信息,然而这些信息通常隐藏在Web查询接口下,传统的搜索引擎由于技术原因不能查询Deep Web信息。上于Deep Web数据的异构性和动态性,有效地把这些信息加以利用是一件重要而很有挑战性的工作。为了方便用户检索图书馆领域内的Deep Web信息,对Deep Web馆藏图书查询系统进行了研究。介绍了Deep Web概念,分析了国内外研究现状,在现有相关研究成果的基础上,提出了一个Deep Web数据集成的系统架构。 展开更多
关键词 deep WEB 数据集成 模式匹配 集成查询系统
在线阅读 下载PDF
突发公共卫生事件冲击下考虑多源异构大数据的旅游需求可解释预测研究 被引量:1
17
作者 曾宇容 吴彬溶 +1 位作者 王林 张金隆 《管理评论》 北大核心 2025年第2期139-151,共13页
本研究利用历史旅游流量数据,新冠病毒感染确诊人数数据,旅游相关和疫情相关的百度指数,天气、节假日数据,设计了考虑突发公共卫生事件冲击下的自然景区每日旅游需求量预测框架。将与疫情相关的搜索引擎数据引入到旅游需求预测中,并提出... 本研究利用历史旅游流量数据,新冠病毒感染确诊人数数据,旅游相关和疫情相关的百度指数,天气、节假日数据,设计了考虑突发公共卫生事件冲击下的自然景区每日旅游需求量预测框架。将与疫情相关的搜索引擎数据引入到旅游需求预测中,并提出了ADE-TFT可解释旅游需求预测新模型,其中自适应差分进化算法(adaptive differential evolution, ADE)用来智能高效地优化时域融合变换器(temporal fusion transformers, TFT)的超参数。TFT是一种基于注意力的深度学习模型,它将高性能预测与对时间动态的可解释分析相结合,在预测研究中呈现了优异的性能。TFT模型产生了可解释的旅游需求预测输出,包括不同输入变量的重要性排序以及不同时间步长的注意力分析。可解释实验结果表明,疫情相关搜索引擎数据能够充分反映出新冠疫情期间游客对疫情的担忧程度,研究结果为突发公共卫生事件冲击下的旅游需求高精度预测提供了理论支持。 展开更多
关键词 旅游需求预测 可解释性预测 复合指数 深度学习 突发公共卫生事件
原文传递
基于角度搜索和深度Q网络的移动机器人路径规划算法 被引量:3
18
作者 李宗刚 韩森 +1 位作者 陈引娟 宁小刚 《兵工学报》 北大核心 2025年第2期30-44,共15页
针对深度Q网络(Deep Q Network,DQN)算法在求解路径规划问题时存在学习时间长、收敛速度慢的局限性,提出一种角度搜索(Angle Searching,AS)和DQN相结合的算法(Angle Searching-Deep Q Network,AS-DQN),通过规划搜索域,控制移动机器人的... 针对深度Q网络(Deep Q Network,DQN)算法在求解路径规划问题时存在学习时间长、收敛速度慢的局限性,提出一种角度搜索(Angle Searching,AS)和DQN相结合的算法(Angle Searching-Deep Q Network,AS-DQN),通过规划搜索域,控制移动机器人的搜索方向,减少栅格节点的遍历,提高路径规划的效率。为加强移动机器人之间的协作能力,提出一种物联网信息融合技术(Internet Information Fusion Technology,IIFT)模型,能够将多个分散的局部环境信息整合为全局信息,指导移动机器人规划路径。仿真实验结果表明:与标准DQN算法相比,AS-DQN算法可以缩短移动机器人寻得到达目标点最优路径的时间,将IIFT模型与AS-DQN算法相结合路径规划效率更加显著。实体实验结果表明:AS-DQN算法能够应用于Turtlebot3无人车,并成功找到起点至目标点的最优路径。 展开更多
关键词 移动机器人 路径规划 深度Q网络 角度搜索策略 物联网信息融合技术
在线阅读 下载PDF
Deep Web查询优化算法研究
19
作者 张亮 陆余良 +1 位作者 袁桓 张旻 《小型微型计算机系统》 CSCD 北大核心 2012年第3期552-557,共6页
Deep Web查询是在指分析接口属性及其丰富的语义信息后构造的用于向数据源请求特定数据的语句,其质量将影响查询结果相关度的高低和查询代价的大小.为优化查询,提出一种基于量子遗传算法的优化算法,以Deep Web查询的实数二进制串为输入... Deep Web查询是在指分析接口属性及其丰富的语义信息后构造的用于向数据源请求特定数据的语句,其质量将影响查询结果相关度的高低和查询代价的大小.为优化查询,提出一种基于量子遗传算法的优化算法,以Deep Web查询的实数二进制串为输入进行量子编码,引入了球面解空间多子群并行寻优机制、群间染色体置换操作和量子变异算子以丰富种群多样性、提高算法的寻优效率.实验结果表明,该算法在R-Precision、覆盖率上具有一定的优势,能够有效地减少查询次数. 展开更多
关键词 deep WEB 查询优化 量子计算 量子遗传算法 并行寻优
在线阅读 下载PDF
面向移动通信网络的窄带干扰分级识别与定位方法
20
作者 陆南昌 刘大洋 +2 位作者 吴宝栋 唐国顺 田梦晗 《移动通信》 2025年第11期124-129,共6页
移动通信网络极易受到系统外的窄带干扰影响,从而导致性能劣化、用户感知受损。鉴于业界尚无简便、通用的窄带干扰识别与定位方法,难以针对窄带干扰所造成的严重影响进行全流程的分析处理。提出通用的多制式多厂家标准化格式,进行物理... 移动通信网络极易受到系统外的窄带干扰影响,从而导致性能劣化、用户感知受损。鉴于业界尚无简便、通用的窄带干扰识别与定位方法,难以针对窄带干扰所造成的严重影响进行全流程的分析处理。提出通用的多制式多厂家标准化格式,进行物理资源块级的切片分析,引入邻接矩阵进行深度搜索,并通过可配置的干扰特征识别算法,基于FP-Growth算法从干扰特征、小区特征、位置特征等信息中精准识别干扰源位置。通过现网实测,本方法降低了干扰分析的难度,同时提升了干扰源定位精度,由原本的两三公里提升至20 m以内。 展开更多
关键词 FP-GROWTH 深度搜索 窄带干扰 干扰切片 干扰矩阵
在线阅读 下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部