期刊导航
期刊开放获取
vip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于标记树对象抽取技术的Hidden Web获取研究
被引量:
9
1
作者
宋晖
张岭
+1 位作者
叶允明
马范援
《计算机工程与应用》
CSCD
北大核心
2002年第23期9-12,24,共5页
目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该...
目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该文提出了一套检索HiddenWeb信息的方法,给出了系统的框架结构,并详细讨论了实现的关键技术。系统采用新的基于标记树的对象抽取(Tag-Tree-basedObjectExtraction)方法自动地从Web页面中抽取HiddenWeb信息,然后在此基础上给出了结构化的HiddenWeb信息查询算法。文章最后对实验结果进行了讨论。
展开更多
关键词
标记树
对象抽取
hiddenweb
互联网
搜索引擎
信息检索
结构化查询
数据库
在线阅读
下载PDF
职称材料
题名
基于标记树对象抽取技术的Hidden Web获取研究
被引量:
9
1
作者
宋晖
张岭
叶允明
马范援
机构
上海交通大学计算机系
出处
《计算机工程与应用》
CSCD
北大核心
2002年第23期9-12,24,共5页
基金
国家自然科学基金重大国际合作项目资助(编号:60221120145)
文摘
目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该文提出了一套检索HiddenWeb信息的方法,给出了系统的框架结构,并详细讨论了实现的关键技术。系统采用新的基于标记树的对象抽取(Tag-Tree-basedObjectExtraction)方法自动地从Web页面中抽取HiddenWeb信息,然后在此基础上给出了结构化的HiddenWeb信息查询算法。文章最后对实验结果进行了讨论。
关键词
标记树
对象抽取
hiddenweb
互联网
搜索引擎
信息检索
结构化查询
数据库
Keywords
Hidden Web,Information Retrieval,Object Extraction,Structured Query,Tag Tree
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
G354 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于标记树对象抽取技术的Hidden Web获取研究
宋晖
张岭
叶允明
马范援
《计算机工程与应用》
CSCD
北大核心
2002
9
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部