-
题名XML数据的查询技术
被引量:72
- 1
-
-
作者
孔令波
唐世渭
杨冬青
王腾蛟
高军
-
机构
北京大学计算机科学技术系
-
出处
《软件学报》
EI
CSCD
北大核心
2007年第6期1400-1418,共19页
-
基金
国家自然科学基金No.60503037
国家高技术研究发展计划(863)No.2005AA4Z3070
北京市自然科学基金No.4062018~~
-
文摘
XML规范已成为当前网络应用(包括数字图书馆、Web服务以及电子商务)中事实上的数据表达、交换的标准.针对XML数据的查询在当前XML数据管理研究中占有重要的地位,也是当前XML数据处理研究领域的热点方向,相关的研究文献有很多.根据查询模式描述的不同,将当前XML查询技术归入两大类:XML Query方式和XML IR方式.后者又进而可分以为3个子类:XML IR/keyword方式、XML IR/fragment和XMLIR/query方式,并从中挑选出3个研究者关注的问题进行了简述,它们是:Twig查询模式的处理、SLCA(smallest lowest common ancestor)节点的获取以及对所获取的XML片段相似性的度量.以方便普通用户使用为准则探讨了相关XML查询技术的优、缺点,将如下4个问题作为需要进一步关注的研究内容:结构化关键字查询及相应的结构相似性度量方法,如何消除XML Query查询处理模式(包含XML IR/query)和XML IR/keyword查询处理模式间数据冗余的问题,XML Query查询方式的理论探讨及其实现以及针对特定应用的XML数据的有效管理.
-
关键词
xml查询
xml
ir查询
XPATH
XQUERY
xml关键字查询
XQUERY
FT
Twig查询模式
结构连接
SLCA节点
DEWEY编码
相似性度量
树编辑距离
向量空间模型
TF^*IDF
-
Keywords
xml query
xml ir
XPath
XQuery
xml keyword search
XQuery FT
Twig
structural join
SLCA(smallest lowest common ancestor)
dewey encoding
similarity measuring
tree edit distance
VSM
TF^*IDF
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名XML信息检索探究
被引量:6
- 2
-
-
作者
廖述梅
万常选
徐升华
-
机构
江西财经大学信息管理学院
江西财经大学数据与知识工程江西省高校重点实验室
-
出处
《情报学报》
CSSCI
北大核心
2007年第2期229-234,共6页
-
基金
本文得到江西省教育厅科技项目重点项目(赣教技字[2005]327号)资助.
-
文摘
XML文档是具有层次结构和文本内容的半结构化数据。现有的Web信息检索是基于HTML文档的关键词全文检索,无法胜任XML元素粒度的检索;同时,XML数据库检索实现的是精确查找,检索结果无排序支持。因此,融合信息检索和数据库技术研究XML检索问题成为必然。本文从XML检索的问题域出发,阐述了XML信息检索(xMLIR)的国内外研究现状与特点,并分析了目前XML IR的热点和难点问题。
-
关键词
信息检索
xml
数据库
近似查询
-
Keywords
information retrieval (ir), xml, database (DB), proximate query
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于传统文本检索系统的XML索引实现研究
被引量:6
- 3
-
-
作者
陆伟
-
机构
武汉大学信息资源研究中心
-
出处
《情报学报》
CSSCI
北大核心
2006年第6期679-685,共7页
-
基金
国家社会科学基金资助项目(编号
04CTQ005)和湖北省科技攻关项目(编号:2004AA101C99)成果之一.
-
文摘
作为重要的信息交换与存储标准,XML得到学者们越来越多的重视。作为XML检索研究的重要组成部分,XML索引机制与实现的研究已经取得了一定的研究成果。然而,大部分研究都是基于数据库及专门的半结构化管理器之上的。本文提出了如何在传统文本检索系统Okapi的基础上构建XML索引的方法。首先介绍了Okapi的索引结构。在此基础上,深入探讨了XML索引的存储结构及实现。并对索引的性能进行了评价。
-
关键词
文本检索系统
Okapi
xml索引实现
-
Keywords
traditional ir system, Okapi, xml, index structure and algorithm.
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名支持路径查询和信息检索的XML索引
- 4
-
-
作者
柴变芳
傅玥
安素芳
胡吉朝
-
机构
石家庄经济学院信息工程学院
-
出处
《教育技术导刊》
2008年第3期42-43,共2页
-
文摘
对当前的XML索引需要改进的地方进行分析,给出了一个较通用的索引机制。首先提出一种XML文档编码规则,在此基础上设计支持路径查询和信息检索的索引结构,并给出了对文档重复元素和文本节点索引词汇进行归并处理的索引算法。索引算法只需对文档遍历一次,所得到的索引文件占用空间也比GUID和倒排文档少,并且利用这些索引文件能实现任意粒度、任意形式的内容、结构和属性查询。
-
关键词
xml
索引
编码规则
信息检索
-
Keywords
xml
index
numbering rule
ir
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名一种高效检索XML文档的倒排索引技术
被引量:2
- 5
-
-
作者
赵雄峰
-
机构
兰州交通大学电子信息与工程学院
-
出处
《电脑知识与技术(过刊)》
2010年第30期8429-8431,8447,共4页
-
文摘
倒排索引被广泛应用在现有的信息检索领域。但是为了支持结构化文档的包含查询,还需要进一步扩展.分析了为XML文档建立倒排索引和处理包含查询还有一定的扩展空间。用一种新颖的方法拓展了倒排索引,而且比较了使用RDBMS和IR两种实施方案。在关系数据库中建立扩展后的倒排索引并与已有的方法进行了对比,说明了新的方法的有效性,并给出结论。
-
关键词
倒排索引
xml
包含查询
信息检索
关系数据库
-
Keywords
inverted index
xml
containment query
ir
RDBMS
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名飞参数据综合记录分析系统的设计与实现
被引量:5
- 6
-
-
作者
高歌梦月
刘荣林
-
机构
天津七一二通信广播股份有限公司
-
出处
《指挥控制与仿真》
2018年第1期118-122,共5页
-
文摘
飞参记录分析对飞行状态评估及航电系统检测维护具有重要作用。针对综合射频系统多种类接口数据记录分析需求,构建一种具有综合性、高效性及通用性的飞参数据综合记录分析系统。介绍了系统总体方案设计及子系统方案设计,重点讨论了多接口数据融合、数据快速存储、数据解析及数据回放实现方法。应用实例表明,该系统解析结果准确,组合条件检索快捷,曲线分析及数据回放结果直观。系统能够服务于综合射频系统的数据分析评估工作,具有较强的实际应用价值。
-
关键词
飞参数据综合分析
综合射频系统
数据记录
xml
综合回放
-
Keywords
flight data integrated analysis
irS
data record
xml
simultaneously playback
-
分类号
V271.41
[航空宇航科学与技术—飞行器设计]
E926.31
[兵器科学与技术—武器系统与运用工程]
-