期刊文献+
共找到30篇文章
< 1 2 >
每页显示 20 50 100
Optimized XML Storage in NXD Based on Tree-Structure Disassemble
1
作者 LIU Yun-sheng WANG Yi ZHONG Hao 《Wuhan University Journal of Natural Sciences》 EI CAS 2006年第1期93-99,共7页
Independent XML storage based on XSD (XML Schema Document) is adopted in NXD(Native XML Data base), XMI. storage structure based on tree-structure disassemble and the algorithm used in dynamically updating XML doc... Independent XML storage based on XSD (XML Schema Document) is adopted in NXD(Native XML Data base), XMI. storage structure based on tree-structure disassemble and the algorithm used in dynamically updating XML document are provided in this paper. The main idea is that in term of data model of XML document, XML document is parsed to Document Structure-Tree with Hierarchical Model and Leaf-Data with Relation Model for storage. Simultaneously Proxy node is imported in order to solve the problem that XML data store in cross-blocks. And with XSD model information, sparse index is constructed to save storage space. It is proved that this storage structure could improve efficiency of XML document operation. 展开更多
关键词 XML storage storage model NXD (native XML database) document trees regular expression
在线阅读 下载PDF
富文本协同编辑中基于树型结构地址空间转换的一致性维护
2
作者 刘亚 韩建功 +1 位作者 高丽萍 曲博 《小型微型计算机系统》 CSCD 北大核心 2024年第2期367-373,共7页
协同编辑通过多用户远程实时编辑,最大程度的支持团队之间的协作和交流.撤销操作作为协同编辑的一个重要特性,通过错误恢复简化协作编辑过程中产生的错误或者意外操作的处理过程.富文本编辑采用树型结构来进行文档管理,从而产生了较线... 协同编辑通过多用户远程实时编辑,最大程度的支持团队之间的协作和交流.撤销操作作为协同编辑的一个重要特性,通过错误恢复简化协作编辑过程中产生的错误或者意外操作的处理过程.富文本编辑采用树型结构来进行文档管理,从而产生了较线性文档更为复杂的并发操作环境和冲突消解场景.为了解决富文本文档中的并发操作环境与撤销操作冲突问题,本文提出了一种新颖的基于树型结构的地址空间转换方法,采用基于位置的节点寻址方案和节点属性值计数器策略,能更方便地支持撤销操作与更改操作.此外,本文还给出了树型结构地址空间的结果一致性的正确性证明及详细的案例分析,并开发了Web平台下实时协同富文本编辑原型系统AST-RichText,进一步验证了该方法的可行性. 展开更多
关键词 计算机支持的协同工作 实时协同编辑 地址空间转换 一致性模型 UNDO 树型文档
在线阅读 下载PDF
网络化制造中XML文档结构模型与应用研究 被引量:12
3
作者 于庆梅 尹朝万 刘志刚 《计算机集成制造系统-CIMS》 EI CSCD 北大核心 2003年第7期601-607,共7页
针对网络化制造系统中分布式异构环境下产品协同设计制造数据结构化和非结构化的特点,提出了网络化制造中产品设计制造信息资源的XML统一描述,以及XML文档树结构的定义与模型,并将该模型应用于Web结构的产品异地协同设计制造系统,给出了... 针对网络化制造系统中分布式异构环境下产品协同设计制造数据结构化和非结构化的特点,提出了网络化制造中产品设计制造信息资源的XML统一描述,以及XML文档树结构的定义与模型,并将该模型应用于Web结构的产品异地协同设计制造系统,给出了XML样式化接口和映射接口的实现机制。以机加件类零件为例,给出产品文档树型结构模型的模板与映射接口的实例化,不仅实现了Web环境下的产品异地协同设计中信息资源的浏览与交互处理,而且通过数据映射接口,为远程机加件的在线加工后处理提供了有效的数据。 展开更多
关键词 XML 文档树模型 文档模式 网络化制造
在线阅读 下载PDF
一种基于特征符号的网页主题信息抽取方法 被引量:4
4
作者 王舒 朱敏 +2 位作者 张明 牛颢 赵瑜 《计算机应用研究》 CSCD 北大核心 2009年第12期4539-4541,共3页
随着Internet网络的日益普及,W eb上的海量数据给文本挖掘尤其是网页主题提取带来了更多的挑战,现有的文本提取方法在保证高准确率的同时无法满足W eb挖掘方法的通用性。通过对W eb网页结构进行研究,对网页生成树模型进行了改进,找到网... 随着Internet网络的日益普及,W eb上的海量数据给文本挖掘尤其是网页主题提取带来了更多的挑战,现有的文本提取方法在保证高准确率的同时无法满足W eb挖掘方法的通用性。通过对W eb网页结构进行研究,对网页生成树模型进行了改进,找到网页结构的通用规则,提出一种基于特征符号的提取方法CECS(contentextraction characteristic symbols),结合相关度对网页主题内容进行提取。实验证明,所提算法具有很高的准确性和通用性。 展开更多
关键词 生成树模型 特征符号 相关度 主题提取
在线阅读 下载PDF
机床协同设计中产品信息XML描述模型的研究 被引量:6
5
作者 陈桦 张鹏伟 陈景霞 《组合机床与自动化加工技术》 2005年第2期13-15,18,共4页
文章在分析机床产品特征结构的基础上提出了XML描述的产品设计信息文档模型以及XML文档信息交互处理的方法 ,实现了设计资源的浏览与交互处理的统一描述。采用传输XML表达的设计语义而不是三维实体造型的数据交换方法 ,在减轻网络负荷... 文章在分析机床产品特征结构的基础上提出了XML描述的产品设计信息文档模型以及XML文档信息交互处理的方法 ,实现了设计资源的浏览与交互处理的统一描述。采用传输XML表达的设计语义而不是三维实体造型的数据交换方法 ,在减轻网络负荷的同时 ,满足了协同设计中实时。 展开更多
关键词 XNL 协同设计 机床 文档模式
在线阅读 下载PDF
一种Deep Web查询结果的实体抽取方法 被引量:4
6
作者 赵海霞 李道申 +1 位作者 刘勇 赵嘉诚 《计算机工程与应用》 CSCD 2012年第36期160-163,共4页
Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结... Deep Web中蕴含着丰富的高质量的信息,通过Deep Web集成查询接口可以获取到包含这些信息的结果页面,因此,Deep Web查询结果页面的数据抽取成为Deep Web数据集成的关键。提出了将索引方法和编辑相似度相结合的方法,来完成Deep Web查询结果页面的数据抽取工作。大量实验结果表明:该方法是可行的,并且能够提高Deep Web数据实体抽取的准确性和召回率。 展开更多
关键词 深度网 数据抽取 文件对象模型(DOM)树 索引 相似度
在线阅读 下载PDF
一种基于关系数据库XML存储方案的数据库模型 被引量:3
7
作者 马竹娟 汪宏喜 《计算机系统应用》 2011年第4期203-206,共4页
存储方案是XML数据管理研究领域的核心问题之一。底层的存储表达在性能上对上层的查询和优化有着重要的影响,因此有效地建立XML文档的存储方案是首要问题。以关系数据库为基础,提出了一种基于边模型映射的XML存储方案的数据库模型。在... 存储方案是XML数据管理研究领域的核心问题之一。底层的存储表达在性能上对上层的查询和优化有着重要的影响,因此有效地建立XML文档的存储方案是首要问题。以关系数据库为基础,提出了一种基于边模型映射的XML存储方案的数据库模型。在该模型中,首先依据文档中的结点类型对XML文档树进行结构细化;其次采用联合表来存储结点的值,并在该表中采用结点序号和路径相结合的方式,仅记录每一个元素结点的路径;最后在这种新的存储模式的基础上,实现了针对该模型的数据库操作。实验表明,该模型在查询速度和存储空间方面较以往的工作都有明显的改善。 展开更多
关键词 存储方案 边模型 文档树 联合表 数据库模型
在线阅读 下载PDF
XML文档到关系数据库映射方法的研究 被引量:21
8
作者 耿飙 宋余庆 +1 位作者 梁成全 陈健美 《计算机应用研究》 CSCD 北大核心 2010年第3期951-954,共4页
针对现有映射方法对XML文档格式要求过严等不足,在模型映射方法基础上提出一种XML文档映射关系数据库的新方法。通过给XML文档树做标志,将映射算法转换后的数据放到两张预先定义结构的表进行存储。给出了逻辑数据模型、详细设计、映射... 针对现有映射方法对XML文档格式要求过严等不足,在模型映射方法基础上提出一种XML文档映射关系数据库的新方法。通过给XML文档树做标志,将映射算法转换后的数据放到两张预先定义结构的表进行存储。给出了逻辑数据模型、详细设计、映射算法和实验。实验结果表明,该方法能有效地保持XML文档的结构,能够对存储的数据进行语义检索,适用于任何树型数据结构。 展开更多
关键词 可扩展标记语言文档 模型映射 标志 保持结构 树型数据结构
在线阅读 下载PDF
文件系统增量备份策略的形式化描述及实现 被引量:2
9
作者 肖克辉 倪德明 《计算机工程与设计》 CSCD 北大核心 2007年第10期2455-2457,共3页
文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复... 文件系统备份和恢复过程中,需根据当前备份资源树和历史备份资源树进行合并等操作,这种操作在物理上表现为对目录树和资源树的处理。特别是增量备份时,它指明备份资源。恢复过程中,用户可以利用该策略根据时间点进行完全恢复和部分恢复。给出一种对备份资源树的解析算法,并进行分析,在算法的基础上对备份资源树进行了形式化描述。 展开更多
关键词 文件系统 增量备份 备份资源树 目录树 文档对象模型
在线阅读 下载PDF
基于小波域多状态隐马尔科夫树模型的自适应文本图像分割算法 被引量:12
10
作者 宋锦萍 侯玉华 +1 位作者 杨晓艺 唐远炎 《电子学报》 EI CAS CSCD 北大核心 2007年第1期118-122,共5页
本文针对文本图像首先提出了一种基于小波域多状态隐马尔科夫树模型的自适应文本图像分割算法(Context-Adapted wavelet-domain Hidden Markov Tree,简称为CAHMT),该算法具有较高的分割质量和较低的计算复杂度.其次,为了进一步提高CAHM... 本文针对文本图像首先提出了一种基于小波域多状态隐马尔科夫树模型的自适应文本图像分割算法(Context-Adapted wavelet-domain Hidden Markov Tree,简称为CAHMT),该算法具有较高的分割质量和较低的计算复杂度.其次,为了进一步提高CAHMT算法分割的效果,将该算法与微分算子、尺度系数相结合提出了两种新的文本图像分割算法.最后通过实例阐明了这些算法的有效性. 展开更多
关键词 文本分割 小波变换 隐马尔科夫树模型 自适应 微分算子 尺度系数
在线阅读 下载PDF
基于B/S架构的Web网页结构检测应用研究 被引量:2
11
作者 陈圣俭 孙明涛 《现代电子技术》 2009年第2期135-138,共4页
随着互联网的普及,大型的跨国公司要求公司对内对外的所有网站都遵循统一的框架结构,因此为了判断网页结构是否符合标准,需要对网页结构进行检测。Web结构分析是指从Web文档中自动分析网页结构的过程,检测不符合标准的网页。依据W3C Mar... 随着互联网的普及,大型的跨国公司要求公司对内对外的所有网站都遵循统一的框架结构,因此为了判断网页结构是否符合标准,需要对网页结构进行检测。Web结构分析是指从Web文档中自动分析网页结构的过程,检测不符合标准的网页。依据W3C Markup Validation Service的设计理念,基于DOM结构树和正则表达式的操作,以分析Web网页结构为基础,提出了Web页面结构检测的设计思想。在解析Html和CSS代码的基础上,网页结构检测正确率达到80%以上。 展开更多
关键词 正则表达式 网页结构树 检测 文档对象模型 属性元素
在线阅读 下载PDF
基于结构相似网页聚类的正文提取算法研究 被引量:2
12
作者 王海涌 冯兆旭 +1 位作者 杨海波 张津栋 《计算机工程与应用》 CSCD 北大核心 2018年第11期122-127,139,共7页
针对当前互联网网页越来越多样化、复杂化的特点,提出一种基于结构相似网页聚类的网页正文提取算法,首先,根据组成网页前端模板各"块"对模板的贡献赋以不同的权重,其次计算两个网页中对应块的相似度,将各块的相似度与权重乘... 针对当前互联网网页越来越多样化、复杂化的特点,提出一种基于结构相似网页聚类的网页正文提取算法,首先,根据组成网页前端模板各"块"对模板的贡献赋以不同的权重,其次计算两个网页中对应块的相似度,将各块的相似度与权重乘积的总和作为两个网页的相似度。该算法充分考虑结构差别较大的网页对网页正文提取的影响,通过计算网页间相似度将网页聚类,使得同一簇中的网页正文提取结果更加准确。实验结果表明,该方法具有更高的准确率,各项评价指标均有所提高。 展开更多
关键词 正文提取 相似性 文档对象模型(DOM)树 层次聚类
在线阅读 下载PDF
面向维基百科服务计算领域的演化知识树 被引量:3
13
作者 赵一 何克清 +2 位作者 陈荆亮 黄贻望 黄颖 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2015年第4期331-338,共8页
针对已有知识树知识热点不突出、知识分类不准确以及结构不断演化等问题,本文面向维基百科的中文数据库"服务计算"领域密集型数据,提出了扩展的中文分词算法,抽取、分类出多种主题知识及其结构化信息,结合服务计算领域文档提... 针对已有知识树知识热点不突出、知识分类不准确以及结构不断演化等问题,本文面向维基百科的中文数据库"服务计算"领域密集型数据,提出了扩展的中文分词算法,抽取、分类出多种主题知识及其结构化信息,结合服务计算领域文档提出基于LDA改进的DKHM(文档-主题-热点)模型,使用Gibbs抽样算法对数据集采样,并消除原词条歧义分类,以建立演化知识树.实验结果表明:基于DKHM的聚类准确度高于一般的贝叶斯聚类,通过聚类发现的热点与真实热点的匹配度达60%以上,从而验证了演化知识树比维基百科原有知识树结构更合理,热点趋势效果更明显. 展开更多
关键词 文档-主题-热点 GIBBS抽样 演化知识树 维基百科热点
原文传递
Deep Web接口的自动识别技术研究
14
作者 杨永红 高磊 +1 位作者 余航 徐欣辰 《计算机工程与应用》 CSCD 北大核心 2017年第7期109-114,共6页
获取Deep Web中信息的主要途径是通过在其提供的查询接口上提交查询来实现的,目前大部分的研究以表单内的<form></form>标签获得表单内容结构,判断是不是一个Deep Web查询接口。提出了接口块的概念,设计了一种基于页面信息... 获取Deep Web中信息的主要途径是通过在其提供的查询接口上提交查询来实现的,目前大部分的研究以表单内的<form></form>标签获得表单内容结构,判断是不是一个Deep Web查询接口。提出了接口块的概念,设计了一种基于页面信息和视觉信息的接口块定位方法,最后将判定接口块是不是Deep Web接口看作是一个模式识别的分类问题,通过抽取适当的表单结构特征,采用C4.5决策树和SVM相结合的分类算法来进行接口块的判定,得到页面中含有的Deep Web查询接口。采用UIUC的TEL-8数据集进行实验,结果表明,该方法的准确率达到了97.30%,具有良好的可行性和实用性。 展开更多
关键词 DeepWeb接口 文档对象化模型树 接口块 多类分类
在线阅读 下载PDF
支持局部更新的双向内容适配策略
15
作者 吕红亮 王劲林 邓峰 《计算机工程与应用》 CSCD 北大核心 2010年第33期6-8,共3页
内容适配旨在解决融合环境下多种终端兼容问题,现有的内容适配策略在用户通过受限终端进行更新时会造成信息丢失。提出一种支持局部更新的双向内容适配策略,该策略基于DOM树建立统一的存储模型对元数据和适配实例进行存储,当受限终端发... 内容适配旨在解决融合环境下多种终端兼容问题,现有的内容适配策略在用户通过受限终端进行更新时会造成信息丢失。提出一种支持局部更新的双向内容适配策略,该策略基于DOM树建立统一的存储模型对元数据和适配实例进行存储,当受限终端发起更新时,通过比较DOM树中的节点对元数据进行局部更新。实验结果表明,相比现有策略,支持局部更新的内容适配策略在大部分情况下可以减少60%以上的信息丢失。 展开更多
关键词 融合环境 双向内容适配 局部更新 元数据 文档对象模型(DOM)树
在线阅读 下载PDF
基于Web挖掘和文档对象模型树的XML网页分类方法
16
作者 马勇 郑翔 +1 位作者 鲜敏 黎远松 《微型电脑应用》 2016年第7期47-49,52,共4页
Web网页的自动分类有助于更好地对其内容进行组织和管理,针对XML网页的分类问题,提出了一种基于Web挖掘和文档对象模型(DOM)树的XML网页分类方法。首先,收集XML网页的文本信息。然后,对XML文本进行去冗余操作,并提取网页源代码。再后,利... Web网页的自动分类有助于更好地对其内容进行组织和管理,针对XML网页的分类问题,提出了一种基于Web挖掘和文档对象模型(DOM)树的XML网页分类方法。首先,收集XML网页的文本信息。然后,对XML文本进行去冗余操作,并提取网页源代码。再后,利用DOM树结构进行标签提取,创建知识库。最后,通过从测试网页中获取的标签与知识库进行匹配来分类网页。实验结果表明,提出的方法在各种XML网页下获得了97%的整体准确度。 展开更多
关键词 XML网页分类 WEB挖掘 文档对象模型树 标签匹配
在线阅读 下载PDF
网络办公电子文档管理系统的设计与实现
17
作者 叶苗 麦范金 《广西科学院学报》 2005年第4期282-283,290,共3页
以B/S模型为基础,采用W indow s2000 Server IIS为平台,采用SQL Server 2000数据库,通过A SP开发一个网络办公电子文档管理系统。该系统以树型目录实现子部门管理、以二进制的形式进行电子文档维护和以对用户登陆信息进行M D 5加密进行... 以B/S模型为基础,采用W indow s2000 Server IIS为平台,采用SQL Server 2000数据库,通过A SP开发一个网络办公电子文档管理系统。该系统以树型目录实现子部门管理、以二进制的形式进行电子文档维护和以对用户登陆信息进行M D 5加密进行安全管理。该系统可以将部门档案信息和个人档案信息进行合理有效的管理。 展开更多
关键词 电子文档 B/S模型 树型目录 档案信息
在线阅读 下载PDF
高效图像资源管理器的设计与实现
18
作者 张贤莉 翟正军 冯萍 《航空计算技术》 2011年第2期96-99,共4页
针对数据存储量大引起的访问广域网服务器速度慢、不能对访问的客户进行细粒度的权限控制问题,研究了B/S模式下基于.NET平台的图像资源管理器的设计和实现技术。系统综合采用权限管理模型、动态加载、文档对象模型(DOM)等技术以及非点... 针对数据存储量大引起的访问广域网服务器速度慢、不能对访问的客户进行细粒度的权限控制问题,研究了B/S模式下基于.NET平台的图像资源管理器的设计和实现技术。系统综合采用权限管理模型、动态加载、文档对象模型(DOM)等技术以及非点击无刷新伸缩控制方法,实现了图像资源管理器的分权限控制、高速访问以及无刷新高效联动等操作。实验验证了方法的可行性。 展开更多
关键词 动态树 文档对象模型 无刷新联动 伸缩 权限管理
在线阅读 下载PDF
基于词共现模型与DOM的石油主题采集策略
19
作者 李村合 李晗 《微计算机应用》 2008年第2期28-31,共4页
提出了一种基于DOM树的词共现模型,首先利用文档的结构信息生成DOM树,并依据DOM树的结构特点来统计文档中主题词的共现信息,最后采用向量空间模型实现对石油主题网页的采集和分类。它改进了原有的词共现模型,突出了利用位置信息来优化... 提出了一种基于DOM树的词共现模型,首先利用文档的结构信息生成DOM树,并依据DOM树的结构特点来统计文档中主题词的共现信息,最后采用向量空间模型实现对石油主题网页的采集和分类。它改进了原有的词共现模型,突出了利用位置信息来优化词共现模型的特点。实验证明该策略使采集和分类的性能都有了一定的提高。 展开更多
关键词 词共现模型 DOM树 文本分类 主题采集 向量空间模型
在线阅读 下载PDF
正则表达式在网络蜘蛛抽取问答系统信息中的应用
20
作者 汪材印 《宿州学院学报》 2012年第5期32-35,共4页
问答系统是信息检索系统的一种高级形式,为了提高网络蜘蛛在抽取问答系统信息时的爬行效率,从问答系统所特有的布局结构特点出发,结合正则表达式,设计了一个针对问答系统的网络蜘蛛爬行策略。实验证明,该爬行策略提高了网络蜘蛛爬行效率... 问答系统是信息检索系统的一种高级形式,为了提高网络蜘蛛在抽取问答系统信息时的爬行效率,从问答系统所特有的布局结构特点出发,结合正则表达式,设计了一个针对问答系统的网络蜘蛛爬行策略。实验证明,该爬行策略提高了网络蜘蛛爬行效率,节省了网络带宽和本地存储空间,有效地提高了答案抽取的精度和效率。 展开更多
关键词 正则表达式 网络蜘蛛 问答系统)DOM树
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部