期刊文献+
共找到86篇文章
< 1 2 5 >
每页显示 20 50 100
基于数据驱动的智能变电站信息高效校验技术 被引量:2
1
作者 计荣荣 张淦锋 +3 位作者 王梦芝 金颖杰 李海 黄若钒 《中国电力》 北大核心 2025年第1期100-106,共7页
为提高变电站的远动遥信对点效率,提出一种基于数据驱动的智能站信息高效校验技术。面向智能变电站,基于远动信息对点系统架构,采用多点随机不重复抽取方法实现信息全覆盖,并通过不一致效验分析方法进行信息对点检验,利用抽取校核方法... 为提高变电站的远动遥信对点效率,提出一种基于数据驱动的智能站信息高效校验技术。面向智能变电站,基于远动信息对点系统架构,采用多点随机不重复抽取方法实现信息全覆盖,并通过不一致效验分析方法进行信息对点检验,利用抽取校核方法实现远动遥信对点的闭环处理。通过仿真算例,验证了所提方法的高效性与准确性。 展开更多
关键词 数据驱动 遥信对点 不一致分析
在线阅读 下载PDF
Big Data Flow Adjustment Using Knapsack Problem
2
作者 Eyman Yosef Ahmed Salama M. Elsayed Wahed 《Journal of Computer and Communications》 2018年第10期30-39,共10页
The advancements of mobile devices, public networks and the Internet of creature huge amounts of complex data, both construct & unstructured are being captured in trust to allow organizations to produce better bus... The advancements of mobile devices, public networks and the Internet of creature huge amounts of complex data, both construct & unstructured are being captured in trust to allow organizations to produce better business decisions as data is now pivotal for an organizations success. These enormous amounts of data are referred to as Big Data, which enables a competitive advantage over rivals when processed and analyzed appropriately. However Big Data Analytics has a few concerns including Management of Data, Privacy & Security, getting optimal path for transport data, and Data Representation. However, the structure of network does not completely match transportation demand, i.e., there still exist a few bottlenecks in the network. This paper presents a new approach to get the optimal path of valuable data movement through a given network based on the knapsack problem. This paper will give value for each piece of data, it depends on the importance of this data (each piece of data defined by two arguments size and value), and the approach tries to find the optimal path from source to destination, a mathematical models are developed to adjust data flows between their shortest paths based on the 0 - 1 knapsack problem. We also take out computational experience using the commercial software Gurobi and a greedy algorithm (GA), respectively. The outcome indicates that the suggest models are active and workable. This paper introduced two different algorithms to study the shortest path problems: the first algorithm studies the shortest path problems when stochastic activates and activities does not depend on weights. The second algorithm studies the shortest path problems depends on weights. 展开更多
关键词 0 - 1 KNAPSACK Problem BIG data BIG data ANALYTICS BIG DAO TA inconsistencies
暂未订购
基于电压曲线诊断锂离子电池的故障 被引量:1
3
作者 廖力 杨达 +1 位作者 李勋波 姜久春 《电池》 CAS 北大核心 2024年第5期655-659,共5页
锂离子电池在电动汽车中应用广泛,电池的不一致性故障与内短路故障是电动汽车的严重安全隐患。采用绝对中位差方法来放大电池组故障电池的电压特性;再利用非局部均值滤波算法进行滤波,得到平滑的故障电压特征;最后,通过动态时间归整(DTW... 锂离子电池在电动汽车中应用广泛,电池的不一致性故障与内短路故障是电动汽车的严重安全隐患。采用绝对中位差方法来放大电池组故障电池的电压特性;再利用非局部均值滤波算法进行滤波,得到平滑的故障电压特征;最后,通过动态时间归整(DTW)算法计算特征值曲线之间的相似度距离,实现故障电池自动定位。使用运行车辆电压数据进行验证,发现该诊断方法对两类故障车辆均具有良好的检测效果:一是故障电池DTW距离长期偏离其他电池的不一致性故障车辆;二是故障电池DTW距离短期偏离其他电池的内部短路故障车辆。与余弦相似度进行对比,验证所提方法的准确性更高。 展开更多
关键词 锂离子电池 不一致性故障 内短路故障 故障诊断 实车数据 动态时间归整(DTW)算法
在线阅读 下载PDF
基于向量误差修正模型的电池簇不一致检测方法及智能运维方案 被引量:2
4
作者 郭源 夏向阳 +2 位作者 岳家辉 李辉 吴晋波 《中国电力》 CSCD 北大核心 2024年第6期9-17,44,共10页
针对储能电站实际运行数据中存在电池数据不完整、数据片段化导致检测不准确的问题,提出基于向量误差修正模型的电池簇不一致检测方法。该方法根据随机电压片段数据构建电池簇与电池单体的向量误差修正模型,计算脉冲响应函数,分析电池... 针对储能电站实际运行数据中存在电池数据不完整、数据片段化导致检测不准确的问题,提出基于向量误差修正模型的电池簇不一致检测方法。该方法根据随机电压片段数据构建电池簇与电池单体的向量误差修正模型,计算脉冲响应函数,分析电池单体对电池簇的动态作用机制,判断电池簇不一致程度,再通过方差分解分析确定异常电池单体及后续运维。最后,根据储能电站实际运行数据进行分析,验证了电池簇不一致检测方法及运维方案的可行性和有效性,并在100kW/200kW·h储能平台进行实际工程测试。 展开更多
关键词 电池簇不一致 随机片段数据 向量误差修正模型 智能运维方案
在线阅读 下载PDF
基于局部离群点检测的动力电池组不一致早期故障预警 被引量:1
5
作者 魏正新 吕晗珺 +1 位作者 闵永军 张涌 《重庆理工大学学报(自然科学)》 CAS 北大核心 2024年第6期21-29,共9页
随着新能源汽车的飞速发展,其动力电池的安全性问题受到了社会各界的广泛关注。在新能源汽车运行监控平台上,已有的动力电池安全检测功能无法在电池故障早期给出预警。针对电池不一致性预警问题,设计了一种更适用于实现动力电池组不一... 随着新能源汽车的飞速发展,其动力电池的安全性问题受到了社会各界的广泛关注。在新能源汽车运行监控平台上,已有的动力电池安全检测功能无法在电池故障早期给出预警。针对电池不一致性预警问题,设计了一种更适用于实现动力电池组不一致早期故障预警问题的流程。设计了一种基于箱型图法的动态梯度数据清洗策略实现异常数据有效剔除;对数据进行充电阶段划分,提取单体电压变化不一致特征;在此基础上,借助离群检测算法得到各电池单体离群值,进行不一致故障初期预警并识别异常电池单体。对实际出现电池不一致故障车辆回溯分析,验证该流程提前监控平台已有的报警机制不少于7个充电周期,并可对异常单体进行准确定位。 展开更多
关键词 动力电池 大数据 离群检测 电池不一致 故障预警
在线阅读 下载PDF
基于统计推理的不一致数据清洗方法 被引量:4
6
作者 张安珍 胡生吉 夏秀峰 《计算机应用研究》 CSCD 北大核心 2024年第10期2987-2992,共6页
不一致数据修复是数据清洗领域的一个重要研究方向,现有方法大多是基于完整性约束规则的,采用最小代价原则进行修复,然而,代价最小的修复方案通常是不正确的,导致现有修复方法的准确率较低。针对现有方法准确率较低的问题,提出了一种基... 不一致数据修复是数据清洗领域的一个重要研究方向,现有方法大多是基于完整性约束规则的,采用最小代价原则进行修复,然而,代价最小的修复方案通常是不正确的,导致现有修复方法的准确率较低。针对现有方法准确率较低的问题,提出了一种基于统计推理的不一致数据清洗方法BayesOUR,兼顾修复的代价与质量,提高修复准确性。BayesOUR主要分为三个阶段:首先根据完整性约束规则进行错误检测;然后利用贝叶斯网络推理所有可能的一致性修复方案概率;最后选择概率最大的修复方案进行数据清洗。真实数据上的实验结果表明,该方法与目前领先的方法相比,能够显著提高不一致数据修复的准确性。 展开更多
关键词 不一致数据 贝叶斯网络 统计推理
在线阅读 下载PDF
规则与概率相结合的不一致数据子集修复方法 被引量:1
7
作者 张安珍 司佳宇 +2 位作者 梁天宇 朱睿 邱涛 《软件学报》 EI CSCD 北大核心 2024年第9期4448-4468,共21页
不一致数据子集修复问题是数据清洗领域的重要研究问题,现有方法大多是基于完整性约束规则的,采用最小删除元组数量原则进行子集修复.然而,这种方法没有考虑删除元组的质量,导致修复准确性较低.为此,提出规则与概率相结合的子集修复方法... 不一致数据子集修复问题是数据清洗领域的重要研究问题,现有方法大多是基于完整性约束规则的,采用最小删除元组数量原则进行子集修复.然而,这种方法没有考虑删除元组的质量,导致修复准确性较低.为此,提出规则与概率相结合的子集修复方法,建模不一致元组概率使得正确元组的平均概率大于错误元组的平均概率,求解删除元组概率和最小的子集修复方案.此外,为了减小不一致元组概率计算的时间开销,提出一种高效的错误检测方法,减小不一致元组规模.真实数据和合成数据上的实验结果验证所提方法的准确性优于现有最好方法. 展开更多
关键词 不一致数据 函数依赖 子集修复 概率图网络
在线阅读 下载PDF
阀门生产质量追溯问题研究探讨 被引量:2
8
作者 王冠 常维 陈靖 《阀门》 2024年第5期628-633,共6页
探讨了阀门生产质量追溯的重要性,分析了当前阀门行业在质量追溯方面所面临的挑战,包括生产过程复杂性、行业标准不统一、数据采集困难、数据不一致性、追溯系统建设等问题。文章提出了政府或行业出台相关政策、制定统一标准和规范、提... 探讨了阀门生产质量追溯的重要性,分析了当前阀门行业在质量追溯方面所面临的挑战,包括生产过程复杂性、行业标准不统一、数据采集困难、数据不一致性、追溯系统建设等问题。文章提出了政府或行业出台相关政策、制定统一标准和规范、提升整个行业的质量控制水平以及企业应如何加强生产质量追溯管理的对策建议。同时,文章还强调了企业应根据国家关于质量强国建设和制造业高质量发展的要求,结合自身信息化建设现状,分阶段实施质量追溯体系的建设,加强内部培训,提升员工的质量意识和追溯体系操作能力,确保追溯体系的有效运行。 展开更多
关键词 阀门生产 质量追溯 生产过程复杂性 数据采集 数据不一致性 政策支持 行业标准 质量控制
在线阅读 下载PDF
Integrate inconsistent and heterogeneous data based on user feedback
9
作者 Lihua Lu Hengzhen Zhang Xiao-Zhi Gao 《International Journal of Intelligent Computing and Cybernetics》 EI 2015年第2期187-203,共17页
Purpose–Data integration is to combine data residing at different sources and to provide the users with a unified interface of these data.An important issue on data integration is the existence of conflicts among the... Purpose–Data integration is to combine data residing at different sources and to provide the users with a unified interface of these data.An important issue on data integration is the existence of conflicts among the different data sources.Data sources may conflict with each other at data level,which is defined as data inconsistency.The purpose of this paper is to aim at this problem and propose a solution for data inconsistency in data integration.Design/methodology/approach–A relational data model extended with data source quality criteria is first defined.Then based on the proposed data model,a data inconsistency solution strategy is provided.To accomplish the strategy,fuzzy multi-attribute decision-making(MADM)approach based on data source quality criteria is applied to obtain the results.Finally,users feedbacks strategies are proposed to optimize the result of fuzzy MADM approach as the final data inconsistent solution.Findings–To evaluate the proposed method,the data obtained from the sensors are extracted.Some experiments are designed and performed to explain the effectiveness of the proposed strategy.The results substantiate that the solution has a better performance than the other methods on correctness,time cost and stability indicators.Practical implications–Since the inconsistent data collected from the sensors are pervasive,the proposed method can solve this problem and correct the wrong choice to some extent.Originality/value–In this paper,for the first time the authors study the effect of users feedbacks on integration results aiming at the inconsistent data. 展开更多
关键词 Decision making data fusion data inconsistency data integration User feedback
在线阅读 下载PDF
Truth Discovery on Inconsistent Relational Data
10
作者 Jizhou Sun Jianzhong Li +1 位作者 Hong Gao Hongzhi Wang 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2018年第3期288-302,共15页
In this era of big data, data are often collected from multiple sources that have different reliabilities, and there is inevitable conflict with respect to the various information obtained when it relates to the the s... In this era of big data, data are often collected from multiple sources that have different reliabilities, and there is inevitable conflict with respect to the various information obtained when it relates to the the same object.One important task is to identify the most trustworthy value out of all the conflicting claims, and this is known as truth discovery. Existing truth discovery methods simultaneously identify the most trustworthy information and source reliability degrees and are based on the idea that more reliable sources often provide more trustworthy information,and vice versa. However, there are often semantic constrains defined upon relational database, which can be violated by a single data source. To remove violations, an important task is to repair data to satisfy the constrains,and this is known as data cleaning. The two problems above may coexist, but considering them together can provide some benefits, and to the authors knowledge, this has not yet been the focus of any research. In this paper, therefore, a schema-decomposing based method is proposed to simultaneously discover the truth and to clean the data, with the aim of improving accuracy. Experimental results using real world data sets of notebooks and mobile phones, as well as simulated data sets, demonstrate the effectiveness and efficiency of our proposed method. 展开更多
关键词 inconsistent data truth discovery data cleaning
原文传递
On the Inconsistency of Cloud Liquid Water between Reanalyses and Satellite Observations over East Asia
11
作者 Yunheng XUE Jie YU +3 位作者 Miao CAI Ze CHEN Ling YANG Jia LI 《Journal of Meteorological Research》 2025年第4期1025-1038,共14页
Cloud water plays an important role in the global atmospheric water cycle and weather modification,but cloud is one of the most uncertain parameters in the study of weather and climate.The cloud water products from di... Cloud water plays an important role in the global atmospheric water cycle and weather modification,but cloud is one of the most uncertain parameters in the study of weather and climate.The cloud water products from different data sources may have considerable discrepancies.In this study,the total cloud liquid water(termed as cloud liquid water path,LWP)obtained from satellite observations[Advanced Himawari Imager(AHI)and Advanced Microwave Scanning Radiometer(AMSR)]and three sets of modern reanalysis data(ERA5,JRA-55,and MERRA-2)are compared and analyzed.Moreover,characteristics of vertical distributions of cloud liquid water content(LWC)in different regions over East Asia are analyzed by using the profile data from the reanalyses.The main findings are as follows:(1)in extensive warm marine clouds,AHI and AMSR have a good agreement(with the correlation coefficient larger than 0.7)but with an overestimation from AHI;(2)under warm cloud conditions,the LWP in ERA5shows a significant positive bias(about 0.065 kg m^(-2))over land,while MERRA-2 is closer to the satellite product compared with ERA5 and JRA-55;and(3)Southwest China(SW)is the area with most abundant LWC.The LWC is mainly concentrated in the middle and lower troposphere in the study area,and the LWC in ERA5 is higher than that in MERRA-2 and JRA-55.Overall,satellite observations and reanalyses exhibit significant inconsistency for cloud LWP,which needs further investigation and understanding. 展开更多
关键词 satellite observations reanalysis data cloud liquid water inconsistENCY
原文传递
基于数据依赖的数据修复研究进展 被引量:9
12
作者 胡艳丽 张维明 +2 位作者 罗旭辉 肖卫东 汤大权 《计算机科学》 CSCD 北大核心 2009年第10期11-15,共5页
介绍了数据依赖理论及如何基于数据依赖修复不一致数据,提高数据质量。首先介绍了数据依赖理论;给出了数据修复的语义假设及对应的修复操作;总结了基于数据依赖修复不一致数据的方法;最后讨论了基于数据依赖修复不一致数据的未来发展方向。
关键词 数据依赖 不一致数据 修复 数据清洗 数据质量
在线阅读 下载PDF
大数据上基于Hadoop的不一致数据检测与修复算法 被引量:13
13
作者 张安珍 门雪莹 +2 位作者 王宏志 李建中 高宏 《计算机科学与探索》 CSCD 北大核心 2015年第9期1044-1055,共12页
随着现代社会互联网的普及应用,产生的海量数据普遍存在质量问题。针对数据质量中不一致性问题进行研究,设计并实现了基于Hadoop并行平台的不一致数据检测与修复算法。采用数据依赖理论中的条件函数依赖,根据给定规则检测不一致数据集,... 随着现代社会互联网的普及应用,产生的海量数据普遍存在质量问题。针对数据质量中不一致性问题进行研究,设计并实现了基于Hadoop并行平台的不一致数据检测与修复算法。采用数据依赖理论中的条件函数依赖,根据给定规则检测不一致数据集,对这些不一致数据求解修复方案,使得修复结果满足数据一致性要求,并给出修复结果的确定性概率。最后通过实验证明了该算法较已有的单机算法有更好的修复效果,当约束规则较少的情况下,算法执行时间呈线性增长。 展开更多
关键词 数据一致性 MAP REDUCE 条件函数依赖 数据质量
在线阅读 下载PDF
复杂三维地震联片处理技术及其应用实例分析 被引量:26
14
作者 邬达理 郑伟建 +2 位作者 金晓雷 赵改善 边高 《石油物探》 EI CSCD 2001年第1期9-19,共11页
本文所论述的复杂三维地震联片处理技术能在整个联片处理的范围内 ,消除各块三维数椐之间的多种不一致性 ,以获得有利于全区统一解释的完整的数据体。文中对可能影响拼接处理质量的因素和进行处理的指导思想作了清楚的阐述。应用实例表... 本文所论述的复杂三维地震联片处理技术能在整个联片处理的范围内 ,消除各块三维数椐之间的多种不一致性 ,以获得有利于全区统一解释的完整的数据体。文中对可能影响拼接处理质量的因素和进行处理的指导思想作了清楚的阐述。应用实例表明 ,本技术是获得统一完整数据体的有效方法手段 。 展开更多
关键词 复杂三维地震联片处理 不一致性 地震勘探
在线阅读 下载PDF
地理空间数据不一致性探测处理方法研究 被引量:12
15
作者 简灿良 赵彬彬 +1 位作者 邓敏 余丽钰 《计算机工程与应用》 CSCD 2013年第10期150-155,共6页
空间数据不一致性是指空间数据对象之间存在的矛盾或冲突。空间数据不一致性一直以来都是国际地理信息科学领域的一个基础研究问题,亦是空间数据质量评价的一个重要指标。目前,国内外学者就空间数据不一致性问题进行了大量的探讨,在不... 空间数据不一致性是指空间数据对象之间存在的矛盾或冲突。空间数据不一致性一直以来都是国际地理信息科学领域的一个基础研究问题,亦是空间数据质量评价的一个重要指标。目前,国内外学者就空间数据不一致性问题进行了大量的探讨,在不一致性成因、分类、表达、探测、处理及评价等方面都取得了较好的进展,并各有侧重点。为了更好地开展该方面的研究,系统地总结已有的空间数据不一致性研究成果,尤其是最新的一些进展,指出若干有待进一步研究的问题。 展开更多
关键词 空间数据质量 不一致性 探测 改正 空间关系
在线阅读 下载PDF
基于简化分辨矩阵的粗糙集属性约简算法 被引量:10
16
作者 田卫东 周创德 +2 位作者 胡学钢 周红鹃 李培培 《计算机科学》 CSCD 北大核心 2008年第3期209-212,共4页
针对改进的经典算法求取属性约简存在的时间和空间性能不理想问题,本文提出了一种新的属性约简算法ARSDM。该算法先将决策表按决策属性的类别划分,后采用边生成矩阵元素边约简边排序的思想求取属性约简,有效地加快了约简速度。实验表明A... 针对改进的经典算法求取属性约简存在的时间和空间性能不理想问题,本文提出了一种新的属性约简算法ARSDM。该算法先将决策表按决策属性的类别划分,后采用边生成矩阵元素边约简边排序的思想求取属性约简,有效地加快了约简速度。实验表明ARSDM算法与经典算法相比具有较好的时间和空间性能。 展开更多
关键词 数据挖掘 粗糙集 不一致性决策表 属性约简 分辨矩阵
在线阅读 下载PDF
概率数据库中近似函数依赖挖掘算法 被引量:6
17
作者 苗东菁 刘显敏 李建中 《计算机研究与发展》 EI CSCD 北大核心 2015年第12期2857-2865,共9页
一个近似函数依赖(approximate functional dependency,AFD)是一个几乎成立的函数依赖,目前大部分工作仅限于从一般数据上挖掘近似函数依赖.有时数据是被组织成概率数据的形式,为了从挖掘概率数据中挖掘出可用的近似函数依赖,定义了概... 一个近似函数依赖(approximate functional dependency,AFD)是一个几乎成立的函数依赖,目前大部分工作仅限于从一般数据上挖掘近似函数依赖.有时数据是被组织成概率数据的形式,为了从挖掘概率数据中挖掘出可用的近似函数依赖,定义了概率近似函数依赖,它不同于任何一种以往的定义,并给出了在不确定数据中,置信概率的动态规划求解算法,由于动态规划算法复杂度较高,导出了候选依赖的概率下界来进行剪枝,随后给出了基于字典序的挖掘方法以及相应的剪枝策略,最后,在真实和合成的数据集上进行充分的实验,说明了挖掘算法的可扩展性和剪枝策略的高效性,并展示了有趣的挖掘结果. 展开更多
关键词 近似函数依赖 数据挖掘 概率数据库 数据质量 不一致性
在线阅读 下载PDF
基于信息增益的最佳属性集发现方法 被引量:11
18
作者 钟宁 尹旭日 陈世福 《小型微型计算机系统》 CSCD 北大核心 2002年第4期444-446,共3页
怎样挖掘出简洁、紧凑、易于理解和有效的分类规则一直是研究人员和领域专家所面临的问题 .而通过发现最佳属性集是解决该问题的一种有效途径 .本文在 Rough集理论的基础上 ,将单属性信息增益概念扩充为多属性的情况 ,并引入到最佳属性... 怎样挖掘出简洁、紧凑、易于理解和有效的分类规则一直是研究人员和领域专家所面临的问题 .而通过发现最佳属性集是解决该问题的一种有效途径 .本文在 Rough集理论的基础上 ,将单属性信息增益概念扩充为多属性的情况 ,并引入到最佳属性的发现中 .实验表明 ,该算法能够挖掘出简洁易于理解和使用的规则 。 展开更多
关键词 最佳属性集 信息增益 ROUGH集理论 数据挖掘 数据库
在线阅读 下载PDF
基于电压频域特征和异常系数的动力电池故障诊断方法 被引量:13
19
作者 刘鹏 吴志强 +1 位作者 张照生 孙振宇 《中国公路学报》 EI CAS CSCD 北大核心 2022年第8期89-104,共16页
动力电池系统是电动汽车(EV)的关键部件和主要故障源,因而提高动力电池故障诊断的效率和准确率显得尤为重要。基于此提出一种基于快速傅里叶变换(FFT)和异常系数评估(ACE)的动力电池电压不一致性故障诊断方法。针对6辆发生故障或热失控... 动力电池系统是电动汽车(EV)的关键部件和主要故障源,因而提高动力电池故障诊断的效率和准确率显得尤为重要。基于此提出一种基于快速傅里叶变换(FFT)和异常系数评估(ACE)的动力电池电压不一致性故障诊断方法。针对6辆发生故障或热失控事故的电动汽车和1辆电压一致性良好的电动汽车,基于其在新能源汽车国家监管平台的全生命周期运行数据,经过电压数据的数据清洗、数据变换等大数据预处理后,利用FFT技术时频变换,提取频域中的幅值作为故障诊断的特征参数;然后,引进基于Z分数理论的异常系数对故障程度进行定量评估,以实现故障单体的检测和定位;此外,针对存在多个故障单体的情况,基于单体异常率的计算,实现单体故障程度的判定和排序;在此基础上,详细分析电压数据长度及采样间隔、FFT采样点数对模型的影响;最后,与基于熵和Z分数的电压故障诊断方法进行比较。研究结果表明:在上述研究条件下,该诊断方法对于电压一致性良好的车辆未产生误报警,且可以有效地检测出事故车辆动力电池系统存在的电压不一致性故障;相比之下,模型平均计算准确率提高了3.25%,模型平均耗时仅为熵值模型的0.55%;验证了该方法故障单体定位更精准、数据适用性更好及计算速度更快的优点。该研究成果能有效实现动力电池电压不一致性故障诊断,具有较高的工程应用价值。 展开更多
关键词 汽车工程 故障诊断 快速傅里叶变换 电压不一致性 异常系数 大数据
原文传递
基于代价模型的不一致XML数据修复启发式计算 被引量:1
20
作者 吴爱华 王先胜 +1 位作者 谈子敬 汪卫 《软件学报》 EI CSCD 北大核心 2009年第4期918-929,共12页
在实际应用中,为不一致的XML文档计算最优修复意义重大.但求解最优修复是一个NP完全问题,特别是在XML文档同时违反函数依赖约束和主键约束时.提出一个基于代价模型的、可以在多项式时间内完成的启发式修复求解算法.该算法首先借助索引表... 在实际应用中,为不一致的XML文档计算最优修复意义重大.但求解最优修复是一个NP完全问题,特别是在XML文档同时违反函数依赖约束和主键约束时.提出一个基于代价模型的、可以在多项式时间内完成的启发式修复求解算法.该算法首先借助索引表,在一遍扫描原始XML文档的情况下寻找不一致数据集,然后为每一类约束的不一致数据集构造候选修复,同时计算其修复代价,最后启发式地求解一个代价最小的修复方案.实验结果表明,该算法的时间复杂度不超过冲突类的3次方,即便是在不一致数据量很大、噪声比例很大以及涉及多类语义约束时,也能较快地完成修复. 展开更多
关键词 不一致性 不一致数据 修复 一致的查询回答 XML数据清洗 不完整数据库
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部