调查和分析元数据标准在健康科学数据中的应用现状,有助于为我国健康科学数据描述中元数据标准的选择、健康科学数据平台的建设提供参考。通过网络调研法对科学数据仓储注册系统(registry of research data repositories,re3data)中的...调查和分析元数据标准在健康科学数据中的应用现状,有助于为我国健康科学数据描述中元数据标准的选择、健康科学数据平台的建设提供参考。通过网络调研法对科学数据仓储注册系统(registry of research data repositories,re3data)中的健康科学数据管理平台进行调研,梳理所应用的元数据标准,分析典型元数据标准在平台中的应用情况,并归纳其在健康科学数据描述中的适用性。re3data中各健康科学数据平台共使用14种元数据标准,其中DC、DataCite、DDI、仓储自建元数据标准的使用最为广泛,多数平台组合使用多种元数据标准。各类元数据标准可分为通用型、社会科学型、自建型3类,分别适用于描述健康科学数据通用属性、社会科学研究产生的健康科学数据、特色和专业性强及政府开放的健康科学数据。展开更多
The study aimed to develop a customized Data Governance Maturity Model (DGMM) for the Ministry of Defence (MoD) in Kenya to address data governance challenges in military settings. Current frameworks lack specific req...The study aimed to develop a customized Data Governance Maturity Model (DGMM) for the Ministry of Defence (MoD) in Kenya to address data governance challenges in military settings. Current frameworks lack specific requirements for the defence industry. The model uses Key Performance Indicators (KPIs) to enhance data governance procedures. Design Science Research guided the study, using qualitative and quantitative methods to gather data from MoD personnel. Major deficiencies were found in data integration, quality control, and adherence to data security regulations. The DGMM helps the MOD improve personnel, procedures, technology, and organizational elements related to data management. The model was tested against ISO/IEC 38500 and recommended for use in other government sectors with similar data governance issues. The DGMM has the potential to enhance data management efficiency, security, and compliance in the MOD and guide further research in military data governance.展开更多
【目的】随着智慧城市建设中信息技术的深度应用,GNSS轨迹数据呈爆炸式增长,但其轨迹生成过程易受信号干扰与传感器故障影响而产生噪声。本文旨在设计新型噪声识别与修复算法,以提升原始GNSS轨迹数据的处理精度与质量。【方法】针对轨...【目的】随着智慧城市建设中信息技术的深度应用,GNSS轨迹数据呈爆炸式增长,但其轨迹生成过程易受信号干扰与传感器故障影响而产生噪声。本文旨在设计新型噪声识别与修复算法,以提升原始GNSS轨迹数据的处理精度与质量。【方法】针对轨迹噪声识别问题,本文提出基于密度矩阵的自适应DBSCAN算法,其具有超参数无关特性,可敏感捕获低幅值噪声点,同时避免连续转向点的误判。针对噪声修复问题,提出基于轨迹分段的函数构造式修复算法:首先采用道格拉斯-普克(Douglas-Peucker,DP)算法压缩轨迹数据实现分段;其次定位含噪声轨迹段,基于段内有效点构造拟合函数;最终依据相邻点时空属性修复噪声数据。相较于主流插值算法(如拉格朗日、牛顿、埃尔米特、线性、三次样条及最近邻插值),本方法通过规避全局特征依赖,显著保留了噪声点蕴含的局部信息特征。【结果】基于长春市1500名志愿者2024年8月19日—9月1日的原始GNSS轨迹数据,设计2组对比实验。第1组将新型识别算法与原始DBSCAN及其主流衍生算法(KANN-DBSCAN、BDT-ADBSCAN)进行对比。实验表明:新算法在轮廓系数(SC)、Calinski-Harabasz指数(CHI)、Da‐vies-Bouldin指数(DBI)3项指标均取得最优值,优化幅度分别为40.17%~381.80%、20.03%~235.18%、23.42%~79.53%。第2组实验对比新型修复算法与6类经典插值方法(拉格朗日、牛顿、埃尔米特、线性、三次样条、最近邻),结果显示:新算法在轨迹相似性度量指标(Dynamic Time Warping,DTW)上全面优于对比方法,整体优化幅度达43.18%~80.43%。【结论】本文提出的噪声识别与修复算法显著提升了原始GNSS轨迹的质量精度,可高效支撑大规模轨迹数据预处理任务,为时空轨迹挖掘研究提供高质量数据基础。展开更多
文摘调查和分析元数据标准在健康科学数据中的应用现状,有助于为我国健康科学数据描述中元数据标准的选择、健康科学数据平台的建设提供参考。通过网络调研法对科学数据仓储注册系统(registry of research data repositories,re3data)中的健康科学数据管理平台进行调研,梳理所应用的元数据标准,分析典型元数据标准在平台中的应用情况,并归纳其在健康科学数据描述中的适用性。re3data中各健康科学数据平台共使用14种元数据标准,其中DC、DataCite、DDI、仓储自建元数据标准的使用最为广泛,多数平台组合使用多种元数据标准。各类元数据标准可分为通用型、社会科学型、自建型3类,分别适用于描述健康科学数据通用属性、社会科学研究产生的健康科学数据、特色和专业性强及政府开放的健康科学数据。
文摘The study aimed to develop a customized Data Governance Maturity Model (DGMM) for the Ministry of Defence (MoD) in Kenya to address data governance challenges in military settings. Current frameworks lack specific requirements for the defence industry. The model uses Key Performance Indicators (KPIs) to enhance data governance procedures. Design Science Research guided the study, using qualitative and quantitative methods to gather data from MoD personnel. Major deficiencies were found in data integration, quality control, and adherence to data security regulations. The DGMM helps the MOD improve personnel, procedures, technology, and organizational elements related to data management. The model was tested against ISO/IEC 38500 and recommended for use in other government sectors with similar data governance issues. The DGMM has the potential to enhance data management efficiency, security, and compliance in the MOD and guide further research in military data governance.
文摘【目的】随着智慧城市建设中信息技术的深度应用,GNSS轨迹数据呈爆炸式增长,但其轨迹生成过程易受信号干扰与传感器故障影响而产生噪声。本文旨在设计新型噪声识别与修复算法,以提升原始GNSS轨迹数据的处理精度与质量。【方法】针对轨迹噪声识别问题,本文提出基于密度矩阵的自适应DBSCAN算法,其具有超参数无关特性,可敏感捕获低幅值噪声点,同时避免连续转向点的误判。针对噪声修复问题,提出基于轨迹分段的函数构造式修复算法:首先采用道格拉斯-普克(Douglas-Peucker,DP)算法压缩轨迹数据实现分段;其次定位含噪声轨迹段,基于段内有效点构造拟合函数;最终依据相邻点时空属性修复噪声数据。相较于主流插值算法(如拉格朗日、牛顿、埃尔米特、线性、三次样条及最近邻插值),本方法通过规避全局特征依赖,显著保留了噪声点蕴含的局部信息特征。【结果】基于长春市1500名志愿者2024年8月19日—9月1日的原始GNSS轨迹数据,设计2组对比实验。第1组将新型识别算法与原始DBSCAN及其主流衍生算法(KANN-DBSCAN、BDT-ADBSCAN)进行对比。实验表明:新算法在轮廓系数(SC)、Calinski-Harabasz指数(CHI)、Da‐vies-Bouldin指数(DBI)3项指标均取得最优值,优化幅度分别为40.17%~381.80%、20.03%~235.18%、23.42%~79.53%。第2组实验对比新型修复算法与6类经典插值方法(拉格朗日、牛顿、埃尔米特、线性、三次样条、最近邻),结果显示:新算法在轨迹相似性度量指标(Dynamic Time Warping,DTW)上全面优于对比方法,整体优化幅度达43.18%~80.43%。【结论】本文提出的噪声识别与修复算法显著提升了原始GNSS轨迹的质量精度,可高效支撑大规模轨迹数据预处理任务,为时空轨迹挖掘研究提供高质量数据基础。