期刊文献+
共找到208篇文章
< 1 2 11 >
每页显示 20 50 100
Reproducible Learning of Gaussian Graphical Models via Graphical Lasso Multiple Data Splitting
1
作者 Kang Hu Danning Li Binghui Liu 《Acta Mathematica Sinica,English Series》 2025年第2期553-568,共16页
Gaussian graphical models(GGMs) are widely used as intuitive and efficient tools for data analysis in several application domains. To address the reproducibility issue of structure learning of a GGM, it is essential t... Gaussian graphical models(GGMs) are widely used as intuitive and efficient tools for data analysis in several application domains. To address the reproducibility issue of structure learning of a GGM, it is essential to control the false discovery rate(FDR) of the estimated edge set of the graph in terms of the graphical model. Hence, in recent years, the problem of GGM estimation with FDR control is receiving more and more attention. In this paper, we propose a new GGM estimation method by implementing multiple data splitting. Instead of using the node-by-node regressions to estimate each row of the precision matrix, we suggest directly estimating the entire precision matrix using the graphical Lasso in the multiple data splitting, and our calculation speed is p times faster than the previous. We show that the proposed method can asymptotically control FDR, and the proposed method has significant advantages in computational efficiency. Finally, we demonstrate the usefulness of the proposed method through a real data analysis. 展开更多
关键词 False discovery rate Gaussian graphical model multiple data splitting graphical Lasso
原文传递
基于分类估计的异质数据融合M_(split)模型 被引量:1
2
作者 陶叶青 束明聪 陈浩 《淮阴师范学院学报(自然科学版)》 2025年第1期45-51,共7页
从分类估计的角度研究异质数据融合理论,建立一种不依赖于随机模型的融合方法.该理论首先基于M_(split)估计对观测数据进行分类估计,然后根据分类估计结果,应用中位函数计算不同参数估值的中误差,最后通过定义尺度因子与相对权比函数构... 从分类估计的角度研究异质数据融合理论,建立一种不依赖于随机模型的融合方法.该理论首先基于M_(split)估计对观测数据进行分类估计,然后根据分类估计结果,应用中位函数计算不同参数估值的中误差,最后通过定义尺度因子与相对权比函数构建融合模型,实现异质数据的有效融合.通过两类不同精度量级的观测数据组成的控制测量实例对该方法进行验证,结果表明,该方法易于实现,得到的参数估值稳定. 展开更多
关键词 异质数据融合 分类估计 M_(split)估计 尺度因子 融合模型
在线阅读 下载PDF
Compressed data separation via dual frames based split-analysis with Weibull matrices 被引量:2
3
作者 CAI Yun LI Song 《Applied Mathematics(A Journal of Chinese Universities)》 SCIE CSCD 2013年第4期427-437,共11页
In this paper, we consider data separation problem, where the original signal is composed of two distinct subcomponents, via dual frames based Split-analysis approach. We show that the two distinct subcomponents, whic... In this paper, we consider data separation problem, where the original signal is composed of two distinct subcomponents, via dual frames based Split-analysis approach. We show that the two distinct subcomponents, which are sparse in two diff erent general frames respectively, can be exactly recovered with high probability, when the measurement matrix is a Weibull random matrix (not Gaussian) and the two frames satisfy a mutual coherence property. Our result may be significant for analysing Split-analysis model for data separation. 展开更多
关键词 Compressed sensing data separation dual frames split-analysis Weibull random matrices
在线阅读 下载PDF
基于数据流分割和能耗感知的异构服务器系统任务调度
4
作者 杨晨 肖晶 王密 《计算机科学》 北大核心 2025年第2期291-298,共8页
异构服务器平台为大型系统提供了强大的计算能力,但也带来了系统复杂性和能耗管理方面的挑战。针对异构服务器系统中的依赖任务,深入探讨了基于数据流分割的能耗感知调度问题。首先,对系统环境、依赖任务及数据流传输模式进行了建模,并... 异构服务器平台为大型系统提供了强大的计算能力,但也带来了系统复杂性和能耗管理方面的挑战。针对异构服务器系统中的依赖任务,深入探讨了基于数据流分割的能耗感知调度问题。首先,对系统环境、依赖任务及数据流传输模式进行了建模,并将能耗感知调度问题表述为一个约束优化问题,以最小化任务的调度完成时间。随后,提出了一种基于数据流分割和任务优先级策略的能耗感知调度算法DSEA。该算法通过优化数据流分割策略、任务优先级和基于权重的能耗分配,为每个任务寻找近似最优的启动时间和服务器分配方案。为了验证所提方法的有效性,从阿里巴巴集群数据集中随机选取了1000个不同长度范围的作业进行仿真实验。实验结果表明,DSEA算法在不同应用场景下较3种现有算法表现出显著的性能优势。 展开更多
关键词 异构服务器 能耗感知 数据流分割 依赖任务调度 任务优先级
在线阅读 下载PDF
马尔可夫毯与多数投票因果发现评估
5
作者 李廷鹏 王雷 +2 位作者 彭丹华 廖军 刘礼 《计算机技术与发展》 2025年第3期117-124,共8页
近年来,因果学习因其卓越的可解释性,成功地与深度学习相结合。在因果学习中,由于自然数据的收集难度和高成本,过去的研究主要依赖于合成数据集进行因果发现的验证。然而,合成数据集和半真实数据集常包含较多的人工控制,无法真实反映因... 近年来,因果学习因其卓越的可解释性,成功地与深度学习相结合。在因果学习中,由于自然数据的收集难度和高成本,过去的研究主要依赖于合成数据集进行因果发现的验证。然而,合成数据集和半真实数据集常包含较多的人工控制,无法真实反映因果发现算法在实际场景中的表现。为解决这一问题,提出了一种在缺乏真实因果图的情况下评估因果发现方法的新策略。具体而言,将数据集划分为训练集和测试集,在训练集上进行因果发现以构建因果图,然后在测试集上验证该因果图。验证过程包括马尔可夫毯测试和因果图中每条边的因果方向判别,最终通过多数投票策略集成判别结果。在合成数据集和真实数据集上进行了全面的实验,结果表明,该方法在评估因果图的准确性和泛化性方面具有显著的有效性。这一方法为因果发现算法在真实场景中的性能评估提供了新的途径,提升了因果学习的应用潜力和可信度。 展开更多
关键词 因果发现 马尔可夫毯测试 数据集分割 多数投票策略 因果非对称识别方法
在线阅读 下载PDF
测井解释结论数据转换为岩性敏感曲线 数据软件的开发
6
作者 赵笑航 王景德 +4 位作者 董一 吴泉全 孙静 冯丽涛 葛厚贶 《石油管材与仪器》 2025年第4期105-109,共5页
为了提高储层预测精度,综合运用测井解释结论数据,需要将测井解释结论数据转换为岩性敏感曲线数据。而Jason软件对岩性敏感曲线数据格式有严格要求,以前人工利用Excel软件对大量的测井解释结论数据进行数据转换、文件的拆分合并需要较... 为了提高储层预测精度,综合运用测井解释结论数据,需要将测井解释结论数据转换为岩性敏感曲线数据。而Jason软件对岩性敏感曲线数据格式有严格要求,以前人工利用Excel软件对大量的测井解释结论数据进行数据转换、文件的拆分合并需要较长时间,同时人工转换极易出现错误,需要反复核验,影响工作效率。针对这一问题,对测井解释结论数据转换为岩性敏感曲线数据的方法进行研究,通过Python语言开发软件,实现了快速、批量的数据转换,提高了工作效率。 展开更多
关键词 岩性敏感曲线 数据转换 文件拆分 数据替换 批量处理
在线阅读 下载PDF
一种基于Split—findmin和Set—maxima的最小支撑树灵敏度分析方法
7
作者 杨晓凌 谢政 陈挚 《数学理论与应用》 2007年第4期53-56,共4页
本文首先根据最小支撑树的截性质和圈性质给出了灵敏度分析的基本公式,然后基于现代图论算法中经典的Split—findmian数据结构介绍了树上边的灵敏度分析算法,最后将非树边的灵敏度分析转化为已有成熟的算法的Set—maxima问题进行处理.
关键词 最小支撑树灵敏度分析 split-findmin数据结构 Set-maxima问题
在线阅读 下载PDF
基于量子密钥的北斗短报文安全可靠通信设计 被引量:2
8
作者 肖波 《现代信息科技》 2025年第3期6-11,共6页
文章融合量子密钥分发(Quantum Key Distribution,QKD)技术与北斗短报文通信系统,对北斗短报文通信的安全性、可靠性进行研究,以提升信息传输的安全性和可靠性。提出了利用QKD确保密钥分发的安全,并结合对称加密算法加密数据;引入了超... 文章融合量子密钥分发(Quantum Key Distribution,QKD)技术与北斗短报文通信系统,对北斗短报文通信的安全性、可靠性进行研究,以提升信息传输的安全性和可靠性。提出了利用QKD确保密钥分发的安全,并结合对称加密算法加密数据;引入了超时重传机制提高数据包传输的可靠性;实施了大包拆分与重组策略解决单次传输容量限制问题。对多种网络环境下量子密钥分发的成功率及数据传输的完整性和效率进行了实验验证,尤其在高丢包率环境中表现突出。验证了量子密钥分发、超时重传、大包拆分在复杂条件下的优势,展现了其在实际应用中的前景。 展开更多
关键词 量子通信 QKD 北斗短报文 数据传输安全 大包拆分机制 超时重传机制
在线阅读 下载PDF
基于空间自适应高阶全变分的地震数据去噪模型
9
作者 李江萍 王德华 +2 位作者 乔增强 张丽丽 刘乃豪 《非常规油气》 2025年第1期1-8,共8页
地震噪声压制是地震数据处理的关键环节,其结果将影响地震数据的后续处理及地质解释。针对传统全变分(TV)正则化模型容易导致阶梯效应,以及高阶全变分(HOTV)正则化模型容易丢失边缘信息的问题,提出了一种能够克服阶梯效应并保护边缘信... 地震噪声压制是地震数据处理的关键环节,其结果将影响地震数据的后续处理及地质解释。针对传统全变分(TV)正则化模型容易导致阶梯效应,以及高阶全变分(HOTV)正则化模型容易丢失边缘信息的问题,提出了一种能够克服阶梯效应并保护边缘信息的地震数据去噪模型--空间自适应高阶全变差(SAHOTV)正则化模型。首先,通过差分特征值构造基于边缘检测函数的空间自适应权函数;其次,根据边缘检测函数提取的细节信息,定义空间自适应高阶全变分地震数据去噪模型;最后采用分裂Bregman迭代算法快速求解。实验结果表明:1)该方法能够提高地震数据的峰值信噪比;2)在抑制随机噪声的过程中可以显著地降低阶梯效应;3)能够较好地保留边缘及构造信息;4)该方法对有效同相轴信息损伤较小,保真度较高,去噪效果的优势明显。以上成果认识,对提高地震数据勘探的精度具有指导意义。 展开更多
关键词 地震数据去噪 随机噪声 高阶全变分 差分特征值 分裂Bregman迭代算法
在线阅读 下载PDF
一种面向纠删码的存储库优化方法
10
作者 谢汶兵 关睿雪 +2 位作者 张艺鸣 李佳梅 王俊 《计算机研究与发展》 北大核心 2025年第5期1123-1135,共13页
信息时代,数据存储的可靠性、一致性、安全性和实时性至关重要.纠删码(erasure code,EC)在允许多个存储设备发生故障的同时保证最低的存储开销,被大量应用在数据存储领域.纠删码的编码与解码运算具有计算密集的特征,其性能高低直接影响... 信息时代,数据存储的可靠性、一致性、安全性和实时性至关重要.纠删码(erasure code,EC)在允许多个存储设备发生故障的同时保证最低的存储开销,被大量应用在数据存储领域.纠删码的编码与解码运算具有计算密集的特征,其性能高低直接影响存储系统的使用效率.作为编码和解码运算中最耗时的部分,多层循环包裹的伽罗华域乘法计算是纠删码优化的一个焦点.首先分析了伽罗华域乘法计算的查表方法中常用的log查表法(LT)、完全乘法查表法(MT)、移位分解法(SH)的优劣势,然后对已有的伽罗华域GF(28)查表方法进行了优化,提出4 b分割法以大幅减少查表开销.在此基础上,利用64位现代处理器体系结构特点,从数据访问粒度扩展和单指令多数据(single instruction multiple data,SIMD)向量化利用实现数据级并行化2个角度优化了多层循环中的数据级访问粒度,提高了编码与解码的运算性能.基于开源存储加速库(Intel storage acceleration library,ISA-L)在申威平台和x86平台上实现和验证了上述优化方法的有效性.结果表明所提优化方法在不同数据规模下均有加速效果,申威平台与优化前相比平均性能加速比为3.28倍,x86平台与优化前相比平均性能加速比为2.36倍. 展开更多
关键词 纠删码 伽罗华域乘法 4b分割法 数据访问粒度 SIMD向量化 数据查表
在线阅读 下载PDF
基于迹距离划分决策树的高炉故障诊断方法
11
作者 刘亚雪 张敬川 王显鹏 《控制与决策》 北大核心 2025年第5期1533-1540,共8页
随着工业自动化和智能化的发展,决策树模型在高炉故障诊断领域得到了广泛应用,但对于炼铁过程中存在高维度、非线性和强耦合的特点,传统决策树模型的构建容易陷入局部最优解,效率较低且复杂度较高.针对这些问题,首先引入迹距离函数,并... 随着工业自动化和智能化的发展,决策树模型在高炉故障诊断领域得到了广泛应用,但对于炼铁过程中存在高维度、非线性和强耦合的特点,传统决策树模型的构建容易陷入局部最优解,效率较低且复杂度较高.针对这些问题,首先引入迹距离函数,并证明在迹距离函数中任何局部最优解也是全局最优解的性质;接着针对决策树的节点分裂过程,提出一种基于迹距离划分的决策树模型,记作TraceTree.此模型一方面可以更快速地评价一个节点的划分效果,有效降低决策树模型的复杂度;另一方面能够识别出对故障诊断最有贡献的特征参数并获得更高的诊断精度.与其他改进模型的对比实验结果表明,所提出的模型在更短的训练时间内能取得最优的高炉故障诊断效果,及时地对高炉炉况进行监测与诊断. 展开更多
关键词 高炉炼铁过程 故障诊断 数据挖掘 决策树 迹距离函数 节点分裂
原文传递
国产高分五号B星热红外数据地表温度反演方法研究
12
作者 李风光 任华忠 +2 位作者 赵艳华 王宝震 朱金顺 《遥感学报》 北大核心 2025年第9期2686-2699,共14页
地表温度是地表能量收支平衡和水循环过程的重要参数。热红外遥感是当前反演地表温度最重要数据源,劈窗算法是当前使用最广泛的反演算法。本文借鉴高分五号地表温度反演劈窗算法形式,结合高分五号B星(GF-5B)传感器波段光谱特性,构建了面... 地表温度是地表能量收支平衡和水循环过程的重要参数。热红外遥感是当前反演地表温度最重要数据源,劈窗算法是当前使用最广泛的反演算法。本文借鉴高分五号地表温度反演劈窗算法形式,结合高分五号B星(GF-5B)传感器波段光谱特性,构建了面向GF-5B热红外数据地表温度反演的两种劈窗算法形式,并考虑水汽对地表温度反演的影响,分别获取了不同水汽条件下的劈窗算法系数,对比分析选择精度最优的一种劈窗算法形式作为GF-5B热红外数据地表温度反演应用。采用改进的NDVI-NDWI阈值法与水汽劈窗协方差—方差比法分别估算地表发射率和大气水汽含量等算法所需要的关键参数。在4个不同地表类型的实验区对本文构建的算法进行地表温度反演应用,并利用HiWATER站点实测地表温度和MODIS地表温度产品进行反演结果验证。结果表明,白天和夜间反演地表温度的地面站点验证误差分别为1.88 K和0.99 K,夜间误差低于白天;与MOD11A1 LST产品交叉对比结果表明,除河北唐山实验区受云遮挡影响导致交叉对比结果较差,其余3个实验区交叉对比的温度差异不超过1.5 K;表明了本文构建的劈窗算法具有较高的地表温度反演精度。 展开更多
关键词 高分五号B星 热红外数据 地表温度 劈窗算法 地表发射率估算 大气水汽含量估算 精度验证 地面站点验证 地表温度交叉比对
原文传递
基于拆分学习实现邮件检测的研究和应用
13
作者 张双双 江旺 +1 位作者 范海亮 熊正坤 《工业控制计算机》 2025年第1期113-115,共3页
随着人工智能的迅速发展,越来越多的研究将BERT(Bidirectional Encoder Representations from Transformers)等大语言模型应用到了网络安全的检测技术中,邮件检测技术是最热门的应用场景之一。然而考虑到部署大模型所需要的资源和技术能... 随着人工智能的迅速发展,越来越多的研究将BERT(Bidirectional Encoder Representations from Transformers)等大语言模型应用到了网络安全的检测技术中,邮件检测技术是最热门的应用场景之一。然而考虑到部署大模型所需要的资源和技术能力,越来越多的客户转向主流的MaaS(Models-as-a-Service,MaaS)服务商。MaaS服务商凭借丰富的预训练模型和强大的训练服务,为用户提供了便捷的模型精调途径。然而,在金融领域,邮件数据往往涉及到公司内部的个人身份、商业机密等信息,直接披露给服务商会导致严重的隐私泄露风险。在模型更新可持续性发展上面临数据隐私泄露、计算资源有限等问题。为了解决这些问题,提出了一种基于拆分学习的邮件检测模型共享方法。该方法将BERT模型拆分为可在客户端上本地执行的部分和在服务器端上训练的部分,通过客户端对训练数据进行编码处理,保证了数据隐私的同时减少了传输到服务器端的数据量。服务器端收到客户端的编码信息后,结合BERT的后半部分进行效率高且安全的模型训练。最终,训练生成的模型更新回客户端,实现了模型的迭代优化和即时更新。 展开更多
关键词 BERT模型 拆分学习 邮件检测 数据安全
在线阅读 下载PDF
xk-split:基于k-medoids的分裂式聚类算法 被引量:2
14
作者 陈逸斐 虞慧群 《华东理工大学学报(自然科学版)》 CSCD 北大核心 2017年第6期849-854,862,共7页
近年来互联网数据规模呈爆炸式增长,如何对大数据进行分析已成为热门话题。然而,采集的数据很难直接用于分析,需要进行一定程度的预处理,以提高大数据质量。通过使用分裂式的迭代过程,可以逐步将数据集分裂为子集,避免了传统聚类算法聚... 近年来互联网数据规模呈爆炸式增长,如何对大数据进行分析已成为热门话题。然而,采集的数据很难直接用于分析,需要进行一定程度的预处理,以提高大数据质量。通过使用分裂式的迭代过程,可以逐步将数据集分裂为子集,避免了传统聚类算法聚类开始时需要确定集群数的限制,并降低了算法的时间复杂度。此外,通过基于阈值的噪声数据过滤,可以在迭代过程中剔除噪音数据,提升了聚类算法对脏数据的忍耐力。 展开更多
关键词 数据挖掘 聚类 K-MEANS k-medoids 分裂
在线阅读 下载PDF
Weighted total variation using split Bregman fast quantitative susceptibility mapping reconstruction method 被引量:1
15
作者 Lin Chen Zhi-Wei Zheng +4 位作者 Li-Jun Bao Jin-Sheng Fang Tian-He Yang Shu-Hui Cai Cong-Bo Cai 《Chinese Physics B》 SCIE EI CAS CSCD 2018年第8期645-654,共10页
An ill-posed inverse problem in quantitative susceptibility mapping (QSM) is usually solved using a regularization and optimization solver, which is time consuming considering the three-dimensional volume data. Howe... An ill-posed inverse problem in quantitative susceptibility mapping (QSM) is usually solved using a regularization and optimization solver, which is time consuming considering the three-dimensional volume data. However, in clinical diagnosis, it is necessary to reconstruct a susceptibility map efficiently with an appropriate method. Here, a modified QSM reconstruction method called weighted total variation using split Bregman (WTVSB) is proposed. It reconstructs the susceptibility map with fast computational speed and effective artifact suppression by incorporating noise-suppressed data weighting with split Bregman iteration. The noise-suppressed data weighting is determined using the Laplacian of the calculated local field, which can prevent the noise and errors in field maps from spreading into the susceptibility inversion. The split Bregman iteration accelerates the solution of the Ll-regularized reconstruction model by utilizing a preconditioned conjugate gradient solver. In an experiment, the proposed reconstruction method is compared with truncated k-space division (TKD), morphology enabled dipole inversion (MEDI), total variation using the split Bregman (TVSB) method for numerical simulation, phantom and in vivo human brain data evaluated by root mean square error and mean structure similarity. Experimental results demonstrate that our proposed method can achieve better balance between accuracy and efficiency of QSM reconstruction than conventional methods, and thus facilitating clinical applications of QSM. 展开更多
关键词 quantitative susceptibility mapping ill-posed inverse problem noise-suppressed data weighting split Bregman iteration
原文传递
SOPA:Source Routing Based Packet-Level Multi-Path Routing in Data Center Networks
16
作者 LI Dan LIN Du +1 位作者 JIANG Changlin Wang Lingqiang 《ZTE Communications》 2018年第2期42-54,共13页
Many "rich - connected" topologies with multiple parallel paths between smwers have been proposed for data center networks recently to provide high bisection bandwidth, but it re mains challenging to fully utilize t... Many "rich - connected" topologies with multiple parallel paths between smwers have been proposed for data center networks recently to provide high bisection bandwidth, but it re mains challenging to fully utilize the high network capacity by appropriate multi- path routing algorithms. As flow-level path splitting may lead to trafl'ic imbalance between paths due to flow- size difference, packet-level path splitting attracts more attention lately, which spreads packets from flows into multiple available paths and significantly improves link utilizations. However, it may cause packet reordering, confusing the TCP congestion control algorithm and lowering the throughput of flows. In this paper, we design a novel packetlevel multi-path routing scheme called SOPA, which leverag- es OpenFlow to perform packet-level path splitting in a round- robin fashion, and hence significantly mitigates the packet reordering problem and improves the network throughput. Moreover, SOPA leverages the topological feature of data center networks to encode a very small number of switches along the path into the packet header, resulting in very light overhead. Compared with random packet spraying (RPS), Hedera and equal-cost multi-path routing (ECMP), our simulations demonstrate that SOPA achieves 29.87%, 50.41% and 77.74% higher network throughput respectively under permutation workload, and reduces average data transfer completion time by 53.65%, 343.31% and 348.25% respectively under production workload. 展开更多
关键词 data center networks multi-path routing path splitting
在线阅读 下载PDF
街道拓扑形态与宜骑行性——天津多年跨度截面流量数据分析 被引量:2
17
作者 盛强 《西部人居环境学刊》 CSCD 北大核心 2024年第6期106-111,共6页
城市街道形态对促进非机动车使用有重要作用。现有文献多在宏观尺度分析密度对出行方式选择的影响,或在微观尺度聚焦个体骑行行为,缺乏中观尺度对空间结构自身作用的深入实证研究。本研究基于天津13个案例街区、401个街道断面以及2014年... 城市街道形态对促进非机动车使用有重要作用。现有文献多在宏观尺度分析密度对出行方式选择的影响,或在微观尺度聚焦个体骑行行为,缺乏中观尺度对空间结构自身作用的深入实证研究。本研究基于天津13个案例街区、401个街道断面以及2014年和2018年的实测交通截面流量对比,在街区和街道两个尺度分析非机动车道路使用情况受街道形态、轨道交通、城市密度、道路设计四大类因素的综合影响。研究发现四年非机动车占比明显增加,但其增量主要替代了步行而非机动车。在街区尺度,对非机动车出行影响最大的因素为商业密度,街道拓扑形态与建筑面积次之。在街道尺度,街道拓扑形态是影响非机动车流量分布的主导因素,建筑密度为辅助因素。本研究提出“小街区、顺路网”的街道拓扑形态更适宜支持骑行,有助于实现双碳目标。 展开更多
关键词 非机动车 街道拓扑形态 空间句法 出行方式选择 截面流量
在线阅读 下载PDF
一种适用于铀矿勘查无人值守航空物探数据自动分线方法
18
作者 贾化山 王培建 +3 位作者 李江坤 李兵海 刘忠 张光雅 《铀矿地质》 CAS CSCD 2024年第5期1002-1006,共5页
航空物探是重要高效的矿产勘查方法,在世界矿产勘查史上发挥了重要作用,其中航放测量更是铀矿勘查的重要方法,许多铀矿是航放测量直接发现的。航空物探测量作业时,飞机沿着设计测线依次飞行,当采用无人值守方式开展航空物探测量时,每架... 航空物探是重要高效的矿产勘查方法,在世界矿产勘查史上发挥了重要作用,其中航放测量更是铀矿勘查的重要方法,许多铀矿是航放测量直接发现的。航空物探测量作业时,飞机沿着设计测线依次飞行,当采用无人值守方式开展航空物探测量时,每架次采集的测量数据记录为单一文件,而后续数据处理需要按设计测网测线分别处理。目前采用人工手动分线,存在耗时长、易出错等不足,为此提出了一种自动分线方法,通过偏航距、速度、最短测线、基线长度、采样率等一系列参数设置,去除航路、拐弯、经过测线等所产生的极短线、短线,能快速、较准确地把测量数据按设计测线自动分开,提高了工作效率,减轻了数据处理人员的工作负担。 展开更多
关键词 自动分线 测量数据 偏航距 最短测线 测线间距
在线阅读 下载PDF
基于手机信令数据的城市通勤碳排放分析 被引量:2
19
作者 于谦 刘海海 +1 位作者 邱树荣 赵嘉雨 《武汉理工大学学报(交通科学与工程版)》 2024年第2期205-210,共6页
文中提出了一种在缺少用户个人社会经济属性数据的情况下,基于低频手机信令数据、POI数据、互联网位置数据,以及先验知识的面向宏观碳排放核算的出行方式判别方法,并通过基于实际通勤距离的自下而上碳排放计算方法实现不同通勤出行方式... 文中提出了一种在缺少用户个人社会经济属性数据的情况下,基于低频手机信令数据、POI数据、互联网位置数据,以及先验知识的面向宏观碳排放核算的出行方式判别方法,并通过基于实际通勤距离的自下而上碳排放计算方法实现不同通勤出行方式碳排放量化.基于提出的核算方法对上海市31 938人次的通勤碳排放进行了核算分析.结果表明:不同交通方式通勤碳排放量差异显著;存在高碳排放通勤群体,其样本量仅占总样本的11%,但其产生的碳排放占总量的55%.高碳排放通勤是长距离通勤和高碳排放出行方式共同影响的结果. 展开更多
关键词 通勤碳排放 手机信令数据 互联网位置数据 方式划分 生命周期碳排放
在线阅读 下载PDF
基于数据挖掘的人力资源数据缺失值填补方法 被引量:1
20
作者 曹旭 《自动化技术与应用》 2024年第6期133-136,155,共5页
现有人力资源数据缺失值填补方法均方根误差大、填补命中率低等问题。提出一种基于数据挖掘的人力资源数据缺失值填补方法。采用分裂Bregman迭代算法消除人力资源数据中存在的噪声,根据人力资源数据的时间序列特征,挖掘数据中存在的隐... 现有人力资源数据缺失值填补方法均方根误差大、填补命中率低等问题。提出一种基于数据挖掘的人力资源数据缺失值填补方法。采用分裂Bregman迭代算法消除人力资源数据中存在的噪声,根据人力资源数据的时间序列特征,挖掘数据中存在的隐藏变量。根据特征对缺失值进行检测。通过FCMSI算法根据缺失值检测结果对缺失值进行填补,采用平均比率法首次填充人力资源数据,通过模糊C均值聚类算法对填充后的数据进行聚类处理,其次在协同过滤思想的基础上进一步对人力资源数据的缺失值进行填补。实验结果表明,所提方法的均方根误差小、填补命中率高。 展开更多
关键词 数据挖掘 人力资源数据 分裂Bregman迭代算法 平均比率法 缺失值填补
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部