期刊文献+
共找到257篇文章
< 1 2 13 >
每页显示 20 50 100
基于Usage Metrics的中文学术论文用户平台偏好和兴趣偏好比较研究 被引量:3
1
作者 陈必坤 周慧娴 +1 位作者 钟周燕 王曰芬 《中国图书馆学报》 CSSCI 北大核心 2018年第6期90-104,共15页
研究中文学术论文用户使用模式有助于分析使用规律,为应用决策提供依据。本文以八个学科被CSSCI或CSCD收录的61本开放获取期刊发表于2014—2015年的学术论文为样本,以期刊官网和信息集成平台上的使用数据为来源,采用Usage Metrics的方法... 研究中文学术论文用户使用模式有助于分析使用规律,为应用决策提供依据。本文以八个学科被CSSCI或CSCD收录的61本开放获取期刊发表于2014—2015年的学术论文为样本,以期刊官网和信息集成平台上的使用数据为来源,采用Usage Metrics的方法,从用户平台偏好和用户兴趣偏好两方面比较中文学术论文的用户使用模式。研究发现:(1)期刊官网与信息集成平台的用户平台偏好存在差异。一是从学科视角看,用户整体上倾向于使用期刊官网而不是信息集成平台获取所需论文,而社会科学的信息集成平台篇均下载次数均大于自然科学。二是从期刊视角看,社会科学用户比自然科学用户更倾向于使用信息集成平台获取所需论文;与信息集成平台相比,期刊官网的用户下载数据呈现更为明显的"两级分化"现象;期刊官网下载次数与信息集成平台下载次数整体上的相关性较低。(2)期刊官网与信息集成平台的用户兴趣偏好存在差异。每本期刊官网和信息集成平台下载次数前20%的学术论文的Jaccard相似系数较低;在所列举的图书馆、情报与文献学中,期刊官网与信息集成平台的用户关注主题不同。 展开更多
关键词 学术文献 使用数据 USAGE Metdcs 学术期刊 学术交流 使用模式
在线阅读 下载PDF
城市物联网采集数据可信度量机制研究
2
作者 陈磊 张森 张嘉浩 《信息安全研究》 北大核心 2026年第2期109-117,共9页
物联网设备的多样性、异构性以及广泛的分布特性,使其运行过程面临感知设备数据源遭受伪造或篡改的风险.而目前智慧城市多域物联网场景下存在信任评估模型动态适应性较差、应对安全威胁能力单一等问题.从物联网的宏观运行角度出发,融合... 物联网设备的多样性、异构性以及广泛的分布特性,使其运行过程面临感知设备数据源遭受伪造或篡改的风险.而目前智慧城市多域物联网场景下存在信任评估模型动态适应性较差、应对安全威胁能力单一等问题.从物联网的宏观运行角度出发,融合可信计算技术,构建了面向物联网设备节点的静态属性度量和动态属性度量机制.通过聚类算法划分信任类别,建立了面向多源异构物联网设备的综合可信度量机制.通过面向多域分布式物联网架构的仿真模拟实验,验证了提出的可信度量方案能够有效检测恶意节点的初始恶意传播,并将恶意传播限制在较小的范围内,可以有效应对不同恶意节点比例下的安全挑战. 展开更多
关键词 可信度量 智慧城市 物联网 多源异构 数据采集
在线阅读 下载PDF
基于DTW M的时序邻域特征选择算法
3
作者 杨璇 王潇婉 +1 位作者 胡灵芝 吴迪 《计算机应用研究》 北大核心 2026年第1期170-177,共8页
现实生活中广泛存在的高维时序数据常常具有决策属性且时间长度不等的特点,使得现有的邻域粗糙集特征选择算法不再适用或分类性能下降。为了解决该问题,提出了一种基于DTW M度量的高维时序数据的特征选择方法。首先,引入马氏距离定义高... 现实生活中广泛存在的高维时序数据常常具有决策属性且时间长度不等的特点,使得现有的邻域粗糙集特征选择算法不再适用或分类性能下降。为了解决该问题,提出了一种基于DTW M度量的高维时序数据的特征选择方法。首先,引入马氏距离定义高维动态时间扭曲距离(DTW M)用于度量属性间的相似性;接着定义了时序决策信息系统,用于存放非等长高维时序数据;提出基于DTW M距离度量的时序邻域关系和时序邻域粗糙集模型;最后通过定义内、外重要度,给出了属性依赖度作为筛选和提出属性的重要指标,进而提出了基于DTW M度量的高维时序数据的特征选择方法。通过五个公开数据集上的实验结果表明,所提算法较其他算法在分类精度上平均提升了14.2%和21.7%,充分证明了其有效性和优越性。 展开更多
关键词 特征选择 高维时序数据 DTW M度量 马氏距离 邻域粗糙集
在线阅读 下载PDF
中文学术成果评价的Altmetrics发展及实践路径 被引量:5
4
作者 韩毅 《西华大学学报(哲学社会科学版)》 2018年第1期81-86,共6页
为有效解决中文学术成果评价的Altmetrics应用问题,针对中文环境下Altmetrics评价数据基础设施缺失现状,在综述Altmetrics思想、方法、技术发展历程及中文学术成果应用实践的基础上,提出中文学术成果Altmetrics评价需要解决三方面的问题... 为有效解决中文学术成果评价的Altmetrics应用问题,针对中文环境下Altmetrics评价数据基础设施缺失现状,在综述Altmetrics思想、方法、技术发展历程及中文学术成果应用实践的基础上,提出中文学术成果Altmetrics评价需要解决三方面的问题:利益相关者的Altmetrics应用诉求识别,中文Altmetrics工具开发,以引文为基础的传统计量与以网络空间数据为基础的Altmetrics计量的融合模型。只有解决中文环境下Altmetrics评价的这些基础性问题,中文学术成果评价才会具有坚实的数据基础设施。 展开更多
关键词 中文学术成果 成果评价 Altmetrics 利益相关者 网络数据基础设施 计量融合模型 数据搜集与分析 工具
在线阅读 下载PDF
开放数据计量研究综述:计算网络用户行为和科学社群影响力的Altmetrics计量 被引量:52
5
作者 顾立平 《现代图书情报技术》 CSSCI 北大核心 2013年第6期1-8,共8页
简要介绍Altmetrics利用社会网络使用数据来推荐信息检索排名次序以及与其他影响指标改变学术评价方式的优势。经过案例观察分析,描绘Altmetrics.com的开放数据框架,特别是它对论文级别计量的专业服务。着重分析两篇可以提升实证检验方... 简要介绍Altmetrics利用社会网络使用数据来推荐信息检索排名次序以及与其他影响指标改变学术评价方式的优势。经过案例观察分析,描绘Altmetrics.com的开放数据框架,特别是它对论文级别计量的专业服务。着重分析两篇可以提升实证检验方法的核心文章,形成简要的可操作的工作流程;讨论开放存储、开放出版支持与新的嵌入研究团队的信息服务等图书馆新的知识服务议题。 展开更多
关键词 替代计量 影响测度 使用网络 引用网络 社会网络 开放科研数据 论文级别计量
原文传递
车联网中基于度量本地差分隐私的集合数据隐私保护机制
6
作者 唐聪 薛乔 +1 位作者 王箭 张焱 《电讯技术》 北大核心 2026年第1期117-125,共9页
现有的针对集合型数据的隐私保护机制如果直接应用到车联网中会对频率分布估计结果的准确度造成很大影响。针对这一不足,提出了一种基于度量本地差分隐私模型的对称差私有集合(Symmetric Difference Private Set,SDPrivSet)协议。该协议... 现有的针对集合型数据的隐私保护机制如果直接应用到车联网中会对频率分布估计结果的准确度造成很大影响。针对这一不足,提出了一种基于度量本地差分隐私模型的对称差私有集合(Symmetric Difference Private Set,SDPrivSet)协议。该协议中,用户在本地将数据扰动后提交给服务器,服务器则根据接收到的扰动数据估计出真实数据的频率分布。该协议提供了严格的数据隐私保护,在用户端和服务器端具有低计算开销,并且在进行统计分析时具有高数据效用。在真实数据集上的实验结果表明,SDPrivSet协议在任意原始数据域和集合大小以及隐私预算下性能都是最优的,相较于现有协议提升了至少34.20%,并且在集合大小和隐私预算较大时性能提升更为明显。 展开更多
关键词 车联网 度量本地差分隐私 频率估计 集合型数据 隐私保护
在线阅读 下载PDF
基于METRIC模型的巴基斯坦农业区蒸散量估算 被引量:4
7
作者 张萧楠 沈彦军 +3 位作者 李红军 张晓龙 李琪云 王艺璇 《中国生态农业学报(中英文)》 CAS CSCD 北大核心 2024年第11期1927-1939,共13页
蒸散量是水分循环和能量循环的重要载体,精确估算农田蒸散量对农业水资源管理具有重要意义。巴基斯坦农业区是世界上重要的灌溉农区之一,如何基于遥感技术估算区域实际蒸散量成为农业水资源精细化管理的基础和前提。本文利用MODIS数据... 蒸散量是水分循环和能量循环的重要载体,精确估算农田蒸散量对农业水资源管理具有重要意义。巴基斯坦农业区是世界上重要的灌溉农区之一,如何基于遥感技术估算区域实际蒸散量成为农业水资源精细化管理的基础和前提。本文利用MODIS数据、气象数据以及DEM数据,采用METRIC模型,估算了2019—2020年巴基斯坦农业区的实际蒸散量,并分析了不同作物生育期蒸散量的时空分布特征,以期为巴基斯坦农业水资源合理利用提供科学依据。研究结果表明:1)比较基于METRIC模型在日尺度和月尺度的蒸散估算结果与农业站点蒸渗仪的实际观测数据发现,二者的均方根误差分别为1.2 mm∙d^(−1)和25 mm∙month^(−1),相关系数分别为0.65和0.84;在空间上,与ETMonitor产品比较,METRIC模型估算结果的空间分布和量级更为合理。2)巴基斯坦农业区蒸散量的空间分布与种植结构密切相关,蒸散量自北向南总体呈阶梯递减格局,小麦、棉花、水稻和甘蔗生育期累积蒸散量分别为392 mm、652 mm、745 mm和1224 mm;就同一种作物来说,旁遮普省作物生育期累积蒸散量高于信德省。3)小麦生育期内月蒸散量呈先下降再上升后下降的变化特征;旁遮普省棉花生育期内月蒸散量呈“单峰”变化特征,信德省棉花生育期内月蒸散量呈“双峰”变化特征;水稻和甘蔗生育期内月蒸散量呈“单峰”变化特征。本研究实现了METRIC模型在巴基斯坦农业区的参数本地化应用和适用性分析,为基于遥感手段估算区域或农作物尺度蒸散量提供了方法借鉴,对揭示不同作物蒸散耗水的时空特征和区域农业水资源管理具有重要意义。 展开更多
关键词 蒸散量 metric模型 能量平衡 MODIS数据 巴基斯坦农业区
在线阅读 下载PDF
Exploring users' within-site navigation behavior:A case study based on clickstream data 被引量:1
8
作者 Tingting JIANG Yu CHI Wenrui JIA 《Chinese Journal of Library and Information Science》 2014年第4期63-76,共14页
Purpose:The goal of our research is to suggest specific Web metrics that are useful for evaluating and improving user navigation experience on informational websites.Design/methodology/approach:We revised metrics in a... Purpose:The goal of our research is to suggest specific Web metrics that are useful for evaluating and improving user navigation experience on informational websites.Design/methodology/approach:We revised metrics in a Web forensic framework proposed in the literature and defined the metrics of footprint,track and movement.Data were obtained from user clickstreams provided by a real estate site’s administrators.There were two phases of data analysis with the first phase on navigation behavior based on user footprints and tracks,and the second phase on navigational transition patterns based on user movements.Findings:Preliminary results suggest that the apartment pages were heavily-trafficked while the agent pages and related information pages were underused to a great extent.Navigation within the same category of pages was prevalent,especially when users navigated among the regional apartment listings.However,navigation of these pages was found to be inefficient.Research limitations:The suggestions for navigation design optimization provided in the paper are specific to this website,and their applicability to other online environments needs to be verified.Preference predications or personal recommendations are not made during the current stage of research.Practical implications:Our clickstream data analysis results offer a base for future research.Meanwhile,website administrators and managers can make better use of the readily available clickstream data to evaluate the effectiveness and efficiency of their site navigation design.Originality/value:Our empirical study is valuable to those seeking analysis metrics for evaluating and improving user navigation experience on informational websites based on clickstream data.Our attempts to analyze the log file in terms of footprint,track and movement will enrich the utilization of such trace data to engender a deeper understanding of users’within-site navigation behavior. 展开更多
关键词 Web navigation User behavior Clickstream data analysis metrics Resale apartment website
原文传递
A Framework for Identifying and Managing Information Quality Metrics of Corporate Performance Management System
9
作者 Kunlaya Pattanagul Wachara Chantatub Wasu Chaopanon 《Journal of Modern Accounting and Auditing》 2012年第2期185-194,共10页
Corporate Performance Management (CPM) system is an information system used to collect, analyze, and visualize key performance indicators (KPIs) to support both business operations and especially strategic decisio... Corporate Performance Management (CPM) system is an information system used to collect, analyze, and visualize key performance indicators (KPIs) to support both business operations and especially strategic decisions. CPM systems display KPIs in forms of scorecard and dashboard so the executives can keep track and evaluate corporate performance. The quality of the information as shown in the KPIs is very crucial for the executives to make the right decisions. Therefore, it is important that the executives must be able to retrieve not only the KPIs but also the quality of those KPIs before using such KPIs in their strategic decisions. The objectives of this study were to determine the role of the CPM system in the organizations, current data and information quality state, problems and perspectives regarding data quality, as well as data quality maturity stage of the organizations. Survey research was used in this study; a questionnaire was sent to collect data from 477 corporations listed in the Stock Exchange of Thailand (SET) on January, 2011. Forty-nine questionnaires were returned. The results show that about half of the organizations have implemented CPM systems. Most organizations are confident in the information in CPM system, but information quality issues are commonly found. Frequent problems regarding information quality are information not up to date, information not ready by time of use, inaccuracy and incomplete. The most concerned and frequently assessed quality dimensions were security, accuracy, completeness, and validity. When asked to prioritize, the most important quality dimensions are accuracy, timeliness, completeness, security, and validity respectively. In addition, most organizations concern about data govemance management and have deployed such measures. This study showed that most organizations are on level 4 on Gartner's data governance maturity stage in which data governance is concerned and managed, but still not effective. 展开更多
关键词 data quality corporate performance management (CPM) system data quality metrics key performanceindicators (KPIs) data maturity and management
在线阅读 下载PDF
Mining Metrics for Enhancing E-Commerce Systems User Experience
10
作者 Antonia Stefani 《Intelligent Information Management》 2022年第1期25-51,共27页
The diversity of e-commerce Business to Consumer systems and the significant increase in their use during the COVID-19 pandemic as a one of the primary channels of retail commerce, has made all the most important the ... The diversity of e-commerce Business to Consumer systems and the significant increase in their use during the COVID-19 pandemic as a one of the primary channels of retail commerce, has made all the most important the need to measuring their quality using practical methods. This paper presents a quality evaluation framework for web metrics that are B2C specific. The framework uses three dimensions based on end-user interaction categories, metrics internal specs and quality sub-characteristics as defined by ISO25010. Beginning from the existing large corpus of general-purpose web metrics, e-commerce specific metrics are chosen and categorized. Analysis results are subjected to a data mining analysis to provide association rules between the various dimensions of the framework. Finally, an ontology that corresponds to the framework is developed to answer to complicated questions related to metrics use and to facilitate the production of new, user defined meta-metrics. 展开更多
关键词 E-COMMERCE Web metrics Quality Attributes data Mining Association Rules Evaluation Framework TAXONOMY ONTOLOGY ISO25010
在线阅读 下载PDF
异质环境下原型联邦学习模型距离校正与聚合算法
11
作者 王鑫 丁雪爽 《计算机工程与应用》 北大核心 2025年第7期176-187,共12页
针对联邦学习中因客户端数据集非独立同分布及设备算力参差不齐所导致的模型偏差大、收敛不稳定及泛化性差等问题,提出了一种基于原型联邦学习模型距离校正与聚合算法(FedMPD)。FedMPD在客户端本地构建嵌入网络提取异质数据特征,并通过... 针对联邦学习中因客户端数据集非独立同分布及设备算力参差不齐所导致的模型偏差大、收敛不稳定及泛化性差等问题,提出了一种基于原型联邦学习模型距离校正与聚合算法(FedMPD)。FedMPD在客户端本地构建嵌入网络提取异质数据特征,并通过设置局部与全局原型的修正项来校正客户端模型。此外,算法引入了原型距离约束条件,允许客户端根据局部原型与全局原型的距离阈值自适应调整训练周期,以缓解设备异质性的影响。在模型聚合阶段,FedMPD采用了一种加权聚合策略,该策略综合考虑客户端的数据量和局部原型质量,以更准确地量化不同客户端对全局模型的贡献度。实验结果表明,FedMPD在模型收敛稳定性、测试损失降低以及测试精度提升等方面均显著优于传统联邦学习算法,为异质环境下联邦学习提供了一种稳定、高效且逻辑严谨的方法。 展开更多
关键词 联邦学习 原型学习 对比损失 度量学习 异质性数据处理
在线阅读 下载PDF
基于细粒度访问控制的密文域可逆信息隐藏
12
作者 张敏情 彭深 +2 位作者 姜超 狄富强 董钰峰 《通信学报》 北大核心 2025年第7期119-131,共13页
为提高云环境下密文域可逆信息隐藏算法的嵌入率和安全性,将密文策略属性基加密和密文域可逆信息隐藏有机结合,提出一种基于细粒度访问控制的密文域可逆信息隐藏算法。首先,根据预测误差范围对像素进行分类,利用参数二叉树对不同类别的... 为提高云环境下密文域可逆信息隐藏算法的嵌入率和安全性,将密文策略属性基加密和密文域可逆信息隐藏有机结合,提出一种基于细粒度访问控制的密文域可逆信息隐藏算法。首先,根据预测误差范围对像素进行分类,利用参数二叉树对不同类别的像素进行标记;其次,基于密文策略属性基加密算法对图像加密密钥进行加密,将加密后的密钥和需要隐藏的信息嵌入密文图像中。实验结果表明,所提算法将不可嵌入像素分为自记录像素和不可记录像素后,辅助信息量减少,从而增大了嵌入容量。相较于现有最佳算法,所提算法平均嵌入率提高约0.2 bit/pixel,同时能够实现对密文图像的细粒度访问控制,具有嵌入率大、安全性高、可逆性好等特点,实用性较强。 展开更多
关键词 密文策略属性基加密 密文域 可逆信息隐藏 访问控制 参数二叉树标记
在线阅读 下载PDF
标准驱动的本体质量评估模型研究
13
作者 袁满 刘国娇 +1 位作者 袁靖舒 翟可欣 《吉林大学学报(信息科学版)》 2025年第3期605-614,共10页
针对目前数据治理领域本体质量评估模型普遍缺乏标准化支持的问题,构建一个标准的本体质量评估模型具有极其重要意义。为此,首先研究ISO/IEC 25012数据质量标准对维度的标准化定义;其次采用GQM(Goal-Question-Metric)方法论为指导定义... 针对目前数据治理领域本体质量评估模型普遍缺乏标准化支持的问题,构建一个标准的本体质量评估模型具有极其重要意义。为此,首先研究ISO/IEC 25012数据质量标准对维度的标准化定义;其次采用GQM(Goal-Question-Metric)方法论为指导定义每个维度下的指标,实现指标到维度的映射;然后在W3C(World Wide Web Consortium)提出的DQV(Data Quality Vocabulary)数据质量模型的基础上进行扩展,构建出一个具备可扩展性和鲁棒性的本体质量模型。通过提出的质量评估模型提供统一的、规范的术语体系描述本体质量的各个要素,为本体质量评估提供了一个标准化的质量知识表示模型。最后以本体完整性维度为例,构建相应的质量评估模型,并使用井下作业数据集验证了模型的可行性,有效地解决数据治理领域本体质量评估模型普遍缺乏标准化的问题,为数据治理领域提供了一个统一、规范的术语体系描述本体质量的各个要素。 展开更多
关键词 本体评估 质量维度 质量评估模型 数据质量词汇 质量-目标-指标方法论
在线阅读 下载PDF
Cyclomatic Complexity-Based Encapsulation, Data Hiding, and Separation of Concerns
14
作者 Charles W. Butler Thomas J. McCabe 《Journal of Software Engineering and Applications》 2021年第1期44-66,共23页
<div style="text-align:justify;"> <span style="font-family:Verdana;">Three design principles are prominent in software development-encapsulation, data hiding, and separation of concerns... <div style="text-align:justify;"> <span style="font-family:Verdana;">Three design principles are prominent in software development-encapsulation, data hiding, and separation of concerns. These principles are used as subjective quality criteria for both procedural and object-oriented applications. The purpose of research is to quantify encapsulation, data hiding, and separation of concerns is quantified using cyclomatic-based metrics. As a result of this research, the derived design metrics, coefficient of encapsulation, coefficient of data hiding, and coefficient of separation of concerns, are defined and applied to production software indicating whether the software has low or high encapsulation, data hiding, and separation of concerns.</span> </div> 展开更多
关键词 Object-Oriented Design Methods RELIABILITY Complexity Measures Software Design ENCAPSULATION Information Hiding Separation of Concerns McCabe metrics Coefficient of Encapsulation Coefficient of data Hiding Coefficient of Separation of Concerns
在线阅读 下载PDF
基于密度的多度量空间数据聚类算法 被引量:2
15
作者 朱轶凡 罗程阳 +3 位作者 马瑞遥 陈璐 毛玉仁 高云君 《软件学报》 北大核心 2025年第2期851-873,共23页
具有噪声的基于密度的数据聚类(DBSCAN)算法是数据挖掘领域中的经典方法之一,其不仅能发现数据中潜藏的复杂关系,还能过滤其中的数据噪声,从而获得高质量的数据聚类.然而,现有的基于密度的数据聚类算法仅支持单模态(类型)数据的聚类,难... 具有噪声的基于密度的数据聚类(DBSCAN)算法是数据挖掘领域中的经典方法之一,其不仅能发现数据中潜藏的复杂关系,还能过滤其中的数据噪声,从而获得高质量的数据聚类.然而,现有的基于密度的数据聚类算法仅支持单模态(类型)数据的聚类,难以应对多模态(类型)数据并存的应用场景.随着信息技术的快速发展,数据呈现多模态化的发展态势,现实生活中的数据不再是单一的数据类型,而是多种数据模态(类型)的组合,如文本、图像、地理坐标、数据特征等.因此,现有的数据聚类方法难以对复杂的多模态数据进行有效的数据建模,更无法进行高效的多模态数据聚类.基于此,提出一种基于密度的多度量空间聚类算法.首先,为了刻画多模态数据间的复杂关系,利用多度量空间表征数据之间的相似性关系,并且利用聚合多度量图索引(AMG)实现多模态数据建模.接着,利用差分化的相似性关系优化聚合多度量图的图结构,并且结合最优策略优先的搜索策略进行剪枝,以实现高效的多模态数据聚类.最后,在真实与合成数据集上针对多种参数设置进行实验.实验结果验证了所提方法运行效率提升了至少1个数量级,并具有较高的聚类精度与良好的可扩展性. 展开更多
关键词 多度量空间 多度量图 基于密度的数据聚类 数据挖掘 多模态数据
在线阅读 下载PDF
互联网应用功能使用数据监测系统设计
16
作者 柴群丰 《移动信息》 2025年第7期308-310,共3页
现代互联网应用软件具有敏捷开发和快速迭代的特点,对用户数据的监测带来更大的挑战。文中提出了一种基于InfluxDB与Grafana的互联网应用功能使用数据监测系统设计方案,通过统一的数据定义、统一的数据发送方式以及统一的报表展示,使得... 现代互联网应用软件具有敏捷开发和快速迭代的特点,对用户数据的监测带来更大的挑战。文中提出了一种基于InfluxDB与Grafana的互联网应用功能使用数据监测系统设计方案,通过统一的数据定义、统一的数据发送方式以及统一的报表展示,使得用户功能使用相关的数据监测变得易用、高效且易于展示。 展开更多
关键词 互联网应用 数据监测 InfluxDB Grafana 数据展示 TELEMETRY metrics
在线阅读 下载PDF
自动气象站数据字典自维护算法研究
17
作者 宋美蓉 《河北软件职业技术学院学报》 2025年第2期9-12,54,共5页
自动气象站中业务数据的形成,以及程序运行流程等多种情况都会用到数据字典。由于自动气象站数据字典中元素多、流程复杂导致程序极易出现错误,因此提出数据字典自动维护方法。经过精确查找,筛选出需要订正与维护的数据,通过求概率距离... 自动气象站中业务数据的形成,以及程序运行流程等多种情况都会用到数据字典。由于自动气象站数据字典中元素多、流程复杂导致程序极易出现错误,因此提出数据字典自动维护方法。经过精确查找,筛选出需要订正与维护的数据,通过求概率距离、词性距离,选出可能匹配的值,再结合哈希字典进行校正以达到对整个数据字典自动维护的效果,减少不必要的错误与程序员的排错时间。 展开更多
关键词 自动气象站 数据字典 概率距离 词性距离 哈希字典
在线阅读 下载PDF
基于数据挖掘的翼型气动隐身多学科分析 被引量:1
18
作者 金世轶 陈树生 +1 位作者 杨华 高正红 《航空动力学报》 北大核心 2025年第8期160-173,共14页
在翼型气动隐身多学科设计中,涉及目标的多样性以及变量之间的相互耦合关系,增大了其优化设计的计算成本和研发周期。针对翼型升力系数、阻力系数、俯仰力矩系数、升阻比、垂直极化雷达散射面积、水平极化雷达散射面积这6个目标,开展了... 在翼型气动隐身多学科设计中,涉及目标的多样性以及变量之间的相互耦合关系,增大了其优化设计的计算成本和研发周期。针对翼型升力系数、阻力系数、俯仰力矩系数、升阻比、垂直极化雷达散射面积、水平极化雷达散射面积这6个目标,开展了基于随机森林、自适应增强集成学习、自组织映射、等度量映射这4种算法的数据挖掘。在目标与设计变量的分析中,翼型的气动隐身性能受设计变量前缘和后缘弯度影响较大,而受弦长段的影响次之。较大的前缘弯度可以减小阻力,改善隐身性能但增大俯仰力矩系数;较小的后缘弯度可以改善升力系数、升阻比和隐身性能,同时减小俯仰力矩系数。通过数据挖掘,给出了设计变量的具体参考范围以得到气动隐身性能较优的翼型。 展开更多
关键词 气动隐身设计 数据挖掘 随机森林 自适应增强算法 自组织映射 等度量映射
原文传递
少样本学习在心律失常检测中的应用综述
19
作者 甘戴楠 詹晓林 +1 位作者 黄丽 李嘉 《医疗卫生装备》 2025年第8期104-112,共9页
介绍了少样本学习在检测心律失常中的应用优势,综述了度量学习、迁移学习及数据增强等少样本学习策略在心律失常检测中的应用现状,分析了少样本学习应用于心律失常检测的局限性,指出了探索图神经网络和开发新型增量学习技术是未来的发... 介绍了少样本学习在检测心律失常中的应用优势,综述了度量学习、迁移学习及数据增强等少样本学习策略在心律失常检测中的应用现状,分析了少样本学习应用于心律失常检测的局限性,指出了探索图神经网络和开发新型增量学习技术是未来的发展方向。 展开更多
关键词 少样本学习 心律失常 度量学习 迁移学习 数据增强
在线阅读 下载PDF
基于稀疏子空间聚类算法的高维数据聚类研究
20
作者 王成礼 王洁 陈乃健 《自动化与仪器仪表》 2025年第1期84-88,共5页
针对医疗数据规模大、维度高的问题,由于采用传统的聚类算法对其处理计算复杂度较高,且准确率较低。研究基于稀疏子空间聚类算法设计了一种医疗数据分类方法,并引入了无监督度量学习对分类中的预处理过程进行优化,提出一种结合稀疏子空... 针对医疗数据规模大、维度高的问题,由于采用传统的聚类算法对其处理计算复杂度较高,且准确率较低。研究基于稀疏子空间聚类算法设计了一种医疗数据分类方法,并引入了无监督度量学习对分类中的预处理过程进行优化,提出一种结合稀疏子空间聚类算法和无监督度量学习的高维医疗数据分类方法。结果显示,设计方法的平均概率兰德指数为0.85,高于其他算法,设计方法的平均信息变化指数为1.54,低于其他算法,证明其鲁棒性较强。在不同数据集上,设计方法的误分率分别为1.2%和0.9%,证明了其分类精度较高。设计方法在处理高维医疗数据方面具有较高的可靠性,其能够在医疗数据分析领域发挥重要作用,并为精准医疗、疾病预测和诊断提供有力的支持。 展开更多
关键词 医疗数据 高维 稀疏子空间聚类 无监督度量学习
原文传递
上一页 1 2 13 下一页 到第
使用帮助 返回顶部