期刊文献+
共找到12,237篇文章
< 1 2 250 >
每页显示 20 50 100
大数据框架下基于相似度计算模型的用户位置检测
1
作者 梁广荣 《信息技术与信息化》 2025年第8期48-51,共4页
针对现有用户位置检测算法存在的定位检测误判率较高的不足,在大数据框架下设计了一种基于相似度计算模型的检测算法。在Hadoop大数据平台上布置各核心组件,平台能够提供可追溯的SQL查询功能,在大数据框架下提取网络用户移动轨迹的五要... 针对现有用户位置检测算法存在的定位检测误判率较高的不足,在大数据框架下设计了一种基于相似度计算模型的检测算法。在Hadoop大数据平台上布置各核心组件,平台能够提供可追溯的SQL查询功能,在大数据框架下提取网络用户移动轨迹的五要素特征,同步构建多尺度的相似度模型,分别计算用户移动点群分布范围的相似度和距离相似度。为提升模型应对大规模用户位置数据集的能力,通过构建深度卷积网络模型用于训练复杂的位置数据集,提升对用户位置检测的精度。仿真结果显示:提升检测算法的用户位置检测误判率仅为2%,优于两种传统的用户检测算法而且随着测试集规模的增加,检测误判率指标未出现提升趋势,表明算法的稳定性良好。 展开更多
关键词 大数据框架 相似度计算模型 距离相似度 误判率
在线阅读 下载PDF
基于相似度组合的航海英语听力会话内容评分的研究
2
作者 栾鑫 邵国余 赵磊 《珠江水运》 2025年第17期122-125,共4页
随着全球航运业的快速发展,对航海人员英语沟通能力的要求日益提高。航海英语听力与会话能力作为海员适任的重要能力之一,其有效评估对于提升海员英语水平具有重要意义。本文提出了一种基于相似度组合的航海英语听力会话内容评分方法,... 随着全球航运业的快速发展,对航海人员英语沟通能力的要求日益提高。航海英语听力与会话能力作为海员适任的重要能力之一,其有效评估对于提升海员英语水平具有重要意义。本文提出了一种基于相似度组合的航海英语听力会话内容评分方法,通过构建航海英语专用词典、改进关键词相似度和文本相似度计算方法,实现了对航海英语听力会话内容的自动评分。实验结果表明,该模型在MAE、RMSE及准确率等指标上均表现出显著优势,为航海英语听力教学的智能化评估提供了新思路。 展开更多
关键词 航海英语听力会话 相似度组合 关键词相似度 文本相似度
在线阅读 下载PDF
基于差动正序分量波形相似度的海上风电低频输电线路保护方法 被引量:1
3
作者 高淑萍 周永宁 +3 位作者 王晨清 陈实 宋国兵 权喆 《电力系统保护与控制》 北大核心 2025年第11期95-104,共10页
海上风电低频输电线路故障受双侧电力电子换流器控制策略影响,其故障特征以及对传统保护的影响较为复杂。基于双端换流器控制策略和故障复合序网,从理论上分析传统电流差动保护的适应性,得到存在拒动风险的结论。结合故障后电压、电流... 海上风电低频输电线路故障受双侧电力电子换流器控制策略影响,其故障特征以及对传统保护的影响较为复杂。基于双端换流器控制策略和故障复合序网,从理论上分析传统电流差动保护的适应性,得到存在拒动风险的结论。结合故障后电压、电流波形特点,提出基于差动正序分量波形相似度的保护方法。该方法首先提取线路两侧保护安装处电流与电压的故障分量,利用对称分量法得到故障分量所对应差动电流与差动电压的正序分量,对正序差动电压进行修正。然后,利用改进余弦相似度计算差动电流与修正差动电压正序分量的相关程度,通过相关性的差异来识别区内、外故障。最后,在PSCAD中搭建了海上低频输电系统模型,对线路中发生不同故障位置、故障类型、不同过渡电阻和采样频率的故障情况进行分析,验证了所提保护方法的快速性和有效性。 展开更多
关键词 海上风电 低频输电系统 线路保护 对称分量法 改进余弦相似度
在线阅读 下载PDF
“求同”还是“存异”?技术足迹相似度、环境动态性与企业关键核心技术创新 被引量:4
4
作者 龚红 丁梦梦 胡思源 《南开管理评论》 北大核心 2025年第4期86-97,共12页
在走出“卡脖子”困境和高质量发展的现实诉求下,企业如何有效进行技术变革,重构知识体系以实现关键核心技术创新成为极具价值的现实问题。本文基于知识基础观,探讨了行业和历史两大参照标准下的技术足迹相似度与企业关键核心技术创新... 在走出“卡脖子”困境和高质量发展的现实诉求下,企业如何有效进行技术变革,重构知识体系以实现关键核心技术创新成为极具价值的现实问题。本文基于知识基础观,探讨了行业和历史两大参照标准下的技术足迹相似度与企业关键核心技术创新之间的关系,以及环境动态性的调节作用。本文采集394家制造企业2000~2022年21.8万条专利题录数据,利用固定效应负二项模型开展实证研究,结果表明:行业技术足迹相似度、历史技术足迹相似度与企业关键核心技术创新之间均呈倒U型关系,即企业的技术发展足迹与行业整体及自身过往保持适度的相似最有利于实现关键核心技术创新。此外,当外部环境动态性较高时,技术足迹相似度与企业关键核心技术创新之间的非线性关系会得到进一步强化。本文在一定程度上丰富了知识视角下的微观个体关键核心技术突破路径相关研究,为我国企业明确技术发展方向、实现创新升级提供了有益参考。 展开更多
关键词 关键核心技术创新 技术足迹相似度 环境动态性
在线阅读 下载PDF
基于概率相似度的不完备数据填补研究
5
作者 仝利红 孙士保 《现代电子技术》 北大核心 2025年第4期79-82,共4页
为提升数据的完整性,保证数据的效用程度,提出一种基于概率相似度的不完备数据填补方法。量化计算不完备数据的概率相似度矩阵,将计算结果和ROUSTIDA算法相结合进行不完备数据填补,获取完备数据集。在此基础上,构建决策规则,保证多属性... 为提升数据的完整性,保证数据的效用程度,提出一种基于概率相似度的不完备数据填补方法。量化计算不完备数据的概率相似度矩阵,将计算结果和ROUSTIDA算法相结合进行不完备数据填补,获取完备数据集。在此基础上,构建决策规则,保证多属性缺失数据的填补性能,并且设定可辨识矩阵优化算法的不完备数据填补效果。测试结果显示,所提方法能够计算不同数据对象之间的相似度值,可有效完成数据填补,填补后数据的完备程度均在95%以上,填补数据的填补值误差均在0.17以下,填补效果良好。 展开更多
关键词 概率相似度 不完备数据 数据填补 ROUSTIDA算法 相似度矩阵 可辨识矩阵 决策规则
在线阅读 下载PDF
基于数据表相似度的军事实体数据融合方法
6
作者 吴波 李晓婷 +2 位作者 刘波 王凯 郑博 《火力与指挥控制》 北大核心 2025年第4期177-182,189,共7页
在数据架构顶层规范指导下,多源数据融合需消除数十个领域数据之间内容重复、数据冲突等问题。在此业务过程中,需人工从大量数据表中筛选出相似表,效率低下。为解决这些问题,提出一种基于数据表相似度的军事实体数据融合方法:通过数据... 在数据架构顶层规范指导下,多源数据融合需消除数十个领域数据之间内容重复、数据冲突等问题。在此业务过程中,需人工从大量数据表中筛选出相似表,效率低下。为解决这些问题,提出一种基于数据表相似度的军事实体数据融合方法:通过数据表名和字段名相似度排除业务不相关的表,利用互信息量计算表之间各列值的相关性,帮助作业人员快速找出关联度高的实体数据表,提高实体数据属性融合效率。 展开更多
关键词 相似度 互信息量 数据融合 军事实体数据 文本相似度 规则引擎
在线阅读 下载PDF
融合相似度与随机森林的数据挖掘算法改进 被引量:1
7
作者 孙宝刚 何国斌 《计算机仿真》 2025年第1期362-366,共5页
为了避免噪声数据干扰数据挖掘效果,提高数据挖掘的精度和质量,提出融合相似度与随机森林的数据挖掘算法。采用奇异值分解算法分解数据矩阵,获得一系列奇异值,同时引入中位数绝对偏差法在上述奇异值中选取较大的奇异值,利用这些奇异值... 为了避免噪声数据干扰数据挖掘效果,提高数据挖掘的精度和质量,提出融合相似度与随机森林的数据挖掘算法。采用奇异值分解算法分解数据矩阵,获得一系列奇异值,同时引入中位数绝对偏差法在上述奇异值中选取较大的奇异值,利用这些奇异值展开重构,得到去噪后的数据;计算去噪后数据的样本熵,将其作为数据特征,结合P值和特征相似度对数据特征展开筛选,剔除冗余特征,选取最优数据特征;建立极限随机森林,将数据特征输入极限随机森林中,实现数据挖掘。实验结果表明,所提算法在数据挖掘过程中具有较高的查全率、F-measure指标以及AUC值,表明所提算法具有良好的数据挖掘性能。 展开更多
关键词 数据相似度 奇异值分解算法 中位数绝对偏差法 极限随机森林 数据挖掘
在线阅读 下载PDF
基于改进蒸馏学习的医学文本相似度计算
8
作者 关慧 赵凌波 杨伟琛 《计算机工程与设计》 北大核心 2025年第9期2473-2479,共7页
针对医学领域文本相似度计算存在的样本少、领域词多、学习效率低的问题,提出一种结合医学领域词嵌入和掩码语言模型的数据增强方法,并基于细粒度蒸馏思想提出一种结合中心核对齐算法的蒸馏模型。将原始医学数据集利用数据增强方法进行... 针对医学领域文本相似度计算存在的样本少、领域词多、学习效率低的问题,提出一种结合医学领域词嵌入和掩码语言模型的数据增强方法,并基于细粒度蒸馏思想提出一种结合中心核对齐算法的蒸馏模型。将原始医学数据集利用数据增强方法进行扩充后,输出的文本在蒸馏模型中通过特征向量中心核对齐方式进行特征间高维相似性度量。增强后的医学数据集在两种医学领域基线模型上的皮尔逊系数较未增强前分别提升了2.9%和1.7%。改进后的蒸馏模型在增强后的医学数据集皮尔逊值为81.1%,达到12层教师模型的95%,参数减少了近7倍。 展开更多
关键词 自然语言处理 相似度计算 医学文本相似度 数据增强 蒸馏学习 动态蒸馏 中心核对齐
在线阅读 下载PDF
一种面向海岸现势性分析的线要素相似度评估方法
9
作者 马梦锴 董箭 +2 位作者 纪冉 谢天 王栋 《测绘通报》 北大核心 2025年第8期107-111,117,共6页
本文以地理空间数据更新中的海图更新为例,探讨了地理空间数据更新过程中现势性分析的需求和方法,强调了海岸线现势性量化评估在海图更新中的关键作用,分析了现有现势性评估流程及传统相似度评估方法的局限性。针对上述情况,本文提出一... 本文以地理空间数据更新中的海图更新为例,探讨了地理空间数据更新过程中现势性分析的需求和方法,强调了海岸线现势性量化评估在海图更新中的关键作用,分析了现有现势性评估流程及传统相似度评估方法的局限性。针对上述情况,本文提出一种面向海岸现势性分析的线要素相似度评估方法。该方法主要包括3个步骤:首先,设计一种考虑线要素精度的重采样方法,对更新资料进行预处理;然后,建立线要素形状特征提取与转换流程,确保在镜像、旋转、缩放、移位等多场景下特征提取结果的一致性;最后,基于形状特征提取结果的线要素相似度评判标准,实现更新资料和原始资料的量化比对。试验结果表明,该方法具有较强的稳健性和局部线段匹配整体的能力,通过提取线要素的形状特征,实现了线要素相似度的量化评估,为航海图更新提供了有效的技术支持。 展开更多
关键词 地理空间数据更新 相似度算法 海图更新 线相似度
原文传递
基于图像块间相似度融合类注意力图的弱监督目标定位
10
作者 陈俊芬 张杰 +2 位作者 李娜娜 郭少聪 谢博鋆 《南京理工大学学报》 北大核心 2025年第3期381-388,共8页
弱监督目标定位在训练期间仅使用图像类别信息,由于缺乏边界信息的约束,会出现定位局部的问题,这是弱监督目标定位目前面临的挑战之一。基于注意力的令牌语义耦合注意力图(TS-CAM)模型将图像块的标记与语义无关的注意力图进行耦合,实现... 弱监督目标定位在训练期间仅使用图像类别信息,由于缺乏边界信息的约束,会出现定位局部的问题,这是弱监督目标定位目前面临的挑战之一。基于注意力的令牌语义耦合注意力图(TS-CAM)模型将图像块的标记与语义无关的注意力图进行耦合,实现语义感知定位,缓解了上述问题。该文在TS-CAM模型基础上提出了图像块间相似度融合类注意力图(PPA-CAM)模型用于目标定位。首先,PPA-CAM融合多层注意力信息,从中提取图像块间(块-块)相似度信息和类块(类别-块)信息;然后,利用类块信息生成初始注意力图,掩码较小的块间相似度进一步改善初始注意力图;最后,与特定类别的特征图相结合生成对象定位图。在CUB和ILSVRC数据集上与TS-CAM的GT定位精度相比,PPA-CAM模型分别提升了7%和1%。实验结果证明了充分利用低层的位置信息时,该文所提模型在目标定位上的有效性。 展开更多
关键词 弱监督目标定位 TRANSFORMER 类注意力图 块间相似度
在线阅读 下载PDF
结合相似度预测和阈值自动求解的开集条件下毫米波雷达点云步态识别方法
11
作者 杜兰 李逸明 +3 位作者 薛世鲲 石钰 陈健 李真芳 《电子与信息学报》 北大核心 2025年第6期1850-1863,共14页
现有的雷达步态识别方法多局限于闭集设置,即假设测试阶段的所有身份类别均已包含在模板库中,不适用于库内已知身份类别和库外未知新身份类别共存的真实开放识别环境。针对非完备身份类别模板库条件下的步态识别问题,该文提出一种结合... 现有的雷达步态识别方法多局限于闭集设置,即假设测试阶段的所有身份类别均已包含在模板库中,不适用于库内已知身份类别和库外未知新身份类别共存的真实开放识别环境。针对非完备身份类别模板库条件下的步态识别问题,该文提出一种结合相似度预测和阈值自动求解的开集条件下毫米波雷达点云步态识别方法。在点云特征提取的基础上,结合对潜在未知类相似度得分分布的先验认知,设计了一种伪开放环境训练策略来学习相似度预测网络,提升相似度得分空间中已知类别与未知类别的鉴别性;最后,阈值自动求解模块通过极值理论对相似度得分的极值分布进行概率拟合,并通过最小虚警与漏检准则实现未知类拒判阈值的准确求解。基于实测毫米波雷达点云数据的实验结果表明了所提方法在开集条件下具有良好的识别稳健性。 展开更多
关键词 毫米波雷达 步态识别 开集识别 相似度预测 极值理论
在线阅读 下载PDF
股票增发与年报文本信息策略性披露——基于MD&A文本相似度视角的研究
12
作者 朱杰 王雄元 《财贸研究》 北大核心 2025年第5期92-110,共19页
中国资本市场大体量的股票增发事件是否会加剧上市公司会计信息策略性披露行为进而影响资本市场资源配置效率,是备受关注的重要问题。基于2007—2017年中国A股上市公司年报管理层讨论与分析(MD&A)文本信息,以文本相似度为切入点,采... 中国资本市场大体量的股票增发事件是否会加剧上市公司会计信息策略性披露行为进而影响资本市场资源配置效率,是备受关注的重要问题。基于2007—2017年中国A股上市公司年报管理层讨论与分析(MD&A)文本信息,以文本相似度为切入点,采用多时点双重差分方法,研究上市公司股票增发进程中的年报文本信息策略性披露行为及其经济后果。结果发现:(1)出于策略性动机,上市公司会在股票增发前一年和当年增加非特质性风险信息披露,并减少特质性信息披露,进而导致年报MD&A文本相似度显著降低。(2)盈余管理程度越高的上市公司,股票增发前一年和当年年报MD&A文本相似度的降低越显著。(3)降低年报MD&A文本相似度与增加盈余管理相联动的策略性会计信息披露行为显著提高了股票增发成功率,但也提高了股票增发折价率,增加了企业权益融资成本。研究结论为监管部门强化上市公司会计信息监督提供了重要的理论依据和政策启示。 展开更多
关键词 股票增发 年报文本信息 策略性披露 MD&A 文本相似度
在线阅读 下载PDF
基于多中心性指标相似度融合的鱼类相对重要性评估方法
13
作者 赵丹枫 陈天文 +1 位作者 王建 苏诚 《海洋科学进展》 北大核心 2025年第3期706-720,共15页
作为海洋生态系统的关键组成部分,鱼类在食物网中的相对重要性直接影响着整个生态系统的稳定性。目前已使用了多个复杂网络中心性指标如Katz指数、PPR指数等来评估鱼类的重要性,但这些指标侧重点各不相同,为确保不同中心性指标对鱼类重... 作为海洋生态系统的关键组成部分,鱼类在食物网中的相对重要性直接影响着整个生态系统的稳定性。目前已使用了多个复杂网络中心性指标如Katz指数、PPR指数等来评估鱼类的重要性,但这些指标侧重点各不相同,为确保不同中心性指标对鱼类重要性刻画的适用性,并能够综合评价鱼类对食物网稳定性的影响,本研究系统性定义了包括鱼类度中心性、鱼类信息中心性等的鱼类中心性指标,并提出一种多中心性指标相似度融合(Multi-centrality Index Similarity Fusion,MISF)方法。该方法构建包含多种网络中心性指标的鱼类特征矩阵,提出基于余弦相似度、欧氏距离和相对熵融合的鱼类相似度计算并使用熵权法确定各指标权重,最终实现鱼类综合重要性排序。本研究以2016—2018年珠江口海域鱼类捕食关系网数据为研究对象,开展了鱼类重要性评估,实验结果表明,与Katz指数、PPR指数等方法相比,该方法可以有效评估鱼类在食物网中的相对重要性。在2016和2018年数据集中,MISF方法的精确率和召回率分别达到1.0和0.5,显著优于其他方法,而在2017年数据集中,尽管网络规模增大导致精确率略低于Katz和PPR指数,但召回率表现更佳。此外,根据鱼类在食物网中的不同重要性级别,讨论了它们由于数量变动对网络稳定性产生的影响差异。本研究为鱼类资源管理提供了新的视角。 展开更多
关键词 鱼类食物网 多指标相似度融合 相对重要性 鱼类资源管理
在线阅读 下载PDF
基于语义相似度与改进PSO算法的云制造能力需求模型与匹配策略研究
14
作者 李晓波 郭银章 《现代制造工程》 北大核心 2025年第6期30-44,共15页
针对云计算环境下智能制造资源服务化共享中制造能力与任务需求之间的搜索匹配与服务组合问题,提出了一种基于语义相似度与改进粒子群优化(Particle Swarm Optimization,PSO)算法的云制造能力需求模型与匹配策略。首先,在提出云制造能... 针对云计算环境下智能制造资源服务化共享中制造能力与任务需求之间的搜索匹配与服务组合问题,提出了一种基于语义相似度与改进粒子群优化(Particle Swarm Optimization,PSO)算法的云制造能力需求模型与匹配策略。首先,在提出云制造能力需求模型的基础上,采用领域本体树的概念提出了概念相似度、句子相似度和数值相似度的计算方法,实现了基于语义相似度的云制造能力需求智能化服务搜索;然后,针对云制造能力的服务组合问题,在分析了制造能力服务质量(Quality of Service,QoS)属性的基础上,采用层次分析法(Analytic Hierarchy Process,AHP)将各个属性进行归一化求和,给出了一种基于改进PSO算法的服务组合方法;最后,通过实验对比发现所提出的方法优于现有方法并实现了云制造能力需求智能匹配原型系统。 展开更多
关键词 云制造能力 任务需求 搜索匹配 服务组合 语义相似度 改进粒子群优化算法
在线阅读 下载PDF
一种基于多级角度的面实体形状相似度计算方法及应用
15
作者 刘贺 郭黎 +2 位作者 曹瑜娟 袁远 朱闯 《测绘科学技术学报》 2025年第1期88-96,共9页
形状是面实体几何匹配的常用特征之一。已有的面实体形状相似度计算方法存在形状描述能力不强、鲁棒性差、计算过程复杂等问题,为此提出了一种基于多级角度的面实体形状相似度计算方法。首先,对面实体轮廓进行等距重采样,以每个轮廓点... 形状是面实体几何匹配的常用特征之一。已有的面实体形状相似度计算方法存在形状描述能力不强、鲁棒性差、计算过程复杂等问题,为此提出了一种基于多级角度的面实体形状相似度计算方法。首先,对面实体轮廓进行等距重采样,以每个轮廓点为中心采取3步策略对轮廓进行多级划分,基于多级角度值实现对形状特征由局部到整体的多级描述;其次,借助离散傅里叶变换消除面实体旋转对计算结果的影响;最后,基于方向、位置、面积和形状构建面实体综合相似度模型。实验表明,所提出的形状相似度计算方法不受实体旋转、缩放、平移的影响,具有较高的运算效率和较强的形状描述能力。将面实体综合相似度模型应用到青藏高原湖泊数据几何匹配上,取得了较好的匹配结果。 展开更多
关键词 多级角 离散傅里叶变换 形状相似度 面实体 综合相似度 几何匹配
在线阅读 下载PDF
单云环境下强隐私保护的多维多重集相似度阈值精确查询方案
16
作者 李顺东 杜佶欣 +1 位作者 吴川宇 余佳桐 《计算机学报》 北大核心 2025年第10期2430-2449,共20页
集合相似度查询在现实生活中具有广泛应用,但由于它只允许每个元素出现一次,这限制了其在某些场景下的表达能力,无法描述复杂现象。多重集的特性使其能够更加全面地描述复杂现象,增强数据灵活性和表达力。因此,多重集的相似度阈值查询... 集合相似度查询在现实生活中具有广泛应用,但由于它只允许每个元素出现一次,这限制了其在某些场景下的表达能力,无法描述复杂现象。多重集的特性使其能够更加全面地描述复杂现象,增强数据灵活性和表达力。因此,多重集的相似度阈值查询更具实用性。随着云计算的发展,将数据存储和查询外包给云服务器成为数据拥有者的一个有吸引力的选择。然而,这种数据外包极易泄露数据隐私。为了保护数据隐私,数据拥有者在外包数据之前都要将数据加密,而在外包的密文数据上进行相似度查询就成为一个挑战。本文提出了一种新的保护隐私的相似度阈值查询方案,不仅能够解决多重集相似度的保密查询问题,还能够同时基于数据向量和关键词(两种数据类型)为查询用户提供查询结果。具体而言,我们首先设计了一个基于Jaccard相似度的多重集相似度阈值查询协议,然后通过0-1编码构造向量,结合Paillier密码系统设计了一个可以对不同类型的数据进行高效、准确的并行查询协议,并提出了单云服务器下的多维多重集相似度阈值查询方案。最后,本文使用公认的模拟范例证明了两个协议是安全的,且实验表明了方案是可行的。 展开更多
关键词 隐私保护 多重集 相似度 同态运算 模型
在线阅读 下载PDF
基于相似度和密度的抗噪声船舶轨迹聚类方法
17
作者 杨家轩 吴长胜 赵时雨 《舰船科学技术》 北大核心 2025年第2期178-184,共7页
通过对船舶AIS数据聚类可以掌握船舶运动行为和特征规律,但在轨迹聚类中通过距离描述的相似性不能连续地表征轨迹之间的相似程度,且对轨迹中的噪声点敏感、无法区分轨迹方向。针对上述问题,本文提出一种基于相似度和密度的抗噪声轨迹聚... 通过对船舶AIS数据聚类可以掌握船舶运动行为和特征规律,但在轨迹聚类中通过距离描述的相似性不能连续地表征轨迹之间的相似程度,且对轨迹中的噪声点敏感、无法区分轨迹方向。针对上述问题,本文提出一种基于相似度和密度的抗噪声轨迹聚类方法,构建航向约束分段路径距离并定义轨迹相似度函数;根据轨迹相似度分布特征和聚类评价指标,建立自适应确定最佳聚类参数流程。以长江口水域AIS数据为例,基于确定的最佳参数聚类出8个不同方向的轨迹簇,结果与实际船舶习惯航路相符。实验结果表明,所提出的方法能够快速确定最佳聚类参数并对不同运动方向的轨迹进行聚类,结果可用于特征轨迹提取和航路识别,为智能航海提供技术支撑。 展开更多
关键词 船舶交通 轨迹聚类 相似度 轨迹密 特征轨迹
在线阅读 下载PDF
基于Siamese网络的油田业务试题相似度计算方法
18
作者 尚福华 马文博 +1 位作者 解红涛 杜睿山 《计算机与数字工程》 2025年第3期870-876,共7页
由于对试题进行相似度检测可以有效地提高题库中试题质量,针对油田业务试题专业性及逻辑性强、包含字母和数字等的特点,且现存的相似度计算方法不能很好地挖掘其深层语义信息,论文提出了一种基于Siamese网络的油田业务试题相似度计算方... 由于对试题进行相似度检测可以有效地提高题库中试题质量,针对油田业务试题专业性及逻辑性强、包含字母和数字等的特点,且现存的相似度计算方法不能很好地挖掘其深层语义信息,论文提出了一种基于Siamese网络的油田业务试题相似度计算方法,首先利用双向长短期记忆网络提取试题的全局特征,之后通过注意力机制进一步突出试题的关键信息,之后采用1D-CNN将上述提取的试题信息与字嵌入信息进行融合拼接,以获得试题的深层次语义特征信息。最后,通过余弦相似度计算方法计算出两试题的语义相似度。论文方法在实际油田业务试题上的准确率、召回率以及F1值分别为91.29%、89.57%、90.99%。实验结果表明该方法的有效性。 展开更多
关键词 Siamese网络 油田业务试题相似度 BiLSTM 注意力机制 1D-CNN
在线阅读 下载PDF
基于字符串相似度的URL聚类方法研究
19
作者 刘翼 田亮亮 +2 位作者 高明 李凯茵 叶倩 《现代电子技术》 北大核心 2025年第11期84-88,共5页
内容分发网络(CDN)被用于解决网络访问负荷过载的问题。然而,同一网络服务可能包含多个域名,导致网页主题分类结果精确度和检索效率降低。文中提出一种基于字符串相似度算法的URL聚类方法,首先,获取校园网络7×24 h的真实流量数据,... 内容分发网络(CDN)被用于解决网络访问负荷过载的问题。然而,同一网络服务可能包含多个域名,导致网页主题分类结果精确度和检索效率降低。文中提出一种基于字符串相似度算法的URL聚类方法,首先,获取校园网络7×24 h的真实流量数据,利用协议分析抽取特征信息,转化为数据集;其次,进行数据清洗与处理,去除缺省字段和错误字段,将相同数据条目集成;最后,采用字符串相似度算法计算URL之间的距离作为聚类算法的特征,并采用K-means聚类算法划分相似URL,达到将多个不同域名分类到相同网络服务的目的。实验通过对5种不同方法进行比较发现,Levenshtein算法的平均轮廓系数达到了91.4%,较其他方法平均提高12%,能够有效应对精确度降低和检索效率低下的问题。 展开更多
关键词 数据聚类 字符串相似度 轮廓系数法 协议分析 K-MEANS URL CDN Levenshtein算法
在线阅读 下载PDF
基于结构相似度索引的液晶界面缺陷视觉检测方法
20
作者 王昆 吴银川 +1 位作者 李伟华 严正国 《石油管材与仪器》 2025年第5期73-80,共8页
液晶显示界面缺陷检测是过程装备领域的重要研究课题之一。针对传统检测方法效率低、误检率高等问题,提出了一种基于结构相似度的缺陷检测算法,并建立了高精度室内视觉检测系统。该方法通过计算标准图像与被检图像的局部结构相似度差异... 液晶显示界面缺陷检测是过程装备领域的重要研究课题之一。针对传统检测方法效率低、误检率高等问题,提出了一种基于结构相似度的缺陷检测算法,并建立了高精度室内视觉检测系统。该方法通过计算标准图像与被检图像的局部结构相似度差异定位缺陷区域,结合热力图对缺陷特征进行可视化表征,实现了缺陷位置与形态的直观显示。试验以分辨率480×800像素的TFT液晶屏为对象,结果表明,在窗口大小30×30像素、相似度阈值0.1、缺陷分辨率10×10像素的条件下,系统单次检测耗时小于1 s,误检率低至4.4%,检测效率与精度均满足生产的要求。 展开更多
关键词 缺陷检测 结构相似度 可视化表征 TFT液晶屏
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部