期刊文献+
共找到620篇文章
< 1 2 31 >
每页显示 20 50 100
Face-Pedestrian Joint Feature Modeling with Cross-Category Dynamic Matching for Occlusion-Robust Multi-Object Tracking
1
作者 Qin Hu Hongshan Kong 《Computers, Materials & Continua》 2026年第1期870-900,共31页
To address the issues of frequent identity switches(IDs)and degraded identification accuracy in multi object tracking(MOT)under complex occlusion scenarios,this study proposes an occlusion-robust tracking framework ba... To address the issues of frequent identity switches(IDs)and degraded identification accuracy in multi object tracking(MOT)under complex occlusion scenarios,this study proposes an occlusion-robust tracking framework based on face-pedestrian joint feature modeling.By constructing a joint tracking model centered on“intra-class independent tracking+cross-category dynamic binding”,designing a multi-modal matching metric with spatio-temporal and appearance constraints,and innovatively introducing a cross-category feature mutual verification mechanism and a dual matching strategy,this work effectively resolves performance degradation in traditional single-category tracking methods caused by short-term occlusion,cross-camera tracking,and crowded environments.Experiments on the Chokepoint_Face_Pedestrian_Track test set demonstrate that in complex scenes,the proposed method improves Face-Pedestrian Matching F1 area under the curve(F1 AUC)by approximately 4 to 43 percentage points compared to several traditional methods.The joint tracking model achieves overall performance metrics of IDF1:85.1825%and MOTA:86.5956%,representing improvements of 0.91 and 0.06 percentage points,respectively,over the baseline model.Ablation studies confirm the effectiveness of key modules such as the Intersection over Area(IoA)/Intersection over Union(IoU)joint metric and dynamic threshold adjustment,validating the significant role of the cross-category identity matching mechanism in enhancing tracking stability.Our_model shows a 16.7%frame per second(FPS)drop vs.fairness of detection and re-identification in multiple object tracking(FairMOT),with its cross-category binding module adding aboute 10%overhead,yet maintains near-real-time performance for essential face-pedestrian tracking at small resolutions. 展开更多
关键词 Cross-category dynamic binding joint feature modeling face-pedestrian association multi object tracking occlusion robustness
在线阅读 下载PDF
Joint Feature Encoding and Task Alignment Mechanism for Emotion-Cause Pair Extraction
2
作者 Shi Li Didi Sun 《Computers, Materials & Continua》 SCIE EI 2025年第1期1069-1086,共18页
With the rapid expansion of social media,analyzing emotions and their causes in texts has gained significant importance.Emotion-cause pair extraction enables the identification of causal relationships between emotions... With the rapid expansion of social media,analyzing emotions and their causes in texts has gained significant importance.Emotion-cause pair extraction enables the identification of causal relationships between emotions and their triggers within a text,facilitating a deeper understanding of expressed sentiments and their underlying reasons.This comprehension is crucial for making informed strategic decisions in various business and societal contexts.However,recent research approaches employing multi-task learning frameworks for modeling often face challenges such as the inability to simultaneouslymodel extracted features and their interactions,or inconsistencies in label prediction between emotion-cause pair extraction and independent assistant tasks like emotion and cause extraction.To address these issues,this study proposes an emotion-cause pair extraction methodology that incorporates joint feature encoding and task alignment mechanisms.The model consists of two primary components:First,joint feature encoding simultaneously generates features for emotion-cause pairs and clauses,enhancing feature interactions between emotion clauses,cause clauses,and emotion-cause pairs.Second,the task alignment technique is applied to reduce the labeling distance between emotion-cause pair extraction and the two assistant tasks,capturing deep semantic information interactions among tasks.The proposed method is evaluated on a Chinese benchmark corpus using 10-fold cross-validation,assessing key performance metrics such as precision,recall,and F1 score.Experimental results demonstrate that the model achieves an F1 score of 76.05%,surpassing the state-of-the-art by 1.03%.The proposed model exhibits significant improvements in emotion-cause pair extraction(ECPE)and cause extraction(CE)compared to existing methods,validating its effectiveness.This research introduces a novel approach based on joint feature encoding and task alignment mechanisms,contributing to advancements in emotion-cause pair extraction.However,the study’s limitation lies in the data sources,potentially restricting the generalizability of the findings. 展开更多
关键词 Emotion-cause pair extraction interactive information enhancement joint feature encoding label consistency task alignment mechanisms
在线阅读 下载PDF
Adaptive target and jamming recognition for the pulse doppler radar fuze based on a time-frequency joint feature and an online-updated naive bayesian classifier with minimal risk 被引量:9
3
作者 Jian Dai Xin-hong Hao +2 位作者 Ze Li Ping Li Xiao-peng Yan 《Defence Technology(防务技术)》 SCIE EI CAS CSCD 2022年第3期457-466,共10页
This paper considers the problem of target and jamming recognition for the pulse Doppler radar fuze(PDRF).To solve the problem,the matched filter outputs of the PDRF under the action of target and jamming are analyzed... This paper considers the problem of target and jamming recognition for the pulse Doppler radar fuze(PDRF).To solve the problem,the matched filter outputs of the PDRF under the action of target and jamming are analyzed.Then,the frequency entropy and peak-to-peak ratio are extracted from the matched filter output of the PDRF,and the time-frequency joint feature is constructed.Based on the time-frequency joint feature,the naive Bayesian classifier(NBC)with minimal risk is established for target and jamming recognition.To improve the adaptability of the proposed method in complex environments,an online update process that adaptively modifies the classifier in the duration of the work of the PDRF is proposed.The experiments show that the PDRF can maintain high recognition accuracy when the signal-to-noise ratio(SNR)decreases and the jamming-to-signal ratio(JSR)increases.Moreover,the applicable analysis shows that he ONBCMR method has low computational complexity and can fully meet the real-time requirements of PDRF. 展开更多
关键词 Pulse Doppler radar fuze(PDRF) Target and jamming recognition Time-frequency joint feature Online-update naive Bayesian classifier minimal risk(ONBCMR)
在线阅读 下载PDF
Automatic Feature Point Detection and Tracking of Human Actions in Time-of-flight Videos 被引量:8
4
作者 Xiaohui Yuan Longbo Kong +1 位作者 Dengchao Feng Zhenchun Wei 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2017年第4期677-685,共9页
Detecting feature points on the human body in video frames is a key step for tracking human movements. There have been methods developed that leverage models of human pose and classification of pixels of the body imag... Detecting feature points on the human body in video frames is a key step for tracking human movements. There have been methods developed that leverage models of human pose and classification of pixels of the body image. Yet, occlusion and robustness are still open challenges. In this paper, we present an automatic, model-free feature point detection and action tracking method using a time-of-flight camera. Our method automatically detects feature points for movement abstraction. To overcome errors caused by miss-detection and occlusion, a refinement method is devised that uses the trajectory of the feature points to correct the erroneous detections. Experiments were conducted using videos acquired with a Microsoft Kinect camera and a publicly available video set and comparisons were conducted with the state-of-the-art methods. The results demonstrated that our proposed method delivered improved and reliable performance with an average accuracy in the range of 90 %.The trajectorybased refinement also demonstrated satisfactory effectiveness that recovers the detection with a success rate of 93.7 %. Our method processed a frame in an average time of 71.1 ms. 展开更多
关键词 feature point human pose detection joint detection time-of-flight(ToF) videos
在线阅读 下载PDF
Enhanced Deep Autoencoder Based Feature Representation Learning for Intelligent Intrusion Detection System 被引量:3
5
作者 Thavavel Vaiyapuri Adel Binbusayyis 《Computers, Materials & Continua》 SCIE EI 2021年第9期3271-3288,共18页
In the era of Big data,learning discriminant feature representation from network traffic is identified has as an invariably essential task for improving the detection ability of an intrusion detection system(IDS).Owin... In the era of Big data,learning discriminant feature representation from network traffic is identified has as an invariably essential task for improving the detection ability of an intrusion detection system(IDS).Owing to the lack of accurately labeled network traffic data,many unsupervised feature representation learning models have been proposed with state-of-theart performance.Yet,these models fail to consider the classification error while learning the feature representation.Intuitively,the learnt feature representation may degrade the performance of the classification task.For the first time in the field of intrusion detection,this paper proposes an unsupervised IDS model leveraging the benefits of deep autoencoder(DAE)for learning the robust feature representation and one-class support vector machine(OCSVM)for finding the more compact decision hyperplane for intrusion detection.Specially,the proposed model defines a new unified objective function to minimize the reconstruction and classification error simultaneously.This unique contribution not only enables the model to support joint learning for feature representation and classifier training but also guides to learn the robust feature representation which can improve the discrimination ability of the classifier for intrusion detection.Three set of evaluation experiments are conducted to demonstrate the potential of the proposed model.First,the ablation evaluation on benchmark dataset,NSL-KDD validates the design decision of the proposed model.Next,the performance evaluation on recent intrusion dataset,UNSW-NB15 signifies the stable performance of the proposed model.Finally,the comparative evaluation verifies the efficacy of the proposed model against recently published state-of-the-art methods. 展开更多
关键词 CYBERSECURITY network intrusion detection deep learning autoencoder stacked autoencoder feature representational learning joint learning one-class classifier OCSVM
在线阅读 下载PDF
MultiJSQ:Direct joint segmentation and quantification of left ventricle with deep multitask-derived regression network
6
作者 Xiuquan Du Zheng Pei +3 位作者 Ying Liu Xinzhi Cao Lei Li Shuo Li 《CAAI Transactions on Intelligence Technology》 2025年第1期175-192,共18页
Quantitative analysis of clinical function parameters from MRI images is crucial for diagnosing and assessing cardiovascular disease.However,the manual calculation of these parameters is challenging due to the high va... Quantitative analysis of clinical function parameters from MRI images is crucial for diagnosing and assessing cardiovascular disease.However,the manual calculation of these parameters is challenging due to the high variability among patients and the time-consuming nature of the process.In this study,the authors introduce a framework named MultiJSQ,comprising the feature presentation network(FRN)and the indicator prediction network(IEN),which is designed for simultaneous joint segmentation and quantification.The FRN is tailored for representing global image features,facilitating the direct acquisition of left ventricle(LV)contour images through pixel classification.Additionally,the IEN incorporates specifically designed modules to extract relevant clinical indices.The authors’method considers the interdependence of different tasks,demonstrating the validity of these relationships and yielding favourable results.Through extensive experiments on cardiac MR images from 145 patients,MultiJSQ achieves impressive outcomes,with low mean absolute errors of 124 mm^(2),1.72 mm,and 1.21 mm for areas,dimensions,and regional wall thicknesses,respectively,along with a Dice metric score of 0.908.The experimental findings underscore the excellent performance of our framework in LV segmentation and quantification,highlighting its promising clinical application prospects. 展开更多
关键词 global image features joint segmentation and quantification left ventricle(LV) multitask-derived regression network
在线阅读 下载PDF
基于声像监测边坡危岩崩塌现场试验研究
7
作者 张信贵 陈述峰 +4 位作者 严利娥 蓝日彦 韩伟 范立峰 田佳男 《自然灾害学报》 北大核心 2026年第1期145-159,共15页
为有效预测和防范广西壮族自治区公路边坡危岩崩塌风险,开展边坡单体危岩和群体危岩崩塌启动现场试验研究。该文基于微震-视频监测,用PyCharm代码抽帧图像,利用Matlab处理微震监测信号并进行时域波形绘制,通过快速傅里叶变换(fast Fouri... 为有效预测和防范广西壮族自治区公路边坡危岩崩塌风险,开展边坡单体危岩和群体危岩崩塌启动现场试验研究。该文基于微震-视频监测,用PyCharm代码抽帧图像,利用Matlab处理微震监测信号并进行时域波形绘制,通过快速傅里叶变换(fast Fourier transform,FFT)和连续小波变换(continuous wavelet transform,CWT)分别得到微震信号的频谱图和时频图。结果表明,在启动机制上,危岩崩塌启动机制的主控因素在于危岩重心发生偏移,危岩与坡面(或母岩)间的黏结力下降,边坡危岩整体下滑力增大且超过抗滑力极限。其中危岩与坡面(或母岩)间的黏结力下降为滑移式与倾倒式崩塌的共有启动机制,危岩重心发生偏移主要为倾倒式崩塌的启动机制,危岩整体下滑力增大且超过抗滑力极限主要为滑移式崩塌的启动机制。同时可将这3类主控因素作为实际边坡危岩崩塌启动机制的判断标准之一。在前兆特征上,危岩崩塌前,宏观上出现局部掉块与小型岩崩等前兆现象,变形监测中位移出现突变和陡增现象,微震信号多出现于中低频带中,且主频带较宽,同时中高幅值、高能量信号占比较多。因此当综合前兆特征中多个单一前兆特征同时出现时,可作为实际边坡危岩发生崩塌的判断标准之一。提出一种危岩崩塌孕育过程全天候、非接触式联合监测的方法,即微震与视频融合的声像监测技术,可实现边坡危岩崩塌孕育过程中的早期特征识别,以及崩塌灾害闻其声、见其形的综合研判与精准预警,进而促进了实际工程中危岩崩塌应用微震与视频监测预警技术的联合发展。 展开更多
关键词 边坡 危岩崩塌 声像监测 微震 启动机制 前兆特征
原文传递
基于深度联合图像滤波的JPEG压缩伪影去除算法
8
作者 聂栋栋 张琰 +1 位作者 程乾坤 赵雪晴 《计算机应用与软件》 北大核心 2026年第1期233-240,共8页
由于JPEG有损压缩严重影响图像质量,为去除JPEG压缩伪影,提出一种基于卷积神经网络的联合图像滤波器。该文借助可逆下采样层提取特征信息并构建引导特征图;融合输入图与引导特征图的特征,将公共结构映射到目标图像上;利用跳跃连接得到... 由于JPEG有损压缩严重影响图像质量,为去除JPEG压缩伪影,提出一种基于卷积神经网络的联合图像滤波器。该文借助可逆下采样层提取特征信息并构建引导特征图;融合输入图与引导特征图的特征,将公共结构映射到目标图像上;利用跳跃连接得到最终滤波输出。为提高泛化能力,该网络基于残差学习联合训练多种压缩水平的图像。相较于几种经典算法,所提算法不仅可以有效去除各种压缩水平的JPEG压缩伪影、提取更清晰的边缘结构,而且具有更高的峰值信噪比和结构相似性,有效改善了图像质量。 展开更多
关键词 JPEG压缩 联合滤波 引导特征图 残差学习
在线阅读 下载PDF
融合大核门控及双注意力的骶髂关节分割网络
9
作者 严武军 景莹 +2 位作者 徐莹臣 张晓丽 王程 《电子测量技术》 北大核心 2026年第1期100-109,共10页
强直性脊柱炎是一种慢性炎症性疾病,其早期诊断依赖于骶髂关节病变特征的准确识别。然而,由于骶髂关节解剖结构复杂、病灶呈现多尺度异质性,且易受CT部分容积效应及噪声干扰,传统分割方法的精度难以满足临床需求。为此,提出了一种基于... 强直性脊柱炎是一种慢性炎症性疾病,其早期诊断依赖于骶髂关节病变特征的准确识别。然而,由于骶髂关节解剖结构复杂、病灶呈现多尺度异质性,且易受CT部分容积效应及噪声干扰,传统分割方法的精度难以满足临床需求。为此,提出了一种基于多尺度注意力融合的网络模型(MAG-UNet)。该模型通过多尺度特征融合模块(MFF)强化局部-全局特征协同表征,结合双路径注意力机制(DA)的空间-通道自适应加权,并引入大核分组注意力门控(LGAG)以解决跨尺度特征耦合问题。在山西白求恩医院提供的数据集上进行的实验表明,MAG-UNet在骶髂关节CT分割中取得了显著的性能提升,Dice系数达到92.4%,IoU达到86.0%,较U-Net基线模型提升3.4%(IoU)。本文为强直性脊柱炎的早期诊断提供了可靠的技术支持,具有重要的临床应用价值与推广潜力。 展开更多
关键词 强直性脊柱炎 骶髂关节 医学影像分割 多尺度注意力融合 特征优化
原文传递
基于BERT与特征增强的道路几何设计领域三元组抽取技术
10
作者 陈雨人 黄国洺 +1 位作者 余博 黎东丰 《交通与运输》 2026年第2期35-40,共6页
针对道路几何设计规范文本中存在的专业术语密集、实体关系长距离依赖及领域先验知识利用不足等问题,提出一种融合多头注意力与路径特征的道路几何设计知识联合抽取模型(MHA-Path-JE)。该模型采用参数共享的联合学习范式,以BERT为基座... 针对道路几何设计规范文本中存在的专业术语密集、实体关系长距离依赖及领域先验知识利用不足等问题,提出一种融合多头注意力与路径特征的道路几何设计知识联合抽取模型(MHA-Path-JE)。该模型采用参数共享的联合学习范式,以BERT为基座提取富语义上下文特征;在关系抽取阶段构建多源特征融合机制,即利用实体间路径特征捕捉长距离句法依赖,引入多头注意力机制挖掘全局语义线索,并结合实体类型嵌入引入领域先验约束;针对规范文本中极度的正负样本不平衡问题,设计启发式负样本采样策略。实验结果表明:在自建道路几何设计知识数据集上,MHA-Path-JE 模型的关系抽取F1值达到0.6215,较基线模型提升91.6%,可有效解决复杂规范文本中的知识抽取难题,为道路几何设计知识图谱的构建及智能合规性审查提供技术支撑。 展开更多
关键词 道路几何设计 联合抽取 BERT模型 特征融合 知识图谱
在线阅读 下载PDF
基于多模态数据融合的康复机器人关节角度预测方法
11
作者 陈博 王斌 +3 位作者 周袁 周京 王浙明 叶祥明 《控制与决策》 北大核心 2026年第3期604-612,共9页
在人体关节角度预测中,单传感器获取信息太过局限且易受环境干扰影响,而基于多传感器的关节角度的预测研究,由于输入数据维度升高、传统的融合方式存在特征利用率不足的缺陷,导致预测精度下降.为准确获取运动功能障碍患者佩戴外骨骼康... 在人体关节角度预测中,单传感器获取信息太过局限且易受环境干扰影响,而基于多传感器的关节角度的预测研究,由于输入数据维度升高、传统的融合方式存在特征利用率不足的缺陷,导致预测精度下降.为准确获取运动功能障碍患者佩戴外骨骼康复过程中的运动状态,提出基于多模态数据融合的康复机器人关节角度预测方法.首先,设计多通道高分辨率网络结构使其适用于人体3维姿态特征提取任务,同时利用卷积神经网络提取足底压力特征;其次,基于长短期记忆网络获取特征在时域上的关联性;然后,构建带注意力机制的多模态特征融合网络用于人体关节角度预测;最后,通过在低、中、高3组速度下的实验结果表明:所提出算法在自建数据集上的评价指标RMSE为0.039,较传统关节角度预测方法提升38%以上;评价指标R2为0.948,较传统关节角度预测方法提升17%以上. 展开更多
关键词 康复机器人 关节角度预测 人体姿态估计 多通道高分辨率网络 长短期记忆网络 多模态特征融合网络
原文传递
尺度空间特征下人机交互多姿态三维手势智能识别
12
作者 肖锟 郭伶凤 +1 位作者 敖思魁 吴维 《现代电子技术》 北大核心 2026年第6期189-193,共5页
为应对人机交互中手势姿态多样性、尺度变化及复杂背景干扰等问题,提出一种基于尺度空间特征的人机交互多姿态三维手势智能识别方法。首先构建三维手势点云并转换为二值体素网格,结合金字塔多尺度结构与SIFT描述子提取具有空间分布特性... 为应对人机交互中手势姿态多样性、尺度变化及复杂背景干扰等问题,提出一种基于尺度空间特征的人机交互多姿态三维手势智能识别方法。首先构建三维手势点云并转换为二值体素网格,结合金字塔多尺度结构与SIFT描述子提取具有空间分布特性的手势特征;其次利用三维卷积网络回归关节点热图实现精确定位,引入时间移位模块与LSTM网络对手势动态序列进行建模,实现多姿态手势实时智能识别。实验结果表明,所提方法对10类交互手势的综合识别置信度最高达99.68%,在虚拟游戏、办公与教学三类场景中的识别稳定性为97.7%、96.38%、98.67%,抗干扰能力为94.99%、93.85%、95.98%,可实现高精度、多姿态三维手势智能识别,为人机交互与虚拟现实应用提供可靠、自然的手势交互支持。 展开更多
关键词 三维手势识别 尺度空间特征 关节点热图 多姿态手势 人机交互 LSTM网络 体素网格 时序建模
在线阅读 下载PDF
低纹理环境下融合点线面特征的双目视觉SLAM算法
13
作者 汪泽 饶蕾 +4 位作者 范光宇 陈年生 程松林 杨定裕 姜楚乔 《浙江大学学报(工学版)》 北大核心 2026年第2期322-331,共10页
针对机器人在低纹理场景下基于点特征的ORB-SLAM2存在定位精度低、轨迹漂移误差较大的问题,提出融合点线面特征的双目视觉SLAM算法.在ORB-SLAM2中设计并引入改进的EDLines线特征提取算法,通过短线抑制和相似直线合并策略,降低计算时间... 针对机器人在低纹理场景下基于点特征的ORB-SLAM2存在定位精度低、轨迹漂移误差较大的问题,提出融合点线面特征的双目视觉SLAM算法.在ORB-SLAM2中设计并引入改进的EDLines线特征提取算法,通过短线抑制和相似直线合并策略,降低计算时间并提高线特征提取的质量.提出基于相交直线的平面特征提取方法,基于所提取面特征的几何约束优化位姿估计,减少重投影误差.提出点线面特征的联合优化方法,融合多种特征的几何关系,减少由单一特征带来的误差累积.在KITTI、EuRoC和UMA-VI数据集下测试所提算法的有效性.实验结果表明,相较于ORB-SLAM2、点线特征SLAM以及点面特征SLAM算法,所提算法在定位精度与鲁棒性方面更优. 展开更多
关键词 低纹理环境 视觉SLAM 线特征 面特征 联合优化
在线阅读 下载PDF
面向手扶电梯场景异常行为检测的自适应关节增强网络
14
作者 姚薇 郭伟 朱利阳 《安全与环境工程》 北大核心 2026年第2期68-78,共11页
针对手扶电梯场景下异常行为检测存在的关节特征利用不足、细粒度差异捕捉困难等问题,聚焦人体关节,提出了一种自适应关节增强网络。该方法通过由关节预测模块与自适应关键关节增强模块组成的双路径优化机制,实现了基于关节信息引导的... 针对手扶电梯场景下异常行为检测存在的关节特征利用不足、细粒度差异捕捉困难等问题,聚焦人体关节,提出了一种自适应关节增强网络。该方法通过由关节预测模块与自适应关键关节增强模块组成的双路径优化机制,实现了基于关节信息引导的特征学习。首先,设计了一个关节预测模块,采用多尺度联合监督与高斯扩散策略生成高精度关节点热图,并通过关节损失函数抑制背景噪声及扩展正样本;其次,构建了一个自适应关键关节增强模块,基于注意力机制动态加权不同关节的特征重要性,实现了行为相关区域的特征强化;最后,在真实手扶电梯场景行为数据集和PASCAL VOC 2012动作数据集上进行了实验验证。结果表明:所提方法在电梯行为数据集上的均值平均精度(mean average precision,mAP)达到0.909,具有较高的异常行为检测准确率;跨域测试显示,该方法在PASCAL VOC 2012动作数据集上的mAP达到0.908,具有较强的泛化能力。所提方法能够有效提升手扶电梯复杂场景下异常行为识别的精度与稳定性,为电梯智能监测系统中的实时安全预警与风险防控提供了技术支撑。 展开更多
关键词 手扶电梯 异常行为 目标检测 关节点 特征增强
在线阅读 下载PDF
线特征约束的影像与点云多视角联合平差配准方法
15
作者 陈露 王安妮 +2 位作者 兰紫瑜 许晖 张鹏林 《应用科学学报》 北大核心 2026年第2期234-249,共16页
影像与激光点云的配准是场景三维重建的关键技术,为爆炸事故溯源分析提供重要的科学支持,并在自动驾驶、灾害溯源等领域展现出广阔的应用前景。然而异源传感器采集的二、三维数据之间存在空间尺度和几何特征的差异,为影像与点云两种模... 影像与激光点云的配准是场景三维重建的关键技术,为爆炸事故溯源分析提供重要的科学支持,并在自动驾驶、灾害溯源等领域展现出广阔的应用前景。然而异源传感器采集的二、三维数据之间存在空间尺度和几何特征的差异,为影像与点云两种模态数据的精细配准带来了困难。鉴于此,本文提出一种基于线特征约束的多视角联合平差配准方法。首先从影像和点云数据中提取线特征并进行粗配准,然后在标准PnP(perspective-n-point)模型基础上引入线特征的方向一致性与正交一致性约束,以最小化多个视角下的误差函数为目标,将变换参数求解转化为非线性最小二乘问题进行迭代优化,最终实现影像与点云的准确配准。该过程无需进行二维–三维投影转换或尺度变换,从而可防止引入投影误差。对比实验结果表明,本文提出的具有线特征约束的多视角联合平差方法可显著提升影像和点云两种模态数据的配准精度。相较于单视角标准PnP模型,本文方法的配准误差降低了60%以上。 展开更多
关键词 影像和点云配准 多视角联合平差 线特征约束 PnP模型
在线阅读 下载PDF
快速鲁棒掌子面全局节理特征提取算法
16
作者 白宇 郝毅仁 +4 位作者 陈玮 裴少康 王贺 王继超 方浩 《科学技术与工程》 北大核心 2026年第3期1157-1165,共9页
隧道掌子面监测对于保障施工安全与工程质量至关重要,然而传统依赖手工测量和现场观察的监测方式效率低下且精度受限。为提升监测水平,提出一种结合深度学习的掌子面快速数字化方法。该方法通过构建掌子面单应变换模型,运用基于深度学... 隧道掌子面监测对于保障施工安全与工程质量至关重要,然而传统依赖手工测量和现场观察的监测方式效率低下且精度受限。为提升监测水平,提出一种结合深度学习的掌子面快速数字化方法。该方法通过构建掌子面单应变换模型,运用基于深度学习的特征匹配算法和基于多尺度信息的快速自适应节理特征提取算法,实现不依赖相机参数和拍摄角度的快速、准确节理特征提取,并借助快速节理检测和融合方法达成实时性监测。实验结果显示,此方法能够有效提取全局掌子面节理信息,显著提高数据采集效率,降低操作难度。综上,该方法为隧道工程监测提供了全新的思路与方法,有力保障了隧道施工安全。 展开更多
关键词 掌子面图像 单应变换 深度学习特征点 节理特征提取 GPU加速 随机样本一致算法
在线阅读 下载PDF
位置增强与频域分量交互的深度伪造检测方法
17
作者 孟思雨 牛春翔 +1 位作者 谭荃戈 王蓉 《计算机科学》 北大核心 2026年第4期445-453,共9页
随着深度伪造技术的快速发展,伪造人脸图像和视频在社交媒体上频繁出现。然而,这些技术也被恶意利用,严重威胁社会安全。现有检测方法在已知数据集的伪造人脸检测中表现良好,但在面对未知数据集的伪造人脸时,检测效果却显著下降。针对... 随着深度伪造技术的快速发展,伪造人脸图像和视频在社交媒体上频繁出现。然而,这些技术也被恶意利用,严重威胁社会安全。现有检测方法在已知数据集的伪造人脸检测中表现良好,但在面对未知数据集的伪造人脸时,检测效果却显著下降。针对这一问题,提出了一种位置增强与频域分量交互的深度伪造检测方法,旨在提高深度伪造人脸检测算法的鲁棒性及泛化性。首先,采用Vision Transformer作为骨干网络,从全局角度捕捉伪造痕迹;其次,设计动态局部特征提取模块,利用卷积进行逐通道逐点局部特征提取,并根据每个像素在特征表示中的重要性进行动态加权,精细化局部特征,提高对局部特征的感知能力;同时,构建多尺度特征提取与位置增强模块,采用多膨胀率卷积获取多尺度特征,引入位置增强机制强化像素间的位置信息关联,有效提取不同区域的多尺度信息;然后,设计全局-局部频域分量交互模块,通过频域分解注意力机制实现不同频域分量之间的信息交互,捕捉全局与局部特征之间的依赖关系,以获取在伪造人脸图像质量下降时RGB空间中消失的伪影;最后,设计像素关系相似度损失函数计算像素间的位置关系损失,并结合交叉熵损失函数构建联合损失函数,提高深度伪造人脸检测的准确性。实验结果表明,所提方法在FF++和Celeb-DF数据集上的AUC指标分别达到99.29%和78.62%,其能有效提升深度伪造人脸检测算法的鲁棒性与泛化性。 展开更多
关键词 特征提取 位置增强 频域分量交互 联合损失 深度伪造检测
在线阅读 下载PDF
一种基于极化特征-距离联合矩阵的角反射器阵列与舰船辨识方法
18
作者 吴泽洲 庞晨 +3 位作者 李丹阳 左炎春 朱永锋 李永祯 《雷达学报(中英文)》 北大核心 2026年第1期345-360,共16页
在雷达目标识别领域,二十面体角反射器的引入无疑提升了目标辨识任务的难度。这种情况在中高海况下将尤为严重。剧烈起伏的海面将与二十面体角反射器形成耦合散射,这可能达到与目标相似的散射特性,从而导致传统目标辨识方法性能下降。... 在雷达目标识别领域,二十面体角反射器的引入无疑提升了目标辨识任务的难度。这种情况在中高海况下将尤为严重。剧烈起伏的海面将与二十面体角反射器形成耦合散射,这可能达到与目标相似的散射特性,从而导致传统目标辨识方法性能下降。针对中高海况下目标辨识难的问题,该文从主要散射机理和散射复杂程度两个方面,构建了极化特征-距离联合矩阵,表征中高海况下舰船与二十面体角反射器阵列之间的差异。然后,利用时序神经网络提取两者极化特征-距离联合矩阵的特征,以实现对目标的有效辨识。经数据集的验证,所提出的方法可以有效减少手工知识提取过程中的信息丢失。在中高海况条件下,相较于现有方法,该方法的准确率提升了10.14%,大幅降低了二十面体角反射器阵列造成的虚警。 展开更多
关键词 二十面体角反射器 极化散射特性 极化多域联合特征 循环神经网络 目标辨识
在线阅读 下载PDF
基于胶囊网络与Transformer的细粒度图像分类
19
作者 刘正华 龚小玉 +1 位作者 梁彧骁 梁艳洁 《现代电子技术》 北大核心 2026年第8期137-144,共8页
花卉细粒度图像分类在品种鉴定、精准园艺和智能育种等领域具有重要的应用价值,但形态相似品种间特征差异微小、背景复杂干扰显著,导致现有方法的精度识别不高。针对该问题,提出一种基于胶囊网络与视觉Transformer的细粒度图像分类架构... 花卉细粒度图像分类在品种鉴定、精准园艺和智能育种等领域具有重要的应用价值,但形态相似品种间特征差异微小、背景复杂干扰显著,导致现有方法的精度识别不高。针对该问题,提出一种基于胶囊网络与视觉Transformer的细粒度图像分类架构,以提升特征表征能力与分类性能。首先,设计双频注意力特征提取模块,通过高频与低频并行分支并结合基于Sobel梯度的空间注意力、频域注意力、ECA通道注意力,实现纹理边缘与结构信息的高效建模;其次,构建基于胶囊的视觉Transformer框架,该框架包括胶囊视觉嵌入模块和改进型胶囊感知Transformer编码器,通过显式解耦胶囊模长与方向并引入门控残差与squash非线性,协同建模局部与全局特征;最后,提出联合损失优化策略,从判别性、重构性与泛化能力等角度对模型训练进行优化。实验结果表明,所提方法在Flowers数据集上的识别准确率较高,鲁棒性强,验证了其在复杂场景下的有效性与先进性。 展开更多
关键词 细粒度图像分类 视觉Transformer 融合机制 胶囊网络 联合损失优化 双频注意力
在线阅读 下载PDF
基于多尺度特征融合和无参注意力机制的实体关系联合抽取方法研究
20
作者 肖义凡 朱强 +3 位作者 胡新荣 杨华利 刘军平 李优柱 《中文信息学报》 北大核心 2026年第2期101-111,共11页
实体关系抽取是构建知识图谱的重要环节,其目的是从自然语言文本中提取所有的三元组。然而,重叠三元组和错误累积问题对实体关系抽取带来了巨大挑战。为了解决重叠三元组和错误累积难题以改善模型的抽取性能,该文提出了一种基于多尺度... 实体关系抽取是构建知识图谱的重要环节,其目的是从自然语言文本中提取所有的三元组。然而,重叠三元组和错误累积问题对实体关系抽取带来了巨大挑战。为了解决重叠三元组和错误累积难题以改善模型的抽取性能,该文提出了一种基于多尺度特征融合和无参注意力机制的实体关系联合抽取方法,将实体关系联合抽取任务分解为四个子模块:多尺度特征融合模块、异构图模块、头实体标记模块和尾实体标记模块。具体而言,该文提出了一种基于多尺度特征融合策略以提高模型的特征表达能力,从而缓解实体重叠问题。其次,该文介绍了无参注意力机制来进一步关注关键特征并抑制无关或冗余信息用来减轻错误累积问题。大量实验结果表明,该文方法在中英文数据集BB、ChemPort、SciERC和CMeIE中比SOTA方法F_1得分分别提高了3.65%、12.17%、1.55%和1.67%。 展开更多
关键词 实体关系联合抽取 重叠三元组 错误累积 多尺度特征融合 无参注意力机制
在线阅读 下载PDF
上一页 1 2 31 下一页 到第
使用帮助 返回顶部