期刊文献+
共找到130篇文章
< 1 2 7 >
每页显示 20 50 100
A highly reliable encoding and decoding communication framework based on semantic information
1
作者 Yichi Zhang Haitao Zhao +4 位作者 Kuo Cao Li Zhou Zhe Wang Yueling Liu Jibo Wei 《Digital Communications and Networks》 SCIE CSCD 2024年第3期509-518,共10页
Increasing research has focused on semantic communication,the goal of which is to convey accurately the meaning instead of transmitting symbols from the sender to the receiver.In this paper,we design a novel encoding ... Increasing research has focused on semantic communication,the goal of which is to convey accurately the meaning instead of transmitting symbols from the sender to the receiver.In this paper,we design a novel encoding and decoding semantic communication framework,which adopts the semantic information and the contextual correlations between items to optimize the performance of a communication system over various channels.On the sender side,the average semantic loss caused by the wrong detection is defined,and a semantic source encoding strategy is developed to minimize the average semantic loss.To further improve communication reliability,a decoding strategy that utilizes the semantic and the context information to recover messages is proposed in the receiver.Extensive simulation results validate the superior performance of our strategies over state-of-the-art semantic coding and decoding policies on different communication channels. 展开更多
关键词 semantic information semantic encoding method Context-based decoding method
在线阅读 下载PDF
Learning intrinsic decomposition with semantic information fusion based on transformer
2
作者 Pengjie ZHAO Hao SHA +1 位作者 Yongtian WANG Yue LIU 《虚拟现实与智能硬件(中英文)》 2025年第6期543-559,共17页
Intrinsic decomposition,the process of decomposing an image into reflectance and shading,is widely used in virtual and augmented reality tasks.Reflectance and shading often exhibit large gradients at the object edges,... Intrinsic decomposition,the process of decomposing an image into reflectance and shading,is widely used in virtual and augmented reality tasks.Reflectance and shading often exhibit large gradients at the object edges,and the intrinsic properties on the same object tend to be similar.This spatial coherence is closely related to semantic consistency because objects within the same semantic category often exhibit similar intrinsic properties.Therefore,incorporating semantic segmentation into a deep intrinsic decomposition framework helps the network distinguish between different object instances and understand high-level scene structures.To this end,we design an intrinsic decomposition network jointly trained with a dedicated semantic segmentation module,allowing semantic cues to enhance the decomposition of reflectance and shading.The semantic module provides guidance during training but is removed during inference,improving performance without increasing the inference cost.Additionally,to capture the global contextual dependencies critical for intrinsic decomposition,we adopt a Transformer-based backbone.The proposed backbone enables the model to associate distant regions with similar material properties,thereby maintaining consistency in reflectance and learning smooth illumination patterns across a scene.A convolutional decoder is also designed to output predictions with improved details.Experiments demonstrate that our approach achieves state-of-the-art performance in the quantitative evaluations on the Intrinsic Images in the Wild(IIW)and Shading Annotations in the wild(SAW)datasets. 展开更多
关键词 Intrinsic image decomposition Augmented reality semantic segmentation Detachable decoder Joint learning
在线阅读 下载PDF
Remote sensing image semantic segmentation algorithm based on improved DeepLabv3+
3
作者 SONG Xirui GE Hongwei LI Ting 《Journal of Measurement Science and Instrumentation》 2025年第2期205-215,共11页
The convolutional neural network(CNN)method based on DeepLabv3+has some problems in the semantic segmentation task of high-resolution remote sensing images,such as fixed receiving field size of feature extraction,lack... The convolutional neural network(CNN)method based on DeepLabv3+has some problems in the semantic segmentation task of high-resolution remote sensing images,such as fixed receiving field size of feature extraction,lack of semantic information,high decoder magnification,and insufficient detail retention ability.A hierarchical feature fusion network(HFFNet)was proposed.Firstly,a combination of transformer and CNN architectures was employed for feature extraction from images of varying resolutions.The extracted features were processed independently.Subsequently,the features from the transformer and CNN were fused under the guidance of features from different sources.This fusion process assisted in restoring information more comprehensively during the decoding stage.Furthermore,a spatial channel attention module was designed in the final stage of decoding to refine features and reduce the semantic gap between shallow CNN features and deep decoder features.The experimental results showed that HFFNet had superior performance on UAVid,LoveDA,Potsdam,and Vaihingen datasets,and its cross-linking index was better than DeepLabv3+and other competing methods,showing strong generalization ability. 展开更多
关键词 semantic segmentation high-resolution remote sensing image deep learning transformer model attention mechanism feature fusion ENCODER decodER
在线阅读 下载PDF
Semantics-aware transformer for 3D reconstruction from binocular images 被引量:2
4
作者 JIA Xin YANG Shourui GUAN Diyi 《Optoelectronics Letters》 EI 2022年第5期293-299,共7页
Existing multi-view three-dimensional(3 D) reconstruction methods can only capture single type of feature from input view, failing to obtain fine-grained semantics for reconstructing the complex shapes. They rarely ex... Existing multi-view three-dimensional(3 D) reconstruction methods can only capture single type of feature from input view, failing to obtain fine-grained semantics for reconstructing the complex shapes. They rarely explore the semantic association between input views, leading to a rough 3 D shape. To address these challenges, we propose a semantics-aware transformer(SATF) for 3 D reconstruction. It is composed of two parallel view transformer encoders and a point cloud transformer decoder, and takes two red, green and blue(RGB) images as input and outputs a dense point cloud with richer details. Each view transformer encoder can learn a multi-level feature, facilitating characterizing fine-grained semantics from input view. The point cloud transformer decoder explores a semantically-associated feature by aligning the semantics of two input views, which describes the semantic association between views. Furthermore, it can generate a sparse point cloud using the semantically-associated feature. At last, the decoder enriches the sparse point cloud for producing a dense point cloud with richer details. Extensive experiments on the Shape Net dataset show that our SATF outperforms the state-of-the-art methods. 展开更多
关键词 DETAILS semantic decodER
原文传递
A Video Captioning Method by Semantic Topic-Guided Generation
5
作者 Ou Ye Xinli Wei +2 位作者 Zhenhua Yu Yan Fu Ying Yang 《Computers, Materials & Continua》 SCIE EI 2024年第1期1071-1093,共23页
In the video captioning methods based on an encoder-decoder,limited visual features are extracted by an encoder,and a natural sentence of the video content is generated using a decoder.However,this kind ofmethod is de... In the video captioning methods based on an encoder-decoder,limited visual features are extracted by an encoder,and a natural sentence of the video content is generated using a decoder.However,this kind ofmethod is dependent on a single video input source and few visual labels,and there is a problem with semantic alignment between video contents and generated natural sentences,which are not suitable for accurately comprehending and describing the video contents.To address this issue,this paper proposes a video captioning method by semantic topic-guided generation.First,a 3D convolutional neural network is utilized to extract the spatiotemporal features of videos during the encoding.Then,the semantic topics of video data are extracted using the visual labels retrieved from similar video data.In the decoding,a decoder is constructed by combining a novel Enhance-TopK sampling algorithm with a Generative Pre-trained Transformer-2 deep neural network,which decreases the influence of“deviation”in the semantic mapping process between videos and texts by jointly decoding a baseline and semantic topics of video contents.During this process,the designed Enhance-TopK sampling algorithm can alleviate a long-tail problem by dynamically adjusting the probability distribution of the predicted words.Finally,the experiments are conducted on two publicly used Microsoft Research Video Description andMicrosoft Research-Video to Text datasets.The experimental results demonstrate that the proposed method outperforms several state-of-art approaches.Specifically,the performance indicators Bilingual Evaluation Understudy,Metric for Evaluation of Translation with Explicit Ordering,Recall Oriented Understudy for Gisting Evaluation-longest common subsequence,and Consensus-based Image Description Evaluation of the proposed method are improved by 1.2%,0.1%,0.3%,and 2.4% on the Microsoft Research Video Description dataset,and 0.1%,1.0%,0.1%,and 2.8% on the Microsoft Research-Video to Text dataset,respectively,compared with the existing video captioning methods.As a result,the proposed method can generate video captioning that is more closely aligned with human natural language expression habits. 展开更多
关键词 Video captioning encoder-decoder semantic topic jointly decoding Enhance-TopK sampling
在线阅读 下载PDF
基于可变形卷积和注意力机制的路面裂缝检测
6
作者 谢永华 方育才 彭银佳 《计算机工程与设计》 北大核心 2026年第1期279-285,共7页
为解决路面裂缝检测中图像边缘特征难以学习和背景噪声干扰的问题,提出一个基于可变形卷积和注意力机制的可端到端训练的路面裂缝检测网络。该网络基于U-Net结构设计,在特征融合部分添加边缘感知模块来增强裂缝边缘的检测能力;在编码器... 为解决路面裂缝检测中图像边缘特征难以学习和背景噪声干扰的问题,提出一个基于可变形卷积和注意力机制的可端到端训练的路面裂缝检测网络。该网络基于U-Net结构设计,在特征融合部分添加边缘感知模块来增强裂缝边缘的检测能力;在编码器部分使用空洞残差模块扩大感受野并保留更多细节信息;在解码器部分添加注意力机制提高对裂缝特征的关注度,抑制背景噪声。实验结果表明,该网络在MPA、mIoU和F1值这3项指标上均优于其它对比网络,验证了该网络的有效性。 展开更多
关键词 裂缝检测 语义分割 编码解码 可变形卷积 空洞卷积 残差连接 注意力机制
在线阅读 下载PDF
基于Encoder-Decoder网络的遥感影像道路提取方法 被引量:55
7
作者 贺浩 王仕成 +2 位作者 杨东方 王舒洋 刘星 《测绘学报》 EI CSCD 北大核心 2019年第3期330-338,共9页
针对道路目标特点,设计实现了用于遥感影像道路提取的Encoder-Decoder深度语义分割网络。首先,针对道路目标局部特征丰富、语义特征较为简单的特点,设计了较浅深度、分辨率较高的Encoder-Decoder网络结构,提高了分割网络的细节表示能力... 针对道路目标特点,设计实现了用于遥感影像道路提取的Encoder-Decoder深度语义分割网络。首先,针对道路目标局部特征丰富、语义特征较为简单的特点,设计了较浅深度、分辨率较高的Encoder-Decoder网络结构,提高了分割网络的细节表示能力。其次,针对遥感影像中道路目标所占像素比例较小的特点,改进了二分类交叉熵损失函数,解决了网络训练中正负样本严重失衡的问题。在大型道路提取数据集上的试验表明,所提方法召回率、精度和F1-score指标分别达到了83.9%、82.5%及82.9%,能够完整准确地提取遥感影像中的道路目标。所设计的Encoder-Decoder网络性能优良,且不需人工设计提取特征,因而具有良好的应用前景。 展开更多
关键词 遥感 道路提取 深度学习 语义分割 编解码网路
在线阅读 下载PDF
联合边缘检测强化空间细节的语义分割方法 被引量:2
8
作者 刘伯红 蒋佳跞 《重庆邮电大学学报(自然科学版)》 北大核心 2025年第1期57-66,共10页
针对图像语义分割中存在的边缘模糊和准确度较低的问题,提出一种基于边缘感知强化空间细节的图像语义分割方法,在语义分割网络中引入边缘检测模块,以捕获更加精细的空间细节。模型采用编码器-解码器结构,使用空间金字塔池化模块(atrous ... 针对图像语义分割中存在的边缘模糊和准确度较低的问题,提出一种基于边缘感知强化空间细节的图像语义分割方法,在语义分割网络中引入边缘检测模块,以捕获更加精细的空间细节。模型采用编码器-解码器结构,使用空间金字塔池化模块(atrous spatial pyramid pooling,ASPP)提取语义信息;提出双向多级聚合模块(bi-directional multi-level aggregation,BMLA)生成边缘特征,并使其强化空间细节;设计一种新型的基于注意力机制的特征融合模块(attention feature fusion module,AFFM),将强化后的空间特征与语义特征融合。采用Cityscapes和ADE20K数据集进行实验,对比其他主流语义分割算法,该方法在分割性能上具有不错的竞争力。 展开更多
关键词 语义分割 边缘检测 编码器-解码器 注意力机制
在线阅读 下载PDF
基于自注意力机制的高分遥感影像语义分割 被引量:3
9
作者 杨军 张金影 康玥 《哈尔滨工程大学学报》 北大核心 2025年第2期344-354,共11页
针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助... 针对遥感影像多尺度特征提取困难、上下文信息利用不足的问题,本文结合自注意力机制和深度可分离卷积提出一种线性多头自注意力网络模型,适用于高分辨率遥感影像语义分割。在自注意力模块之前引入深度可分离卷积,减少计算量的同时有助于捕获局部特征;在编码器分支中提出线性的多头自注意力模块以降低模型的计算复杂度;设计一个解码器来恢复特征图分辨率,通过级联操作整合各层级的特征并生成高分辨率的语义分割结果。所提算法在ISPRS Vaihingen和Potsdam数据集上的分割结果的mF1分别达到了90.77%和92.36%,与目前主流算法相比,不透水表面、建筑、低矮植物、树木类的分割准确率及总体分割准确率均有提高。本文算法构建的线性多头自注意力网络是一种高效的高分辨率遥感影像语义分割模型。 展开更多
关键词 高分辨率遥感影像 多头自注意力 深度可分离卷积 语义分割 特征提取 卷积神经网络 编码器 解码器
在线阅读 下载PDF
基于注意力解码和连续性监督的裂缝检测方法
10
作者 谢永华 卓安南 《计算机工程与应用》 北大核心 2025年第4期122-129,共8页
裂缝检测是预防重大建筑坍塌事故的重要措施。针对裂缝特征微弱和图像背景噪声干扰较多的问题,引入语义分割领域的编码解码结构算法来提升检测鲁棒性。为了解决编码解码结构网络中解码方式单一且不能高效联系编码特征语义信息的缺陷,设... 裂缝检测是预防重大建筑坍塌事故的重要措施。针对裂缝特征微弱和图像背景噪声干扰较多的问题,引入语义分割领域的编码解码结构算法来提升检测鲁棒性。为了解决编码解码结构网络中解码方式单一且不能高效联系编码特征语义信息的缺陷,设计了基于注意力机制的解码模块,通过注意力机制增强解码器对裂缝特征的关注度,优化了模型的解码效果;对于模型预测结果中裂缝断裂问题,改进了连续性监督算法,通过在模型预测阶段加入连续性邻接图预测,并结合对应的损失函数进行监督,提高预测结果中裂缝的特征连续性;最后结合这两种方法搭建了一种编码解码结构的自动化裂缝检测模型。通过在两个数据集上的实验结果,验证了所提方法的优越性,在选取的常用算法中取得了最高的检测精度。 展开更多
关键词 裂缝检测 语义分割 编码解码 注意力机制 连续性监督
在线阅读 下载PDF
基于语义分割的静脉输液液位检测
11
作者 邹学玉 熊莉娅 +1 位作者 周箩鱼 喻旸 《长江大学学报(自然科学版)》 2025年第4期119-126,共8页
为了解决人工监控静脉输液过程效率低问题,利用摄像头拍摄的输液容器图片,对输液容器液位线进行检测。通过语义分割来预测输液图片中每个像素点的标签,将液位检测问题转化为三类分割问题:背景、有液区域和无液区域。其中,将背景分割出... 为了解决人工监控静脉输液过程效率低问题,利用摄像头拍摄的输液容器图片,对输液容器液位线进行检测。通过语义分割来预测输液图片中每个像素点的标签,将液位检测问题转化为三类分割问题:背景、有液区域和无液区域。其中,将背景分割出来获得输液目标,再以液位线为界限把输液目标分割为有液区域和无液区域,从而实现输液目标液位检测。首先,通过标注不同光照条件、容量和背景下的单目标和双目标图片,创建输液目标数据集。然后,搭建基于VGG16(visual geometry group)的U-Net模型和基于Mobilenetv2、ResNet50的金字塔场景解析网络(PSPNet)模型。三个网络结合迁移学习方法,弥补自建输液数据集不足问题,加速模型学习效率。试验结果表明,三个网络都能分割输液目标,其中,基于VGG16网络的U-Net模型更优,其平均交并比(MIoU)为89.5%,平均像素精度(MPA)为94.8%。 展开更多
关键词 液位检测 语义分割 编码解码结构 卷积神经网络 残差网络
在线阅读 下载PDF
基于词语级和句子级语义的中文语义通信系统
12
作者 邓杰文 赵海涛 +5 位作者 魏急波 曹阔 张亦弛 罗鹏 张聿远 刘月玲 《电子与信息学报》 北大核心 2025年第8期2549-2562,共14页
语义通信作为一种新的通信范式,能在语义层面提升通信的有效性和可靠性。然而,现有语义通信系统的研究大多基于英文语料,面向中文语料的语义通信系统研究较为缺乏。因此,该文提出一种基于模块化设计思想的中文语义通信系统,能够有效兼... 语义通信作为一种新的通信范式,能在语义层面提升通信的有效性和可靠性。然而,现有语义通信系统的研究大多基于英文语料,面向中文语料的语义通信系统研究较为缺乏。因此,该文提出一种基于模块化设计思想的中文语义通信系统,能够有效兼容现有数字通信技术。在发送端,该文提出一种针对中文文本的词性编码方法,显著提升了通信系统的有效性;在接收端,提出一种基于词语级和句子级语义的联合上下文译码机制,并融合候选集合机制与递归算法,进一步提升了通信系统的可靠性。仿真结果表明,词语级和句子级语义可显著提升通信系统的有效性和可靠性,所提语义通信系统在有效性和可靠性方面整体性能表现优异。 展开更多
关键词 语义通信 词性编码 联合上下文译码 词语级语义 句子级语义
在线阅读 下载PDF
中文阅读伴随词汇学习:高效与低效组的认知加工策略比较
13
作者 向颖 贺斐 +3 位作者 冯琳琳 龙梦灵 白学军 梁菲菲 《心理学报》 北大核心 2025年第9期1512-1528,共17页
基于读者的词汇习得效果分组,比较两组被试在阅读中的眼动控制模式,探讨高效词汇习得是否和特定的认知加工策略相关。构造两类假字作为新词,操纵新词义符和语境所提示的语义是否一致,形成两个实验条件:语义透明和语义不透明。将新词插入... 基于读者的词汇习得效果分组,比较两组被试在阅读中的眼动控制模式,探讨高效词汇习得是否和特定的认知加工策略相关。构造两类假字作为新词,操纵新词义符和语境所提示的语义是否一致,形成两个实验条件:语义透明和语义不透明。将新词插入6个句子以构建新词表征,随后测试正字法知识的习得程度。116名大学生作为被试,根据正字法测试结果分为高效组和低效组。结果发现:第一,高效组在阅读中对新词及其语境投入的注视时间显著长于低效组,且随着学习的深入,高效组更大程度地调整新词和语境加工的认知资源分配,新词相对注视时间逐步下降,语境相对注视时间逐步增加。第二,仅高效组表现出稳定的语义透明度效应,表明高效组在新词习得中采用了亚词汇语义解码策略。上述发现支持聚焦-充实模型,表明阅读中的词汇习得效果和特定的认知加工策略相关。 展开更多
关键词 阅读伴随词汇习得 个体差异 亚词汇语义解码 义符
在线阅读 下载PDF
基于DB-PATNet的棉布瑕疵小样本语义分割
14
作者 杨正达 李波 +2 位作者 苏莲花 姚为 田淙文 《计算机工程与设计》 北大核心 2025年第6期1803-1809,共7页
针对棉布生产中棉布瑕疵的小样本特点,采用小样本学习的方法,在PATNet基础上提出一种双分支小样本语义分割网络DB-PATNet。基于瑕疵样本低对比度和尺度差异大的特点,提出双分支解码器结构和双向指导策略;引入结合自注意力的特征转换模块... 针对棉布生产中棉布瑕疵的小样本特点,采用小样本学习的方法,在PATNet基础上提出一种双分支小样本语义分割网络DB-PATNet。基于瑕疵样本低对比度和尺度差异大的特点,提出双分支解码器结构和双向指导策略;引入结合自注意力的特征转换模块,增强模型对新类样本和新域样本的泛化能力。实验结果表明,DB-PATNet网络的mIoU在5-shot设置中相较于PATNet网络提升了2.67%,相比RePRI网络提升了8.84%。在跨域实验中,mIoU在1-shot设置中达到了57.61%,在5-shot设置中达到了64.43%,接近常规语义分割网络的性能。 展开更多
关键词 棉布瑕疵 小样本学习 语义分割 双分支解码器结构 双向指导策略 自注意力 特征转换
在线阅读 下载PDF
ECENet:一种高分辨率遥感影像山区耕地提取方法
15
作者 俞友 张子轩 黄亮 《遥感信息》 北大核心 2025年第4期37-44,共8页
针对山区耕地破碎、边界模糊、耕地自动化提取精度仍然较低的问题,提出一种针对不规则耕地的高分辨率遥感影像提取方法。该方法基于CNN-Transformer编解码器架构,构建了高效耕地提取网络模型(efficient cropland extraction net,ECENet... 针对山区耕地破碎、边界模糊、耕地自动化提取精度仍然较低的问题,提出一种针对不规则耕地的高分辨率遥感影像提取方法。该方法基于CNN-Transformer编解码器架构,构建了高效耕地提取网络模型(efficient cropland extraction net,ECENet)。通过可变卷积增强编码器对不规则耕地边界的特征提取能力,同时在解码器中引入高效局部注意力(efficient local attention,ELA),提高了模型对破碎耕地识别的准确性。在自建的GF-2遥感影像耕地数据集上,在与6种语义分割模型的对比实验中表现出色,总体精度、精确率、召回率、F1分数、平均交并比均取得最优值。并设置消融实验,测试不同模块对模型整体性能提升的影响。实验结果验证了ECENet在山区复杂地貌下的耕地提取任务中显著的有效性和优越性。 展开更多
关键词 深度学习 语义分割 耕地提取 编解码 注意力机制
在线阅读 下载PDF
SACE-Net:结构感知的高分遥感影像建筑物与道路协同提取方法
16
作者 龚思诗 李圣文 +4 位作者 王渝 闵楠 赵宇翔 方芳 周顺平 《地球信息科学学报》 北大核心 2025年第12期2894-2909,共16页
【目的】作为城市空间结构的重要组成部分,建筑物与道路信息在城市规划、灾害响应和自动驾驶等前沿领域具有重要的应用价值。鉴于二者在空间分布上的高度关联性,协同提取建筑物和道路两类地物已成为高分辨率遥感影像解译的重要研究方向... 【目的】作为城市空间结构的重要组成部分,建筑物与道路信息在城市规划、灾害响应和自动驾驶等前沿领域具有重要的应用价值。鉴于二者在空间分布上的高度关联性,协同提取建筑物和道路两类地物已成为高分辨率遥感影像解译的重要研究方向。然而,现有方法尚未充分利用两类地物间的空间结构和各自的形态结构特性,存在地物边界不清晰及小尺寸对象漏检问题。【方法】为解决上述问题,本文提出了一种结构感知的协同提取网络SACE-Net,综合考虑地物的空间结构与形态结构,以提升建筑物和道路的协同提取性能。网络设计了特征空间交互模块,通过查询引导的跨注意力机制学习建筑物和道路的空间结构互补特征,增强两类地物间的特征交互与信息融合;同时,构建了形态结构感知的双分支解码模块,通过注意力引导机制与方向感知机制,实现对两类地物的形态结构的差异化解码。【结果】在Massachusetts与AIOI这2个公开数据集上的实验结果表明,SACE-Net在定量与可视化性能上均优于7种基线方法。定量结果显示,SACE-Net的平均交并比在Massachusetts和AIOI数据集上分别达到75.82%和64.14%,相较于现有最优协同提取方法分别提升了10.70%和4.90%;可视化结果进一步验证了模型在保持建筑物轮廓完整性和道路连通性方面具有显著优势,减少了边界模糊、漏检或误检等问题;消融实验结果显示,在基础网络中添加特征空间交互模块和双分支解码模块后,2个公开数据集的平均交并比相较于基础模型分别提升了18.96%和14.01%,验证了SACE-Net中各模块的有效性。【结论】本文通过强化模型对建筑物与道路空间及形态结构特征的感知,提升了地物协同提取精度,并为高分辨率遥感影像的多类地物协同提取提供了方法参考。 展开更多
关键词 结构感知 高分遥感影像 协同提取 注意力机制 深度学习 双分支解码 特征交互 语义分割
原文传递
GMFNet:全局多尺度和多级别的特征融合语义分割网络 被引量:1
17
作者 陈金令 赵成明 李洁 《计算机应用与软件》 北大核心 2025年第4期311-318,334,共9页
语义分割网络在编码器-解码器中融合高低水平特征存在以下问题:(1)在空间和通道中特征提取无法同步,导致特征组合无法获取全局上下文信息;(2)特征融合无法充分利用高低水平特征图像,导致语义边界模糊。设计全局空洞空间金字塔池化,该结... 语义分割网络在编码器-解码器中融合高低水平特征存在以下问题:(1)在空间和通道中特征提取无法同步,导致特征组合无法获取全局上下文信息;(2)特征融合无法充分利用高低水平特征图像,导致语义边界模糊。设计全局空洞空间金字塔池化,该结构不仅在空间上提取多尺度信息和通道上对图像信息充分利用,还增强编码器阶段的特征重用。设计特征融合注意力模块,在编码器中连接不同阶段的高低水平特征和新特征。实验表明,该算法在Cityscapes数据集上达到了77.92%mIoU。 展开更多
关键词 语义分割 卷积神经网络 全局上下文信息 特征融合 编码器-解码器
在线阅读 下载PDF
基于多语义特征回复生成网络的任务型对话
18
作者 姚震 杨州 +2 位作者 廖祥文 陈志豪 姚孟韬 《中文信息学报》 北大核心 2025年第7期91-101,共11页
任务型对话旨在实现机器与用户间的问答交互,进而完成用户提出的特定要求。现有方法主要利用用户对话领域或对话动作等单一特征完成回复解码操作,这种单一类型的特征使得模型学习到的语义信息较为片面,模型无法生成全面的候选回复,导致... 任务型对话旨在实现机器与用户间的问答交互,进而完成用户提出的特定要求。现有方法主要利用用户对话领域或对话动作等单一特征完成回复解码操作,这种单一类型的特征使得模型学习到的语义信息较为片面,模型无法生成全面的候选回复,导致回复成功率和准确度较低。因此,该文提出一种基于多语义特征回复生成网络的对话模型。首先为全局语义信息和两类语义特征(对话领域、对话动作)分别构建一个双向门控循环网络作为回复生成网络;随后三个回复生成网络进行解码操作获得包含多类语义特征信息的候选回复集合;最后自适应选择网络通过计算比对,筛选出语义信息丰富且满足用户需要的候选回复作为最终回复。该方法融合对话领域和对话动作两类语义特征信息,提高了回复成功率和准确度,在MultiWOZ 2.0和MultiWOZ 2.1两个公开数据集上的实验结果表明,该方法明显优于基准模型。 展开更多
关键词 任务型对话系统 端到端结构 多回复解码器 多语义特征
在线阅读 下载PDF
非侵入性连续中文语言语义解码与重建
19
作者 马磊 崔文浩 +1 位作者 杨汶汶 王朝欣 《数据采集与处理》 北大核心 2025年第3期616-636,共21页
语言是沟通和认知的基础,大脑多功能区域通过复杂神经网络共同参与语言的感知、理解与生成,深入探索中文语义解码的神经机制对于中文脑机接口(Brain-computer interface,BCI)的研究意义重大。本研究旨在构建一种基于功能性磁共振成像(Fu... 语言是沟通和认知的基础,大脑多功能区域通过复杂神经网络共同参与语言的感知、理解与生成,深入探索中文语义解码的神经机制对于中文脑机接口(Brain-computer interface,BCI)的研究意义重大。本研究旨在构建一种基于功能性磁共振成像(Functional magnetic resonance imaging,fMRI)的长序列中文连续语义解码方法,称为中文长序列连续语义解码器(Chinese long-sequence continuous semantic decoder,CLCSD),通过信号处理流程和算法优化,实现连续中文语义的高效解码。CLCSD包含神经响应降维、编码模型、语速模型和束搜索解码模型4个部分。神经响应降维通过皮层重建、图像配准和脑区划定等方法,将4维脑响应数据降为2维矩阵。编码模型采用L2正则化回归(岭回归)建立刺激特征与脑响应之间的关系,通过自举法估计噪声协方差以增强泛化。语速模型采用与编码模型类似的思路,将脑响应特征映射到预测的语速。束搜索解码模型利用语言模型的先验概率和编码模型的似然概率,通过束搜索生成最可能的语义序列。CLCSD在公开数据集SMN4Lang上取得了0.674的BERTScore,高于其他长序列中文连续语义解码模型。本研究提出一种高效的长序列中文连续语义解码方法,为中文脑机接口技术的发展提供理论基础和方法参考。 展开更多
关键词 脑机接口 中文语义解码 岭回归 语速模型 束搜索
在线阅读 下载PDF
基于ACSBL-DeepLabV3+的遥感图像地物分类方法研究
20
作者 冯丹亭 于淼 于晓鹏 《无线电工程》 2025年第3期548-557,共10页
针对高分辨率遥感图像分割中复杂环境下的遥感影像提取不精准及小型物体易被忽略,导致类别提取不完整、物体边界模糊的问题,提出一种基于DeepLabV3+网络改进的遥感图像语义分割方法。在编码器部分,采用MobileNetV2轻量级网络作为主干特... 针对高分辨率遥感图像分割中复杂环境下的遥感影像提取不精准及小型物体易被忽略,导致类别提取不完整、物体边界模糊的问题,提出一种基于DeepLabV3+网络改进的遥感图像语义分割方法。在编码器部分,采用MobileNetV2轻量级网络作为主干特征提取网络,使用非对称卷积空间金字塔池化模块(Asymmetric Spatial Pyramid Pooling Module,ACS-ASPP),将解码器进行细化,与主干网络提取的浅层特征加权融合,引入选择性大核注意力(Large Selective Kernel Attention,LSK)机制。在Vaihingen和Potsdam数据集高分辨率遥感影像数据集上的实验表明,该方法多项性能评价指标均优于U-Net、PSP-Net、全卷积网络(Fully Con-volutional Network,FCN)等多个语义分割网络,总体平均交并比(mean Intersection over Union,mIoU)分别达到69.13%、75.68%,F1-Score分别达到80.75%、85.84%。实验结果表明,该网络能够有效对各个类别进行分类,具备较高的实用价值。 展开更多
关键词 遥感图像多分类 语义分割 DeepLabV3+ 选择性大核注意力机制 解码器细化
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部