期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
融合SAM掩码的弱监督语义分割伪标签生成算法
1
作者 刘保虎 《智能计算机与应用》 2025年第10期156-162,共7页
弱监督语义分割中生成的伪标签质量对最后的分割效果起决定作用,现有的伪标签生成算法多采用Vision Transformer(ViT)为特征提取网络,由于ViT提取特征过度平滑导致激活区域泛化,因此本文提出融合(Segment Anything Model,SAM)生成的伪... 弱监督语义分割中生成的伪标签质量对最后的分割效果起决定作用,现有的伪标签生成算法多采用Vision Transformer(ViT)为特征提取网络,由于ViT提取特征过度平滑导致激活区域泛化,因此本文提出融合(Segment Anything Model,SAM)生成的伪标签来引导泛化的伪标签聚焦目标区域。首先,对原图进行数据增强,融合不同增强图像的分割伪掩码来提高SAM生成伪标签的精度;然后,对融合后的伪标签进行评估,使用熵值给有效像素分配更高的权重;另外,在ViT中插入类令牌对比模块(Class Token Contrast,CTC),该模块可以促进非显著局部对象和全局对象表示的一致性,使伪标签包含更多的目标区域;最后,通过卷积网络将SAM生成的伪标签和ViT网络生成的伪标签进行融合。实验证明,本文生成的伪标签在电芯蓝膜数据集上测试,精度达到89.51%,平均分割率达到85.65%。 展开更多
关键词 视觉转换器 SAM引导 类令牌对比 伪标签优化
在线阅读 下载PDF
EPT:Data Augmentation with Embedded Prompt Tuning for LowResource Named Entity Recognition
2
作者 YU Hongfei NI Kunyu +2 位作者 XU Rongkang YU Wenjun HUANG Yu 《Wuhan University Journal of Natural Sciences》 CAS CSCD 2023年第4期299-308,共10页
Data augmentation methods are often used to address data scarcity in natural language processing(NLP).However,token-label misalignment,which refers to situations where tokens are matched with incorrect entity labels i... Data augmentation methods are often used to address data scarcity in natural language processing(NLP).However,token-label misalignment,which refers to situations where tokens are matched with incorrect entity labels in the augmented sentences,hinders the data augmentation methods from achieving high scores in token-level tasks like named entity recognition(NER).In this paper,we propose embedded prompt tuning(EPT)as a novel data augmentation approach to low-resource NER.To address the problem of token-label misalignment,we implicitly embed NER labels as prompt into the hidden layer of pre-trained language model,and therefore entity tokens masked can be predicted by the finetuned EPT.Hence,EPT can generate high-quality and high-diverse data with various entities,which improves performance of NER.As datasets of cross-domain NER are available,we also explore NER domain adaption with EPT.The experimental results show that EPT achieves substantial improvement over the baseline methods on low-resource NER tasks. 展开更多
关键词 data augmentation token-label misalignment named entity recognition pre-trained language model PROMPT
原文传递
中文电子病历数据元抽取方法 被引量:1
3
作者 郭维嘉 郭少友 《医学信息学杂志》 CAS 2024年第8期78-83,共6页
目的/意义提出基于国家标准的电子病历数据元抽取方法,以实现电子病历数据的细粒度共享。方法/过程利用ALBERT、BiLSTM和CRF模型对电子病历进行序列标注,并根据标注结果生成一组候选数据元;针对每个候选数据元,采集其上下文信息并形成... 目的/意义提出基于国家标准的电子病历数据元抽取方法,以实现电子病历数据的细粒度共享。方法/过程利用ALBERT、BiLSTM和CRF模型对电子病历进行序列标注,并根据标注结果生成一组候选数据元;针对每个候选数据元,采集其上下文信息并形成一个增强的键向量;计算该向量与标准向量之间的相似度,据此判断候选数据元是否有效。结果/结论该方法F 1值为90.32%,效果较好。 展开更多
关键词 电子病历 数据元 ALBERT 序列标注 token向量
暂未订购
基于克隆检测技术的性能Bugs查找
4
作者 邓子含 徐云 《计算机系统应用》 2023年第7期57-64,共8页
性能bug是指代码中降低程序运行效率的缺陷.现有的检测工具只能查找特定类型的性能bug并且需要复杂的程序分析过程,因而缺乏通用性并且时空开销巨大.同时,有许多经典的克隆检测技术被用于一般性相似代码检测,但是它们只能检测高度相似... 性能bug是指代码中降低程序运行效率的缺陷.现有的检测工具只能查找特定类型的性能bug并且需要复杂的程序分析过程,因而缺乏通用性并且时空开销巨大.同时,有许多经典的克隆检测技术被用于一般性相似代码检测,但是它们只能检测高度相似的代码或者需要依赖训练集,使得它们难以用于在真实数据集中查找性能bug.基于此,通过构建带有标记token的代码模板,本文提出一种使用克隆检测技术来查找多种类型的性能bug的方法.通过对不同类型和频度的token标记不同的权重,本文提出的方法可以区分其重要性并因此提取出代码中的关键信息.在真实项目构成的数据集上的实验表明,本方法可以发现更多类型的性能bug同时比现有工具耗时更少.另一项实验也证明了本方法显著提升了基于token的克隆检测技术的检测能力,相比于现有的克隆检测方法更适合用于性能bug查找. 展开更多
关键词 性能bug检测 代码克隆检测 代码模板 带标记的token
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部