期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
医学视觉问答中的问题类型与答案一致性校验
1
作者 戴舒婷 刘利军 +2 位作者 杨小兵 黄青松 袁钰博 《小型微型计算机系统》 北大核心 2025年第4期922-931,共10页
医学视觉问答(Med-VQA)旨在根据医学影像内容准确回答临床问题,具有巨大应用潜力.现有Med-VQA方法大都统一处理开放式问题和封闭式问题,忽略了问题的复杂多变性,导致模型准确率较低.同时,受语言先验影响,模型容易利用数据集中问答对的... 医学视觉问答(Med-VQA)旨在根据医学影像内容准确回答临床问题,具有巨大应用潜力.现有Med-VQA方法大都统一处理开放式问题和封闭式问题,忽略了问题的复杂多变性,导致模型准确率较低.同时,受语言先验影响,模型容易利用数据集中问答对的分布规律,削弱了问题与答案的深层关系,导致出现答非所问现象.针对以上问题,本文提出一种即插即用的细粒度问题类型与答案一致性校验方法.首先,识别输入问题为开放式或封闭式类型以实现参数不共享的独立推理;然后,对开放式问题细粒度分类以进一步捕获复杂开放式问题对答案的约束关系;最后,根据问题类型生成答案掩码掩盖无关答案,实现问题类型与答案的一致性校验,进而缓解答非所问现象.在公共数据集SLAKE和VQA-RAD上的实验结果表明,本文方法能有效提高Med-VQA准确率. 展开更多
关键词 医学视觉问答 细粒度问题类型 答案掩码 一致性校验
在线阅读 下载PDF
基于先验MASK注意力机制的视频问答方案 被引量:2
2
作者 许振雷 董洪伟 《计算机工程》 CAS CSCD 北大核心 2021年第2期52-59,共8页
视频问答是深度学习领域的研究热点之一,广泛应用于安防和广告等系统中。在注意力机制框架下,建立先验MASK注意力机制模型,使用Faster R-CNN模型提取视频关键帧以及视频中的对象标签,将其与问题文本特征进行3种注意力加权,利用MASK屏蔽... 视频问答是深度学习领域的研究热点之一,广泛应用于安防和广告等系统中。在注意力机制框架下,建立先验MASK注意力机制模型,使用Faster R-CNN模型提取视频关键帧以及视频中的对象标签,将其与问题文本特征进行3种注意力加权,利用MASK屏蔽与问题无关的答案,从而增强模型的可解释性。实验结果表明,该模型在视频问答任务中的准确率达到61%,与VQA+、SA+等视频问答模型相比,其具有更快的预测速度以及更好的预测效果。 展开更多
关键词 视频问答 计算机视觉 自然语言处理 注意力机制 mask模型
在线阅读 下载PDF
融入软掩码机制增强数值表示的表格-文本混合问答 被引量:1
3
作者 张腾勋 许鸿飞 +2 位作者 约瑟夫·范·吉纳比斯 熊德意 昝红英 《小型微型计算机系统》 CSCD 北大核心 2024年第6期1292-1300,共9页
表格-文本混合问答需要从异质数据中进行数值推理得到答案,当前的研究将问题、表格、文本拼接作为输入,但其中包含太多不相关的数值和文本会降低模型的性能.使用硬掩码机制将噪音去除以增强正确的数值表示会产生错误传播问题,本文提出... 表格-文本混合问答需要从异质数据中进行数值推理得到答案,当前的研究将问题、表格、文本拼接作为输入,但其中包含太多不相关的数值和文本会降低模型的性能.使用硬掩码机制将噪音去除以增强正确的数值表示会产生错误传播问题,本文提出一种新的软掩码机制对原始输入表示进行缩放,从而增强正确的数值表示,同时减轻错误传播问题,并且该机制可以灵活地运用到各种模型以及任务中.本文在FinQA、ConvFinQA和MultiHiertt数据集上进行实验,结果表明通过软掩码机制增强数值表示可显著提升模型的性能(+1.27/+1.65Exe/Prog Acc、+3.09/+2.96Exe/Prog Acc和+5.29/+3.45EM/F1).本文还通过消融实验分析软掩码相对于硬掩码的优势,以及不同软掩码向量的影响,并讨论了当前表格-文本混合问答的局限性与未来方向. 展开更多
关键词 自然语言处理 表格-文本问答 软掩码 数值推理
在线阅读 下载PDF
基于混合动态掩码与多策略融合的医疗知识图谱问答 被引量:4
4
作者 王润周 张新生 《计算机科学与探索》 CSCD 北大核心 2024年第10期2770-2786,共17页
医疗知识图谱问答结合医学知识和自然语言处理技术,为医疗从业者和患者提供准确、快速的问答服务。随着数据激增,现有的中文医疗知识图谱不够全面,并且医学问题复杂多义,准确识别实体信息、生成通俗易懂的回答仍有挑战。提出了一种基于... 医疗知识图谱问答结合医学知识和自然语言处理技术,为医疗从业者和患者提供准确、快速的问答服务。随着数据激增,现有的中文医疗知识图谱不够全面,并且医学问题复杂多义,准确识别实体信息、生成通俗易懂的回答仍有挑战。提出了一种基于混合动态掩码与多策略融合的医疗知识图谱问答框架。通过整合公开数据集与医药平台的疾病知识,构建了一个包含34167个实体和297463条关系的医疗知识图谱,涵盖疾病、药品、食物等多个类别。提出BERT-MaskAttention-BiLSTM-CRF混合动态掩码模型来精确识别输入的医疗实体信息,更有效地关注重要内容,去除冗余信息干扰。采用实体对齐策略将医疗实体进行统一和标准化,通过意图识别策略深入理解用户的查询意图,结合大型语言模型对知识图谱的输出进行润色,保证回答内容更加容易理解。实验结果表明,在实体识别对比实验中模型的宏观平均F1值达到0.9602,在问答测试实验中,平均准确率达到0.9656,且生成的内容更加通俗易懂,可解释性强。 展开更多
关键词 混合动态掩码 多策略融合 知识图谱 医疗问答 大语言模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部