期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
基于Sentence-MacBERT模型的同源录波数据匹配方法 被引量:1
1
作者 戴志辉 张富泽 +1 位作者 韩笑 王冠南 《电力系统保护与控制》 北大核心 2025年第8期159-167,共9页
由于不同时期的录波数据记录标准有所不同,以及各个生产厂家对标准的解读存在偏差,造成同源录波数据的通道名称存在个性化差异,且通道索引号不同,难以进行录波数据的同源匹配。针对上述问题,提出基于句向量掩码纠错双向编码器表征语言模... 由于不同时期的录波数据记录标准有所不同,以及各个生产厂家对标准的解读存在偏差,造成同源录波数据的通道名称存在个性化差异,且通道索引号不同,难以进行录波数据的同源匹配。针对上述问题,提出基于句向量掩码纠错双向编码器表征语言模型(sentence-masked language model as correction bidirectional encoder representations from transformers,Sentence-MacBERT)的同源录波数据匹配方法。首先,分析录波文件的记录格式特点,根据录波文件的格式特点完成核查信息表的构建。然后,通过构建的核查信息表进行录波文件自动校核。最后,在双向编码器表征(bidirectional encoder representations from transformers,BERT)模型的基础上构建Sentence-MacBERT同源通道匹配模型,完成同源录波数据匹配。算例分析表明,根据核查信息表能够完成录波文件的自动校核,并对解析失败的录波文件发出告警信息。利用Sentence-MacBERT模型进行通道名称匹配的效果良好,能够有效地完成录波数据的同源匹配,帮助运行人员进行故障分析。 展开更多
关键词 录波数据 Sentence-macbert 自动校核 通道名称 同源匹配
在线阅读 下载PDF
融合注意力机制的MacBERT-DPCNN农业文本分类模型 被引量:1
2
作者 张典 刘畅 +2 位作者 陈雯柏 缪祎晟 吴华瑞 《中国农机化学报》 北大核心 2025年第8期83-89,共7页
针对农业领域文本信息密度大、语义模糊、特征稀疏的特点,提出一种基于MacBERT(MLM as correction-BERT)、深度金字塔卷积网络(DPCNN)和注意力机制(Attention)的农业文本分类模型,命名为MacBERT—DPCNN—Attention(MDA)。首先,使用MacB... 针对农业领域文本信息密度大、语义模糊、特征稀疏的特点,提出一种基于MacBERT(MLM as correction-BERT)、深度金字塔卷积网络(DPCNN)和注意力机制(Attention)的农业文本分类模型,命名为MacBERT—DPCNN—Attention(MDA)。首先,使用MacBERT模型充分提取农业类文本内容的上下文信息,强化文本的语义特征表示。然后,DPCNN模型通过其多层卷积神经网络和池化操作,有效捕获文本的局部特征。最后,注意力机制进一步增强农业文本序列的特征表达。结果表明,与其他主流模型如BERT—DPCNN、BERT—CNN、BERT—RNN相比,MDA模型在农业文本分类任务上的精确率提升1.04%以上,召回率提升0.95%以上,F1值提升0.14%以上。表明所提模型在解决农业领域文本分类问题方面的有效性和优越性。 展开更多
关键词 农业文本分类 macbert模型 深度金字塔卷积网络 注意力机制 预训练模型
在线阅读 下载PDF
基于MacBERT的台风灾害评估方法
3
作者 杨乐华 李冬梅 谭睿璞 《应用海洋学学报》 北大核心 2025年第4期805-815,共11页
台风灾害评估是一个多属性决策问题,针对台风灾害发生后决策信息来源的真实性和时效性问题,本研究提出一种中智环境下基于全词掩码的中文BERT模型(masked language model as correction BERT,MacBERT)的台风灾害评估方法。首先,使用微... 台风灾害评估是一个多属性决策问题,针对台风灾害发生后决策信息来源的真实性和时效性问题,本研究提出一种中智环境下基于全词掩码的中文BERT模型(masked language model as correction BERT,MacBERT)的台风灾害评估方法。首先,使用微调后的MacBERT模型对网络实时评论信息分指标量化,采用单值中智数表达台风灾害评论信息的分类结果;然后,采用逼近理想解排序方法(technique for order preference by similarity to an ideal solution,TOPSIS)把各个地区受台风灾害影响的程度进行排序,排序结果可用于辅助灾后应急救援工作。最后,以“黑格比”台风为例进行了案例分析,做了详细的灵敏性分析以确定分类模型的最优参数设置;排序结果与官方统计数据进行了对比,证明了评估方法的有效性;从数据转换效率的角度出发将单值中智数与精确数进行对比,证明了单值中智数在表达模型分类结果时比精确数更能有效地保留原始数据;从模型分类效果方面将MacBERT与ChatGPT模型进行对比,证明了微调后的MacBERT模型在处理台风灾害评论文本时具有更好的效果,最佳F1值达到0.983。 展开更多
关键词 台风灾害评估 macbert 多属性决策 单值中智数
在线阅读 下载PDF
基于MacBERT的融合依存句法信息和多视角词汇信息的中文命名实体识别方法
4
作者 李代成 李晗 +1 位作者 刘哲宇 龚诗恒 《计算机科学》 北大核心 2025年第S1期278-285,共8页
在实体类型开放和实体结构复杂的中文环境下,中文命名实体识别任务存在明显的实体边界判断错误和实体分类准确率低等问题。为了进一步改善上述问题,提出了一种以字符作为编码单位,并基于MacBERT预训练模型的中文命名实体识别模型——Mac... 在实体类型开放和实体结构复杂的中文环境下,中文命名实体识别任务存在明显的实体边界判断错误和实体分类准确率低等问题。为了进一步改善上述问题,提出了一种以字符作为编码单位,并基于MacBERT预训练模型的中文命名实体识别模型——MacBERT-SDI-ML。首先,为了提取更丰富的中文语义特征,提高实体识别的准确性,模型采用MacBERT作为嵌入层。其次,为了进一步增强实体表示的特征,提高实体分类的准确性,模型通过一个依存句法信息解析器(SDIP)对实体更丰富的依存信息进行更高效的提取,并将其融合到字符表示中。此外,考虑到字符在不同的词汇中可能处在不同的位置,模型设计了一种基于自注意力机制的面向多视角的词汇信息融合组件(MLIF),来进一步增强字符表示的边界特征,有助于提高对边界判断的能力。最后,分别在Weibo,OntoNotes和Resume数据集上对模型进行训练。实验表明,MacBERT-SDI-ML模型在3个数据集上的F1值分别达到72.97%,86.56%和98.45%。 展开更多
关键词 中文命名实体识别 macbert 词汇信息 依存信息 预训练模型 自注意力机制
在线阅读 下载PDF
基于MacBERT-GP的中文医学命名实体识别方法
5
作者 姚传彪 马汉杰 +3 位作者 董慧 许永恩 李少华 李东倪 《智能计算机与应用》 2025年第2期190-197,共8页
医学命名实体识别作为医学信息提取的基础任务,在构建医学知识图谱、解决医学问题和自动分析病例等方面具有重要意义。相较于一般领域的命名实体识别,医学命名实体识别面临中文分词复杂性和医学领域术语丰富性等挑战,同时医学命名实体... 医学命名实体识别作为医学信息提取的基础任务,在构建医学知识图谱、解决医学问题和自动分析病例等方面具有重要意义。相较于一般领域的命名实体识别,医学命名实体识别面临中文分词复杂性和医学领域术语丰富性等挑战,同时医学命名实体更为复杂、容易嵌套。为了提升现有命名实体识别模型的准确性,解决训练过程中高质量标注数据匮乏的问题,针对医学命名实体识别,提出一种基于MacBERT-GP的中文医学命名实体识别方法。在CBLUE CMeEE-V2医疗命名实体识别数据集和CCKS2019电子病历数据集上的实验结果,充分验证了该方法的有效性。相较于经典的BERT-BiLSTM-CRF方法,所提出的方法在F1值上分别提升了6.24%和4.95%。 展开更多
关键词 macbert 大语言模型 全局指针 特征融合 嵌套实体
在线阅读 下载PDF
改进MacBERT与双阶段相似度的警情识别与公安应用
6
作者 李也桐 刘致用 《信息技术与信息化》 2025年第9期127-130,共4页
针对海量警情数据中相似案件识别效率低、中文文本语义复杂性高等问题,文章提出了一种基于改进MacBERT模型的相似警情识别方法。通过优化掩码语言模型任务,引入近义词替换、全词遮蔽及N-gram遮蔽策略,提升模型对中文复杂语法与警情领域... 针对海量警情数据中相似案件识别效率低、中文文本语义复杂性高等问题,文章提出了一种基于改进MacBERT模型的相似警情识别方法。通过优化掩码语言模型任务,引入近义词替换、全词遮蔽及N-gram遮蔽策略,提升模型对中文复杂语法与警情领域术语的语义理解能力。进一步构建双阶段相似度计算框架,融合细粒度语义匹配和基于向量编码的快速检索方法,在保证高精度的同时提升计算效率。实验基于公开数据集SimCLUE与警情数据,对比MacBERT和文本嵌入模型,结果表明,改进MacBERT在损失值、准确率和F1分数上均有良好表现,验证其对中文警情文本的强适应性;而文本嵌入模型凭借静态向量预训练特性,在运行时间与吞吐量上更具效率优势。实际公安场景验证表明,所提方法可高效支持案件串并分析、跨区域情报关联等任务,辅助缩短案件侦破周期,并优化警力资源配置。未来研究将聚焦多模态数据的语义融合与轻量化模型部署,进一步推动公安智能化转型。 展开更多
关键词 相似警情识别 macbert 交互策略 文本嵌入 公安实战
在线阅读 下载PDF
基于MacBERT和R-Drop的地质命名实体识别 被引量:2
7
作者 刘昕 徐洪珍 +1 位作者 刘爱华 邓德军 《郑州大学学报(工学版)》 CAS 北大核心 2024年第3期89-95,共7页
地质命名实体识别中常用的基于BERT预训练模型的深度学习方法是基于字的方法,没有利用词信息,且神经网络中的Dropout机制会导致训练阶段和推理阶段之间存在不一致性。针对该问题,提出了一种基于MacBERT和R-Drop的地质命名实体识别模型M... 地质命名实体识别中常用的基于BERT预训练模型的深度学习方法是基于字的方法,没有利用词信息,且神经网络中的Dropout机制会导致训练阶段和推理阶段之间存在不一致性。针对该问题,提出了一种基于MacBERT和R-Drop的地质命名实体识别模型MBCR。首先,通过MacBERT学习文本特征表示,充分利用字词信息;其次,运用BiGRU编码上下文特征,有效提取完整的语义信息;最后,采用CRF获取标签间的依赖关系,生成最优标签序列。此外,在训练过程中引入R-Drop,进一步提升模型的泛化能力。结果表明:与BiLSTM-CRF、BERTBiLSTM-CRF等模型相比,所提MBCR模型在NERdata数据集上的F1值提高了2.08百分点~4.62百分点,在Boson数据集上的F1值提高了1.26百分点~17.54百分点。 展开更多
关键词 命名实体识别 地质 macbert BiGRU R-Drop
在线阅读 下载PDF
基于MacBERT和标签平滑的新冠疫情公众情感分析研究 被引量:1
8
作者 王坤朋 禹龙 +2 位作者 王博 周铁军 田生伟 《东北师大学报(自然科学版)》 CAS 北大核心 2024年第2期83-90,共8页
针对BERT预训练与下游任务微调阶段存在不匹配差异,以及人工对文本数据进行情感倾向性标注可能存在误差的问题,提出一种基于MacBERT和标签平滑的网络模型(MacLMC).首先,在BERT的基础上引入MLM as correction策略,利用近义词替换被掩码词... 针对BERT预训练与下游任务微调阶段存在不匹配差异,以及人工对文本数据进行情感倾向性标注可能存在误差的问题,提出一种基于MacBERT和标签平滑的网络模型(MacLMC).首先,在BERT的基础上引入MLM as correction策略,利用近义词替换被掩码词,通过MacBERT预训练模型获取词向量;其次,经过双层LSTM学习长距离依赖;再次,采用双通道多卷积核的卷积操作,分别提取信息的最大特征和均值特征;最后,利用标签平滑策略降低模型预测类别的概率,提升模型对于标签的容错能力,提高模型泛化性.实验结果表明:与现有主流模型相比,本文模型在多种数据集上性能表现更佳,能够更好地用于新冠疫情公众情感分析任务. 展开更多
关键词 新冠疫情 macbert 标签平滑 情感分析
在线阅读 下载PDF
融合MacBERT和Talking⁃Heads Attention实体关系联合抽取模型 被引量:1
9
作者 王春亮 姚洁仪 李昭 《现代电子技术》 北大核心 2024年第5期127-131,共5页
针对现有的医学文本关系抽取任务模型在训练过程中存在语义理解能力不足,可能导致关系抽取的效果不尽人意的问题,文中提出一种融合MacBERT和Talking⁃Heads Attention的实体关系联合抽取模型。该模型首先利用MacBERT语言模型来获取动态... 针对现有的医学文本关系抽取任务模型在训练过程中存在语义理解能力不足,可能导致关系抽取的效果不尽人意的问题,文中提出一种融合MacBERT和Talking⁃Heads Attention的实体关系联合抽取模型。该模型首先利用MacBERT语言模型来获取动态字向量表达,MacBERT作为改进的BERT模型,能够减少预训练和微调阶段之间的差异,从而提高模型的泛化能力;然后,将这些动态字向量表达输入到双向门控循环单元(BiGRU)中,以便提取文本的上下文特征。BiGRU是一种改进的循环神经网络(RNN),具有更好的长期依赖捕获能力。在获取文本上下文特征之后,使用Talking⁃Heads Attention来获取全局特征。Talking⁃Heads Attention是一种自注意力机制,可以捕获文本中不同位置之间的关系,从而提高关系抽取的准确性。实验结果表明,与实体关系联合抽取模型GRTE相比,该模型F1值提升1%,precision值提升0.4%,recall值提升1.5%。 展开更多
关键词 macbert BiGRU 关系抽取 医学文本 Talking⁃Heads Attention 深度学习 全局特征 神经网络
在线阅读 下载PDF
基于MacBERT的方面级中文教学评论无监督情感分析框架
10
作者 顾明 王晓勇 胡胜利 《重庆科技大学学报(自然科学版)》 CAS 2024年第5期72-78,共7页
针对中文教学评论的情感分析,提出了基于预训练语言模型MacBERT的方面级中文教学评论无监督情感分析框架。首先,针对每个教学方面和情感极性,通过预训练语言模型构建语义一致的类别词表;然后,利用构建的词表和词性标签,基于重合率矩阵... 针对中文教学评论的情感分析,提出了基于预训练语言模型MacBERT的方面级中文教学评论无监督情感分析框架。首先,针对每个教学方面和情感极性,通过预训练语言模型构建语义一致的类别词表;然后,利用构建的词表和词性标签,基于重合率矩阵对训练语料库中的部分评论句进行标注;最后,利用已标注的评论句构建神经网络,通过MacBERT提取测试数据中方面类别和情感类别的联合隐藏特征,并利用抗噪声损失函数完成方面抽取和情感分类。实验结果表明,该模型在方面抽取和情感分类任务上的宏观F1值分别为78.10%和89.20%,说明该模型能够从学生反馈中准确完成方面类别抽取并确定每个评论句的情感极性。 展开更多
关键词 方面级情感分析 深度学习 macbert 预训练语言模型 重合率矩阵
在线阅读 下载PDF
基于MacBERT与对抗训练的在线课程评论的方面词抽取
11
作者 朱梦涵 唐海 +2 位作者 李贵荣 徐洪胜 刘洋 《山西大同大学学报(自然科学版)》 2024年第5期21-26,55,共7页
针对目前在线教育数据集规模相对较小,方面词抽取任务的标注数据相对稀缺的现象,提出利用在线课程评论制定相应的数据集。为验证基于深度学习的方面词抽取方法的有效性,提出基于MacBERT与对抗训练的方面词抽取模型。该模型利用MacBERT... 针对目前在线教育数据集规模相对较小,方面词抽取任务的标注数据相对稀缺的现象,提出利用在线课程评论制定相应的数据集。为验证基于深度学习的方面词抽取方法的有效性,提出基于MacBERT与对抗训练的方面词抽取模型。该模型利用MacBERT层提取文本语义信息并转换为词向量;在原始词向量上加入一定扰动生成对抗样本,提高模型鲁棒性;再通过BiLSTM层进一步获取上下文信息;最后使用CRF进一步优化模型结果,得到最佳预测序列。实验结果表明,在构建的在线课程评论数据集和人民日报公共数据集中,该模型识别结果优于其他基于主流神经网络的方面词抽取模型,较BERT-BiLSTM-CRF模型F1值分别提升了7.45%、7.06%,证明了该方法的可行性。 展开更多
关键词 方面词抽取 macbert 对抗训练 双向长短期记忆网络 条件随机场
在线阅读 下载PDF
基于MacBERT与对抗训练的机器阅读理解模型 被引量:1
12
作者 周昭辰 方清茂 +2 位作者 吴晓红 胡平 何小海 《计算机工程》 CAS CSCD 北大核心 2024年第5期41-50,共10页
机器阅读理解旨在让机器像人类一样理解自然语言文本,并据此进行问答任务。近年来,随着深度学习和大规模数据集的发展,机器阅读理解引起了广泛关注,但是在实际应用中输入的问题通常包含各种噪声和干扰,这些噪声和干扰会影响模型的预测... 机器阅读理解旨在让机器像人类一样理解自然语言文本,并据此进行问答任务。近年来,随着深度学习和大规模数据集的发展,机器阅读理解引起了广泛关注,但是在实际应用中输入的问题通常包含各种噪声和干扰,这些噪声和干扰会影响模型的预测结果。为了提高模型的泛化能力和鲁棒性,提出一种基于掩码校正的来自Transformer的双向编码器表示(Mac BERT)与对抗训练(AT)的机器阅读理解模型。首先利用Mac BERT对输入的问题和文本进行词嵌入转化为向量表示;然后根据原始样本反向传播的梯度变化在原始词向量上添加微小扰动生成对抗样本;最后将原始样本和对抗样本输入双向长短期记忆(Bi LSTM)网络进一步提取文本的上下文特征,输出预测答案。实验结果表明,该模型在简体中文数据集CMRC2018上的F1值和精准匹配(EM)值分别较基线模型提高了1.39和3.85个百分点,在繁体中文数据集DRCD上的F1值和EM值分别较基线模型提高了1.22和1.71个百分点,在英文数据集SQu ADv1.1上的F1值和EM值分别较基线模型提高了2.86和1.85个百分点,优于已有的大部分机器阅读理解模型,并且在真实问答结果上与基线模型进行对比,结果验证了该模型具有更强的鲁棒性和泛化能力,在输入的问题存在噪声的情况下性能更好。 展开更多
关键词 机器阅读理解 对抗训练 预训练模型 掩码校正的来自Transformer的双向编码器表示 双向长短期记忆网络
在线阅读 下载PDF
结合MacBERT与多层次特征协同网络的音乐社交评论情感分析模型
13
作者 兰庆炜 樊宁 《电子设计工程》 2023年第7期36-41,共6页
为更好地解决传统模型特征捕捉能力不足,词向量语义表示不准确等问题,提出了结合MacBERT与多层次特征协同网络的音乐社交评论情感分析模型MacBERT-MFCN(MacBERT and Multi-level Feature Collaborative Network)。采用MacBERT模型提取... 为更好地解决传统模型特征捕捉能力不足,词向量语义表示不准确等问题,提出了结合MacBERT与多层次特征协同网络的音乐社交评论情感分析模型MacBERT-MFCN(MacBERT and Multi-level Feature Collaborative Network)。采用MacBERT模型提取评论文本特征向量,解决静态词向量无法表示多义词的问题;多层次特征协同网络结合双向内置注意力简单循环单元(Bidirectional Built in Attention Simple Recurrent Unit,BiBASRU)和多层次卷积神经网络(Multilevel Convolutional Neural Network,MCNN)模块,全面捕捉局部和上下文语义特征;软注意力用来衡量分类特征贡献的大小,赋予关键特征更高权重。基于网易云评论文本数据集进行实验,结果表明,MacBERTMFCN模型F1值高达95.56%,能有效地提升文本情感分类准确率。 展开更多
关键词 情感分析 macbert 多层次特征协同网络 SRU 软注意力
在线阅读 下载PDF
基于MacBERT和对抗训练的城市内涝信息识别方法 被引量:2
14
作者 方美丽 郑莹莹 +3 位作者 陶坤旺 赵习枝 仇阿根 陆文 《集成技术》 2023年第1期56-67,共12页
BERT与神经网络模型相结合等方法,已逐渐应用于获取灾害信息,但此类方法存在参数量繁多、数据集和微调数据集不一致、局部不稳定等问题。针对上述问题,该文提出一种基于MacBERT和对抗训练的信息识别模型,该模型利用MacBERT预训练模型获... BERT与神经网络模型相结合等方法,已逐渐应用于获取灾害信息,但此类方法存在参数量繁多、数据集和微调数据集不一致、局部不稳定等问题。针对上述问题,该文提出一种基于MacBERT和对抗训练的信息识别模型,该模型利用MacBERT预训练模型获得初始向量表示,再加入些许扰动生成对抗样本,然后依次输入双向长短期记忆网络和条件随机场。该模型不仅减少了预训练次数和微调阶段差异,还提高了模型的鲁棒性。实验结果表明,在微博数据集和1998年人民日报数据集上,基于MacBERT和对抗训练的信息识别模型的精确率和F_(1)值均有所提升,性能较其他模型更优,将该模型用于城市内涝信息识别具有一定的可行性。 展开更多
关键词 城市内涝 信息识别 macbert 对抗训练
在线阅读 下载PDF
基于MacBERT⁃BiLSTM和注意力机制的短文本分类研究 被引量:3
15
作者 王道康 张吴波 《现代电子技术》 2023年第21期123-128,共6页
针对中文短文本上下文依赖性强,特征信息难以提取的问题,提出一种融合MacBERT、双向长短期记忆神经网络(BiLSTM)、注意力(Attention)机制的短文本分类模型方法。利用预训练模型MacBERT得到动态词向量,输入BiLSTM模型中提取上下文关系特... 针对中文短文本上下文依赖性强,特征信息难以提取的问题,提出一种融合MacBERT、双向长短期记忆神经网络(BiLSTM)、注意力(Attention)机制的短文本分类模型方法。利用预训练模型MacBERT得到动态词向量,输入BiLSTM模型中提取上下文关系特征。结合注意力机制分配不同的权重值,最后使用Softmax分类器得到分类结果。研究表明,该模型在THUCNews数据集上F1值达到了95.63%,相较于基准模型BERT提高了2.18%,验证了其在短文本分类任务中的可行性和有效性。 展开更多
关键词 短文本 文本分类 macbert BiLSTM ATTENTION 纠错掩码 特征加权 语义向量
在线阅读 下载PDF
基于MacBERT和对抗训练的审计文本命名实体识别 被引量:2
16
作者 钱泰羽 陈一飞 庞博文 《计算机科学》 CSCD 北大核心 2023年第S02期81-86,共6页
为了从审计文本中自动识别有效的实体信息,提高政策跟踪审计的效率,提出一种基于MacBERT(MLM as correction BERT)和对抗训练的审计文本命名实体识别(Named Entity Recognition,NER)模型(Audit-MBCA)。目前深度学习在NER任务上应用成熟... 为了从审计文本中自动识别有效的实体信息,提高政策跟踪审计的效率,提出一种基于MacBERT(MLM as correction BERT)和对抗训练的审计文本命名实体识别(Named Entity Recognition,NER)模型(Audit-MBCA)。目前深度学习在NER任务上应用成熟且成果显著,但审计文本存在语料库缺乏、实体边界识别不清晰等问题。针对这些问题,文中构建了审计文本数据集并将其命名为Audit 2022,使用MacBERT中文预训练语言模型获得其向量表示,同时引入对抗训练,利用中文分词(Chinese Word Segmentation,CWS)任务与NER任务的共享词边界信息帮助进行实体边界识别。实验结果表明,Audit-MBCA模型在Audit 2022数据集上的F 1值为91.05%,较主流模型提升了4.53%;在SIGHAN 2006数据集上的F 1值为93.70%,较其他模型提升了0.33%~3.25%,验证了所提模型的有效性和泛化能力。 展开更多
关键词 审计文本 命名实体识别 macbert 对抗训练
在线阅读 下载PDF
结合MacBERT和多尺度融合网络的档案数据分类研究 被引量:3
17
作者 刘舸舸 《电子设计工程》 2022年第19期65-68,73,共5页
针对传统深度学习模型特征提取能力不强,静态词向量语义表征能力弱等问题,提出了结合MacBERT和多尺度融合网络的档案数据分类模型。预训练模型MacBERT通过结合词的上下文语境,学习到动态词向量表示,解决一词多义问题;利用多尺度融合网... 针对传统深度学习模型特征提取能力不强,静态词向量语义表征能力弱等问题,提出了结合MacBERT和多尺度融合网络的档案数据分类模型。预训练模型MacBERT通过结合词的上下文语境,学习到动态词向量表示,解决一词多义问题;利用多尺度融合网络充分提取档案文本局部特征和上下文语义关联;根据软注意力机制计算每个特征对分类结果的影响权重,由分类层输出结果。在真实档案数据集进行实验,结果表明,结合MacBERT和多尺度融合网络的模型准确率达到90.5%,高于实验对比模型,具有一定的应用价值。 展开更多
关键词 档案文本分类 macbert 多尺度融合网络 软注意力
在线阅读 下载PDF
结合MacBERT的在线课程评论情感分析模型
18
作者 高杭 《电子设计工程》 2023年第10期39-43,共5页
针对静态词向量语义表征能力弱、传统模块特征抽取不全面等问题,提出了结合MacBERT和多尺度融合网络的在线课程评论情感分析模型。MacBERT模型根据词的具体上下文进行动态编码,提升词的语义表征能力。多尺度融合网络用于捕捉评论文本多... 针对静态词向量语义表征能力弱、传统模块特征抽取不全面等问题,提出了结合MacBERT和多尺度融合网络的在线课程评论情感分析模型。MacBERT模型根据词的具体上下文进行动态编码,提升词的语义表征能力。多尺度融合网络用于捕捉评论文本多层次局部情感特征和全局上下文特征,软注意力机制用于计算每个特征的重要程度,由输出层得到情感分类结果。在真实在线课程评论文本数据集进行实验,结果表明,结合MacBERT和多尺度融合网络模型的F1分数达到了95.27%,高于实验对比模型,证明了模型的有效性。 展开更多
关键词 情感分析 macbert 多尺度融合网络 软注意力机制
在线阅读 下载PDF
融合MacBERT和Kenlm的中文纠错方法
19
作者 王梦贤 何春辉 《现代计算机》 2022年第23期70-73,85,共5页
中文纠错属于自然语言处理的基础任务,考虑到现有方法纠错性能偏低,无法满足实际的纠错需求,提出了一种融合MacBERT和Kenlm的中文纠错方法。在公开数据集上的实验结果表明,该方法的精确率、召回率和F1值分别达到了78.2%、72.7%、75.3%... 中文纠错属于自然语言处理的基础任务,考虑到现有方法纠错性能偏低,无法满足实际的纠错需求,提出了一种融合MacBERT和Kenlm的中文纠错方法。在公开数据集上的实验结果表明,该方法的精确率、召回率和F1值分别达到了78.2%、72.7%、75.3%。尤其是F1值比基线方法提升了3.6个百分点,充分证明了所提方法的有效性。 展开更多
关键词 中文纠错 Kenlm 迁移学习 macbert
在线阅读 下载PDF
基于MacBERT文本嵌入和LightGBM的静脉血栓栓塞症预测模型研究
20
作者 邵强翰 刘宏德 +1 位作者 黄文娟 蓝淳愉 《信息与电脑》 2023年第5期173-176,共4页
静脉血栓栓塞症(Venous thromboembolism,VTE)是一种致死率较高的血管类疾病,但出具影像学和问卷检查结果的时间往往晚后于栓塞发生时间。本研究利用电子病历信息,提出了一种基于文本嵌入和机器学习相结合的VTE诊断模型。在2796个患者... 静脉血栓栓塞症(Venous thromboembolism,VTE)是一种致死率较高的血管类疾病,但出具影像学和问卷检查结果的时间往往晚后于栓塞发生时间。本研究利用电子病历信息,提出了一种基于文本嵌入和机器学习相结合的VTE诊断模型。在2796个患者构成测试集上模型的接受者操作特性曲线下面积(Area Under Receiver Operating Characteristic Curve,AUC)达到了0.8133,F1值为51.55%,F2值为60.23%,高于以往单一模型在本数据集上的结果。结果表明,MacBERT文本嵌入方法不仅能有效提取电子病历中的特征信息,还能提高VTE预测模型的性能。综上,所提出的模型可以更好地利用电子病历辅助诊断VTE的发生。 展开更多
关键词 静脉血栓栓塞症(VTE) macbert LightGBM算法 辅助诊断
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部