期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于SimBERT+CNN的专利智能分类技术研究 被引量:1
1
作者 洪群业 刘琦 +3 位作者 刘春燕 郑路 李烨辉 杨申学 《中国发明与专利》 2024年第8期21-29,共9页
本文基于SimBERT+CNN深度学习模型,以烟草产业相关专利为例,研究了基于烟草相关技术专利文献的智能分类技术,用于专利数据的自动技术分类或者人工辅助分类。主要研究方法:利用人工对烟草相关专利文献进行二级技术分类标注,将包括烟草技... 本文基于SimBERT+CNN深度学习模型,以烟草产业相关专利为例,研究了基于烟草相关技术专利文献的智能分类技术,用于专利数据的自动技术分类或者人工辅助分类。主要研究方法:利用人工对烟草相关专利文献进行二级技术分类标注,将包括烟草技术类和非烟草技术类专利作为深度学习的样本数据,然后抽取相关专利中有X类引证的专利文献中的权利要求项和被引专利的对应文本段落作为句对,用于优化基于SimBERT构建的语义模型训练,使用训练优化后的SimBERT模型,对烟草行业的专利分类样本数据进行文字型特征向量和IPC分类号特征向量特征拼接并输入CNN模型。通过对15万余件烟草技术专利和2万余件非烟草技术专利样本的实证训练和测试,发现基于采用上述优化方法的SimBERT+CNN模型对烟草技术专利的技术分类测试准确率在一级烟草技术分类和二级技术分类方面均优于使用BERT+CNN的分类效果。 展开更多
关键词 专利智能分类 烟草行业 simbert CNN 深度学习
在线阅读 下载PDF
基于SimBERT的中医医案实体间关系抽取 被引量:3
2
作者 刘逍 龚庆悦 +1 位作者 李铁军 王红云 《软件导刊》 2022年第11期12-18,共7页
自然语言处理中,实体与关系抽取是构建知识图谱、设计问答系统、语义分析等任务中不可或缺的环节。中医领域的信息多数以非结构化文本形式储存,中医文本关键信息抽取对挖掘名老中医的经验有重要作用。然而,中医文本往往存在样本不均衡... 自然语言处理中,实体与关系抽取是构建知识图谱、设计问答系统、语义分析等任务中不可或缺的环节。中医领域的信息多数以非结构化文本形式储存,中医文本关键信息抽取对挖掘名老中医的经验有重要作用。然而,中医文本往往存在样本不均衡、实体关系多词一义的问题,如多种诊断结果指向同一证候。为解决这些问题,构建半监督学习框架下基于SimBERT的关系抽取模型对中医文本的实体关系进行抽取,利用SimBERT的相似文本生成功能进行文本增强,以解决样本不均衡问题,SimBERT的相似句检索功能较好地解决了多词一义的问题。实验结果证明,半监督学习框架下的SimBERT模型在构建的中医医案数据集上能更精确地抽取中医文本中的实体关系。 展开更多
关键词 关系抽取 simbert 中医医案
在线阅读 下载PDF
基于改进SimBERT的藏医药专利文本分类模型研究
3
作者 罗丽锦 高屹 +1 位作者 陈颂斌 樊淼 《西北民族大学学报(自然科学版)》 2023年第4期53-61,共9页
为了提高文本分类的性能,降低人工分类带来的错误率,提出一种基于改进SimBERT的专利文本分类模型.首先,从欧洲专利局爬取与藏医药相关的专利文本,知网的数据做补充,对文本数据做数据清洗与文本预处理去除噪声项等工作.其次,提取藏医药... 为了提高文本分类的性能,降低人工分类带来的错误率,提出一种基于改进SimBERT的专利文本分类模型.首先,从欧洲专利局爬取与藏医药相关的专利文本,知网的数据做补充,对文本数据做数据清洗与文本预处理去除噪声项等工作.其次,提取藏医药专利文本中摘要字段数据的关键词,将提取到的数据按8∶2分成训练集和测试集,将训练集数据送入SimBERT中进行编码,得到embedding向量为原始embedding向量.然后通过融入通道注意力机制得到一个加权的embedding向量,再将优化后的向量输入到卷积神经网络层中提取特征信息.将测试集数据输入到BERT、ALBERT、Chinese-Word-Vectors、SimBERT以及SimBERT-CAM-CL模型中进行比较,准确率分别为0.808、0.825、0.776、0.813、0.843.结果表明,本实验提出的SimBERT-CAM-CL模型能有效提升文本分类效率及其分类性能. 展开更多
关键词 simbert 藏医药 文本分类
在线阅读 下载PDF
基于专家知识与大语言模型混合增强的水电站告警智能诊断 被引量:1
4
作者 孙国强 史学恒 +3 位作者 罗哲清 程礼临 臧海祥 卫志农 《电力建设》 北大核心 2025年第10期44-57,共14页
【目的】为改善传统水电站监控告警事件诊断中样本不平衡度大且诊断效率较低,而基于人工智能的诊断方法缺乏可解释性且诊断准确度难以保证的问题,设计了一种基于大语言模型的水电站告警事件样本增强与故障诊断深度学习框架,同时引入了... 【目的】为改善传统水电站监控告警事件诊断中样本不平衡度大且诊断效率较低,而基于人工智能的诊断方法缺乏可解释性且诊断准确度难以保证的问题,设计了一种基于大语言模型的水电站告警事件样本增强与故障诊断深度学习框架,同时引入了基于正则表达的专家知识实现对告警诊断结果的校核,提高告警事件诊断结果的可信度。【方法】首先,针对水电站监控事件样本不均衡问题,采用SimBERT模型对样本数较少的故障类型进行数据增强并将增强数据与原始数据相混合构成深度学习网络的输入样本;其次,基于电网监控告警规则构建典型故障的正则表达,实现基于正则表达式的典型故障准确判别;最后,基于文心一言(ERNIE)大语言模型构建水电站监控事件的词向量样本,并输入层级注意力网络中学习样本特征并输出分类结果,与正则判断结果进行校核,得到最终的故障诊断结果。【结果】测试实例表明,相比于传统水电站监控告警事件诊断方法,所提模型能够使诊断精度提升2%以上,模型训练时间减低30%且能够在0.1 s内实现故障诊断。【结论】所提的基于大语言模型的水电站告警事件样本增强与故障诊断深度学习框架能够实现系统故障时对故障事件类型的快速精准诊断,有利于保障电力系统长期稳定安全运行。 展开更多
关键词 simbert 正则表达式 文心一言 层级注意力网络 水电站智能告警
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部