期刊文献+
共找到142篇文章
< 1 2 8 >
每页显示 20 50 100
基于随机提示的中文法律领域命名实体识别
1
作者 周鹏 何军 《计算机工程与设计》 北大核心 2025年第4期1167-1173,共7页
为解决中文法律领域命名实体识别面临的数据集稀缺和通用命名实体识别模型未充分利用BERT文本推理能力的问题,提出一种基于随机提示的命名实体识别方法。设计专用于法律领域的实体类型信息融合层,通过随机融合多角度的实体类型解释信息... 为解决中文法律领域命名实体识别面临的数据集稀缺和通用命名实体识别模型未充分利用BERT文本推理能力的问题,提出一种基于随机提示的命名实体识别方法。设计专用于法律领域的实体类型信息融合层,通过随机融合多角度的实体类型解释信息,结合BERT和BiLSTM,学习文本中融合实体类型解释信息的上下文语义特征。将命名实体识别任务建模为序列标注任务,通过CRF获取序列的标签信息。实验结果表明,该方法在中文法律领域命名实体识别任务中取得了显著的性能提升,F1值达到93.06%。 展开更多
关键词 中文法律实体 深度学习 命名实体识别 随机提示 双向长短时记忆网络 序列标注 条件随机场
在线阅读 下载PDF
融合数据增强的互花米草入侵关联要素实体识别方法
2
作者 李忠伟 张文丰 +1 位作者 李永 李明轩 《计算机工程与设计》 北大核心 2025年第2期603-609,共7页
为解决互花米草入侵领域的训练数据匮乏,存在实体特征提取不准确的问题,提出一种融合数据增强的互花米草入侵关联要素识别深度学习模型。将训练数据采用同类实体随机交叉互换的方法进行数据增强,利用BERT预训练获得互花米草入侵关联要... 为解决互花米草入侵领域的训练数据匮乏,存在实体特征提取不准确的问题,提出一种融合数据增强的互花米草入侵关联要素识别深度学习模型。将训练数据采用同类实体随机交叉互换的方法进行数据增强,利用BERT预训练获得互花米草入侵关联要素的上下文信息;使用BiLSTM进一步提取特征,利用CRF得到实体的标签约束。通过对比不同模型在自建数据集上的精确率、召回率和F1分数,验证了该模型在互花米草入侵领域实体识别的有效性。 展开更多
关键词 命名实体识别 互花米草入侵 深度学习 数据增强 预训练模型 双向长短期记忆网络 条件随机场
在线阅读 下载PDF
基于LERT和BiTCN的金融领域命名实体识别
3
作者 陈雪松 王璐瑶 王浩畅 《计算机技术与发展》 2025年第3期125-132,共8页
针对传统的命名实体识别方法难以解决金融文本中一词多义且文本的语义特征提取不够充分的问题,提出了一种基于LERT-BiTCN-CRF的金融领域命名实体识别模型。首先,使用LERT模型对输入的金融文本进行预训练以生成相对应字符向量;然后,通过... 针对传统的命名实体识别方法难以解决金融文本中一词多义且文本的语义特征提取不够充分的问题,提出了一种基于LERT-BiTCN-CRF的金融领域命名实体识别模型。首先,使用LERT模型对输入的金融文本进行预训练以生成相对应字符向量;然后,通过在TCN内部增加反向卷积层将其改进为BiTCN,采用BiTCN对字符向量进行编码以提取字符向量的全局语义特征;最后,通过CRF进行解码以得到最佳的预测标签序列。在公开数据集ChFinAnn和自制数据集FinanceNER两个金融领域数据集上进行对比实验,该模型在两个数据集上的F1值分别达到了84.16%和92.17%。相较于其它模型,该模型在金融领域的命名实体识别任务中效果更好,表明该模型具有一定的有效性。同时又在公开的Resume数据集上进行对比实验,该模型F1值相较于基线模型BiGRU-CRF提升2.31%,表明该模型具有一定的泛化性。 展开更多
关键词 LERT模型 金融领域 命名实体识别 双向时间卷积网络 条件随机场
在线阅读 下载PDF
循环氨基酸与重症肌无力的因果关联评估:一项双向孟德尔随机化研究
4
作者 臧虎 汲晓宇 +3 位作者 祝畅 姚文龙 万里 刘彤彤 《医药导报》 北大核心 2025年第3期440-445,共6页
目的利用孟德尔随机化方法探讨循环氨基酸水平与重症肌无力(MG)风险之间的双向因果关联。方法使用公开的全基因组关联研究(GWASs)遗传数据进行两样本孟德尔随机化分析,利用不同来源的GWASs数据进行验证以评估结果稳健性。运用5种模型进... 目的利用孟德尔随机化方法探讨循环氨基酸水平与重症肌无力(MG)风险之间的双向因果关联。方法使用公开的全基因组关联研究(GWASs)遗传数据进行两样本孟德尔随机化分析,利用不同来源的GWASs数据进行验证以评估结果稳健性。运用5种模型进行两样本双向孟德尔随机化分析,采用比值比(OR)评价循环中9种氨基酸水平与MG风险之间的因果关系。采用敏感性分析、异质性检验和多效性检验评估结果的稳健性。以逆方差加权法(IVW)估算的因果效应为主要结果,使用不同GWASs来源的数据对IVW估算的因果效应进行验证,以进一步评估结果稳健性。结果遗传预测较高的循环谷氨酰胺水平与较低的MG风险显著相关[OR(95%CI)=0.696(0.524,0.926),P=0.0127,IVW]。采用不同GWASs验证分析表明,遗传预测的较高循环谷氨酰胺水平与MG风险显著负相关[OR(95%CI)=0.321(0.178,0.581),P=1.67×10^(-1),IVW]。此外,遗传预测较高MG风险与较低循环谷氨酰胺和丙氨酸水平相关(分别为-0.178±0.009,P=0.049;-0.013±0.007,P=0.048,IVW)。结论通过遗传学方法揭示循环氨基酸水平与MG患病风险之间具有潜在双向因果关系。需要进一步研究来阐明循环氨基酸水平与MG之间的作用机制。 展开更多
关键词 重症肌无力 两样本双向孟德尔随机化 循环氨基酸水平 因果关系
暂未订购
Logistic Weighted Profile-Based Bi-Random Walk for Exploring MiRNA-Disease Associations 被引量:1
5
作者 Ling-Yun Dai Jin-Xing Liu +2 位作者 Rong Zhu Juan Wang Sha-Sha Yuan 《Journal of Computer Science & Technology》 SCIE EI CSCD 2021年第2期276-287,共12页
MicroRNAs(miRNAs)exert an enormous influence on cell differentiation,biological development and the onset of diseases.Because predicting potential miRNA-disease associations(MDAs)by biological experiments usually requ... MicroRNAs(miRNAs)exert an enormous influence on cell differentiation,biological development and the onset of diseases.Because predicting potential miRNA-disease associations(MDAs)by biological experiments usually requires considerable time and money,a growing number of researchers are working on developing computational methods to predict MDAs.High accuracy is critical for prediction.To date,many algorithms have been proposed to infer novel MDAs.However,they may still have some drawbacks.In this paper,a logistic weighted profile-based bi-random walk method(LWBRW)is designed to infer potential MDAs based on known MDAs.In this method,three networks(i.e.,a miRNA functional similarity network,a disease semantic similarity network and a known MDA network)are constructed first.In the process of building the miRNA network and the disease network,Gaussian interaction profile(GIP)kernel is computed to increase the kernel similarities,and the logistic function is used to extract valuable information and protect known MDAs.Next,the known MDA matrix is preprocessed by the weighted K-nearest known neighbours(WKNKN)method to reduce the number of false negatives.Then,the LWBRW method is applied to infer novel MDAs by bi-randomly walking on the miRNA network and the disease network.Finally,the predictive ability of the LWBRW method is confirmed by the average AUC of 0.9393(0.0061)in 5-fold cross-validation(CV)and the AUC value of 0.9763 in leave-one-out cross-validation(LOOCV).In addition,case studies also show the outstanding ability of the LWBRW method to explore potential MDAs. 展开更多
关键词 miRNA-disease association logistic function Gaussian interaction profile weighted K-nearest known neighbour bi-random walk
原文传递
基于大数据技术的网络流量异常检测算法研究 被引量:1
6
作者 杨海明 刘莹 《黑龙江科学》 2025年第10期62-65,共4页
为提升传统网络流量异常检测算法的准确性,提出一种基于大数据技术的网络流量异常检测算法,对网络流量数据集进行数据清洗、异常值处理等数据预处理操作,通过随机森林法进行特征选择,防止数据维度过大,将处理好的数据送入异常检测模块中... 为提升传统网络流量异常检测算法的准确性,提出一种基于大数据技术的网络流量异常检测算法,对网络流量数据集进行数据清洗、异常值处理等数据预处理操作,通过随机森林法进行特征选择,防止数据维度过大,将处理好的数据送入异常检测模块中,利用去噪自编码器和Bi-LSTM对数据进行建模,提取数据特征,通过softmax函数得到网络流量异常检测分类结果。经验证,所提算法能够有效提升网络流量异常检测效果。 展开更多
关键词 异常检测 自编码器 Bi-LSTM 随机森林算法
在线阅读 下载PDF
基于改进CNN-Bi-LSTM模型故障诊断与改进随机森林模型的湿法冶金流程评价研究
7
作者 郭静博 《湿法冶金》 北大核心 2025年第4期567-575,共9页
为解决目前的故障诊断模型较为简单、泛化能力较弱等问题,采用改进CNN-Bi-LSTM模型进行湿法冶金流程故障诊断,再根据故障诊断的结果数据,采用改进随机森林模型进行湿法冶金全流程的评价。结果表明:故障诊断准确率达90.7%,远超该工厂原... 为解决目前的故障诊断模型较为简单、泛化能力较弱等问题,采用改进CNN-Bi-LSTM模型进行湿法冶金流程故障诊断,再根据故障诊断的结果数据,采用改进随机森林模型进行湿法冶金全流程的评价。结果表明:故障诊断准确率达90.7%,远超该工厂原有基于经验规则的诊断系统的准确率(78.4%),且模型的故障检测响应时间控制在2 s内,确保了工艺过程中的实时监控和快速响应。 展开更多
关键词 CNN-Bi-LSTM 随机森林 数值仿真 实证研究 故障诊断
在线阅读 下载PDF
基于改进Bi-RRT算法嵌入的贪心算法的邮轮推舱序列规划
8
作者 尹旭悦 颜若尘 +2 位作者 张磊 骆晓萌 韦乃琨 《造船技术》 2025年第5期67-72,共6页
针对邮轮推舱序列自动规划问题,采用投影法建立推舱路径规划模型,并提出一种基于改进双向快速搜索随机树(Bidirectional Rapidly-Exploring Random Tree,Bi-RRT)算法嵌入的贪心算法进行邮轮推舱序列规划的方法。以大型邮轮H1508船甲板... 针对邮轮推舱序列自动规划问题,采用投影法建立推舱路径规划模型,并提出一种基于改进双向快速搜索随机树(Bidirectional Rapidly-Exploring Random Tree,Bi-RRT)算法嵌入的贪心算法进行邮轮推舱序列规划的方法。以大型邮轮H1508船甲板中段区域为例,在Unity3D软件中对预制模块化舱室单元(Pre-fabricated Modular Cabin Unit,PMCU)的推舱序列规划进行仿真试验。试验结果表明,该方法可兼顾避障验证与序列规划,比传统蛇形推舱序列规划具有更高的效率。 展开更多
关键词 邮轮 推舱 序列规划 贪心算法 改进双向快速搜索随机树算法 预制模块化舱室单元
在线阅读 下载PDF
燃气管道泄漏知识图谱构建与应用
9
作者 张季娜 王凡 周宏健 《煤气与热力》 2025年第3期I0034-I0041,I0046,共9页
针对燃气管道领域特点,分析燃气管道领域知识图谱技术架构和多源数据,选取Bi-LSTM-CRF模型作为知识抽取模型,对燃气管道泄漏相关的资料进行知识抽取,定义关系类型,明确实体间关系,并利用Neo4j图数据库存储,构建燃气管道泄漏知识图谱。... 针对燃气管道领域特点,分析燃气管道领域知识图谱技术架构和多源数据,选取Bi-LSTM-CRF模型作为知识抽取模型,对燃气管道泄漏相关的资料进行知识抽取,定义关系类型,明确实体间关系,并利用Neo4j图数据库存储,构建燃气管道泄漏知识图谱。通过分析燃气管道泄漏知识图谱的信息查询方式及燃气管道泄漏演化路径预测分析及处理措施推理,验证了知识图谱在燃气管道领域应用的有效性。对下一步的应用进行展望。 展开更多
关键词 燃气管道泄漏 双向长短期记忆网络条件随机场模型 知识图谱
在线阅读 下载PDF
ERNIE和序列标注结合的中文文本检错纠错
10
作者 左壮壮 王法玉 陈洪涛 《天津理工大学学报》 2025年第1期83-89,共7页
针对中文文本检错纠错研究任务,提出了基于知识增强的自然语言表示模型(enhanced representation through knowledge integration, ERNIE)与序列标注结合的中文文本检错纠错模型。该模型由检错和纠错两部分组成,检错阶段ERNIE使用全局... 针对中文文本检错纠错研究任务,提出了基于知识增强的自然语言表示模型(enhanced representation through knowledge integration, ERNIE)与序列标注结合的中文文本检错纠错模型。该模型由检错和纠错两部分组成,检错阶段ERNIE使用全局注意力机制进行词向量编码输入到BiLSTM-CRF序列标注模型中,双向长短期记忆网络(bi-directional long short-term memory, BiLSTM)提取上下文的信息进行拼接生成双向的词向量,再通过条件随机场(conditional random field, CRF)计算联合概率增加对邻近词标签的依赖性优化整个序列,从而解决标注偏置等问题给出的错误标注。纠错阶段根据检错模型输出的结果采用不同策略分类纠错,将标注为错字、缺字的错误使用ERNIE掩码语言模型和混淆集匹配进行预测,对多字、乱序错误直接纠正。实验结果表明,引入序列标注根据错误类型进行分类纠错有效提升了纠错率,在SIGHAN数据集上测试F1达到了81.8%。 展开更多
关键词 中文文本检错纠错 基于知识增强的自然语言表示模型 序列标注 双向长短期记忆网络 条件随机场 多策略纠错
在线阅读 下载PDF
计及新能源并网的机组计划检修双层优化模型
11
作者 雷明 舒征宇 +3 位作者 毛洪彬 周子涵 任冠臣 王潇 《水力发电》 2025年第8期84-90,123,共8页
新能源并网容量逐年上涨,且由于近年来新型设备投入使用,其电网运行方式越发复杂多变,进而导致其电网设备检修安排工作难度持续增大。针对由于不合理机组计划检修导致经济成本上升的情况,考虑机组计划检修全周期内机组的随机性故障风险... 新能源并网容量逐年上涨,且由于近年来新型设备投入使用,其电网运行方式越发复杂多变,进而导致其电网设备检修安排工作难度持续增大。针对由于不合理机组计划检修导致经济成本上升的情况,考虑机组计划检修全周期内机组的随机性故障风险,同时对源荷波动不确定性进行分析,并计入电力系统中关键断面传输极限约束,建立了电力系统机组计划检修的双层优化模型。上层模型采用改进遗传算法用于解决机组的启停安排,下层模型采用粒子群算法用于求解机组的出力。经过仿真验证,证明该方法的有效性和合理性。并将所得到的结果与传统经济成本模型进行对比分析,证明了所提方法更加贴合实际。 展开更多
关键词 新能源并网系统 计划检修 机组随机性故障 源荷波动 关键断面 双层优化
在线阅读 下载PDF
基于随机效用的稻农有机肥替代化肥行为研究 被引量:2
12
作者 赵玉 吴志明 陈霖波 《农林经济管理学报》 CSSCI 北大核心 2024年第3期347-356,共10页
基于鄱阳湖流域水稻主产区10个县(区)的571份有效样本数据,在有机肥替代化肥的行为分析框架下采用随机效用理论构建双变量Probit模型,实证分析期望收益、风险态度等因素对稻农用有机肥替代化肥行为的影响,并通过分组回归讨论技术培训和... 基于鄱阳湖流域水稻主产区10个县(区)的571份有效样本数据,在有机肥替代化肥的行为分析框架下采用随机效用理论构建双变量Probit模型,实证分析期望收益、风险态度等因素对稻农用有机肥替代化肥行为的影响,并通过分组回归讨论技术培训和成本感知对这一替代行为的调节效应。结果表明:1)减施化肥和使用有机肥行为存在相关性,减施化肥的稻农使用有机肥的概率为0.56,使用有机肥的稻农减施化肥的概率为0.41,稻农用有机肥替代化肥的概率约为0.21。2)期望收益、风险厌恶、小概率偏好越高,稻农使用有机肥替代化肥的概率越低,而损失厌恶程度越高,稻农使用有机肥替代化肥的概率越高。3)参加过施肥技术培训的稻农更倾向于使用有机肥替代化肥,化肥感知成本的提升会增加稻农使用有机肥的概率。据此,从保障绿色施肥收入、降低绿色施肥成本和加强技术宣传推广等方面提出政策建议。 展开更多
关键词 随机效用 施肥行为 双变量Probit 鄱阳湖流域
在线阅读 下载PDF
内在情感对癌症发生风险的影响:基于孟德尔随机化研究 被引量:2
13
作者 杜钦 朱雨萱 +2 位作者 郭一泽 许楠馨 刘棣 《西安交通大学学报(医学版)》 CAS CSCD 北大核心 2024年第3期376-382,共7页
目的探究内在情感(幸福感、抑郁情绪、忧虑和内疚感)与癌症(结直肠癌、肝癌、甲状腺癌、肺癌、乳腺癌)的因果关系。方法采用两样本双向孟德尔随机化方法。所有数据基于全基因关联研究(GWAS)汇总数据。逆方差加权法(IVW)得到的结果作为... 目的探究内在情感(幸福感、抑郁情绪、忧虑和内疚感)与癌症(结直肠癌、肝癌、甲状腺癌、肺癌、乳腺癌)的因果关系。方法采用两样本双向孟德尔随机化方法。所有数据基于全基因关联研究(GWAS)汇总数据。逆方差加权法(IVW)得到的结果作为主要结局指标,加权中值法(WM)、MR-Egger法作为补充结果,评价指标为比值比(OR),并进行敏感性分析。结果对于抑郁情绪,提示与肺癌(OR=1.005,95%CI:1.001~1.009,P=0.015)显著相关。对于忧虑,提示与乳腺癌(OR=1.199,95%CI:1.011~1.423,P=0.038)显著相关。对于内疚感,提示与甲状腺癌(OR=2.083,95%CI:1.080~4.017,P=0.029)显著相关。在去除MR-PRESSO检测到的所有潜在多效性SNPs后,忧虑与乳腺癌的关联无统计学差异(P=0.064),忧虑与结直肠癌显著相关(OR=0.739,95%CI:0.571~0.956,P=0.021)。癌症与内在情感之间的关联未发现存在因果关系。结论抑郁情绪与肺癌发生风险增加相关,内疚感与甲状腺癌发生风险增加相关,忧虑可能与结直肠癌发生风险降低相关。 展开更多
关键词 两样本双向孟德尔随机化 内在情感 癌症 全基因组关联研究 因果效应
暂未订购
面向采购文件的跨模态图片文本命名实体识别 被引量:4
14
作者 杨赛 刘昕 于绍文 《计算机工程与应用》 CSCD 北大核心 2024年第3期213-219,共7页
智慧供应链的数智化采购环节能够提高采购工作效率,节省大量人力成本。采购文件中包括大量证照资质等文件,针对其中图片文本中文字排版参差不齐、扫描图像不清晰等问题,设计了基于深度学习的端到端跨模态命名实体识别模型O2V2BLC(OCR-Ve... 智慧供应链的数智化采购环节能够提高采购工作效率,节省大量人力成本。采购文件中包括大量证照资质等文件,针对其中图片文本中文字排版参差不齐、扫描图像不清晰等问题,设计了基于深度学习的端到端跨模态命名实体识别模型O2V2BLC(OCR-Vector-Bi-LSTM-CRF),从图片文本中识别命名实体。该模型针对光学字符识别技术识别出的图片文本字符,定义连续文本字符边界,将边界内每个文本字符映射为向量,设计双向长短期记忆(Bi-LSTM)网络捕获边界内字符序列的上下文语义,计算字符状态分数矩阵,并通过条件随机场约束字符标记序列规则,获得全局最优标记序列。针对训练集计算命名实体预测误差,动态优化O2V2BLC模型的参数,实现命名实体识别。将该方法应用于采购文件资质类型等图片文本数据,能够有效识别图片中的投标单位、专家姓名、专业名称等命名实体,与条件随机场、隐马尔可夫算法、Bert-Bi-LSTM-CRF模型进行对比,显著提高了实体识别准确率,为智慧供应链的数智化采购提供支持。 展开更多
关键词 智慧供应链 命名实体识别 光学字符识别 双向长短期记忆网络 条件随机场
在线阅读 下载PDF
改进双向快速搜索随机树的无人艇路径规划 被引量:7
15
作者 赵贵祥 周健 +1 位作者 李云淼 王晨旭 《系统工程与电子技术》 EI CSCD 北大核心 2024年第4期1364-1371,共8页
针对双向快速搜索随机树(bidirectional rapidly-exploring random tree, BI-RRT)算法在全局路径规划时存在搜索效率低、路径拐点较多等问题,提出一种改进BI-RRT的水面无人艇(unmanned surface vehicle, USV)全局路径规划算法。该算法... 针对双向快速搜索随机树(bidirectional rapidly-exploring random tree, BI-RRT)算法在全局路径规划时存在搜索效率低、路径拐点较多等问题,提出一种改进BI-RRT的水面无人艇(unmanned surface vehicle, USV)全局路径规划算法。该算法采取了极度贪心的思想、高斯偏置随机点采样方法以及启发式的节点扩展策略,同时对节点扩展和搜索树连接进行角度约束,将生成的路径进行剪枝和3次B样条优化处理。结果表明,相对于改进前,改进的BI-RRT在平均时间、随机采样点和平均路径上分别减少了40.5%、65.0%和24.0%。改进后的算法时间、采样点和搜索树扩展大幅度减少,路径平滑度提高且路径更短。 展开更多
关键词 路径规划 水面无人艇 双向快速搜索随机树 高斯偏置随机点 角度约束
在线阅读 下载PDF
基于随机活动工期的装配式项目鲁棒性调度优化
16
作者 于淼 王港莉 +1 位作者 赵愈 路林翰 《沈阳建筑大学学报(社会科学版)》 2024年第3期266-272,共7页
将装配式项目的生产阶段、运输阶段和装配阶段作为一个整体进行研究,考虑了各阶段的调度性质及相互牵制特性,提出了分种类分批次的调度策略。针对随机活动工期的装配式项目调度问题,采用鲁棒性调度方法,建立了以项目鲁棒值和成本值为优... 将装配式项目的生产阶段、运输阶段和装配阶段作为一个整体进行研究,考虑了各阶段的调度性质及相互牵制特性,提出了分种类分批次的调度策略。针对随机活动工期的装配式项目调度问题,采用鲁棒性调度方法,建立了以项目鲁棒值和成本值为优化目标的生产-运输-装配一体化建造鲁棒性调度模型。依据调度性质设计了集成精英策略的非支配性遗传算法(Non-dominated Sorting Genetic Algorithms-II,NSGA-II)并对其进行了求解。最后选取装配式项目实际案例,验证了算法的有效性并对实验结果进行了分析。研究结果表明,通过改变活动时差的不同分布状态,可在提高项目鲁棒性的同时保证项目成本最低。 展开更多
关键词 随机活动工期 装配式项目 鲁棒性调度 双目标优化
在线阅读 下载PDF
基于命名实体识别的水电工程施工安全规范实体识别模型 被引量:1
17
作者 陈述 张超 +2 位作者 陈云 张光飞 李智 《中国安全科学学报》 CAS CSCD 北大核心 2024年第9期19-26,共8页
为准确识别水电工程施工安全规范实体,通过预训练模型中双向编码器表征法(BERT)挖掘文本中丰富的语义信息,利用双向长短期记忆神经网络(BILSTM)提取规范实体语义特征,依靠条件随机场(CRF)分析实体之间的依赖关系,构建水电工程施工安全... 为准确识别水电工程施工安全规范实体,通过预训练模型中双向编码器表征法(BERT)挖掘文本中丰富的语义信息,利用双向长短期记忆神经网络(BILSTM)提取规范实体语义特征,依靠条件随机场(CRF)分析实体之间的依赖关系,构建水电工程施工安全规范的命名实体识别模型;以《水利水电工程施工安全防护技术规范》(SL714—2015)为例,计算命名实体识别模型精确率。结果表明:BERT-BILSTM-CRF模型准确率为94.35%,相比于3种传统方法,准确率显著提高。研究成果有助于水电工程施工安全规范知识智能管理,为施工安全隐患智能判别提供支撑。 展开更多
关键词 命名实体识别 水电工程施工 安全规范 双向编码器表征法(BERT) 双向长短期记忆神经网络(BILSTM) 条件随机场(CRF)
原文传递
基于深度学习的二进制变种协议字段划分方法 被引量:2
18
作者 安晓明 王忠勇 +3 位作者 翟慧鹏 巩克现 王玮 孙鹏 《计算机工程与设计》 北大核心 2024年第4期982-988,共7页
为提高二进制变种协议字段格式划分的准确率,提出一种基于深度学习的方法,能够自动挖掘协议报文序列的深层字段特征完成协议的字段格式划分。引入一种字段列特征数据集的提取方法,在传统的双向长短期记忆条件随机场网络模型的基础上增... 为提高二进制变种协议字段格式划分的准确率,提出一种基于深度学习的方法,能够自动挖掘协议报文序列的深层字段特征完成协议的字段格式划分。引入一种字段列特征数据集的提取方法,在传统的双向长短期记忆条件随机场网络模型的基础上增加协议字段列特征提取模块,搭建一种专门解决二进制变种协议字段格式划分的神经网络PRO-BILSTM-CRF。与二进制未知协议字段格式划分方法以及几种主流网络模型的对比实验结果表明,在变种协议字段格式划分任务上,提出模型能够取得更高准确率。 展开更多
关键词 二进制变种协议 深度学习 双向长短期记忆模型 条件随机场 特征提取 字段格式划分 协议逆向工程
在线阅读 下载PDF
基于深度学习模型的煤矿安全隐患数据主题挖掘 被引量:6
19
作者 肖琪耀 贾宝山 +2 位作者 徐以诺 张茂薇 梁明辉 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第4期49-55,共7页
为了提高煤矿安全风险排查能力和监督能力,提出1种基于双向长短期记忆网络(BiLSTM)、条件随机场(CRF)和隐含狄利克雷分布(LDA)的模型。训练BiLSTM-CRF模型分词,采用困惑度-主题方差(perplexity-var)计算LDA模型最优主题数,构建BiLSTM-CR... 为了提高煤矿安全风险排查能力和监督能力,提出1种基于双向长短期记忆网络(BiLSTM)、条件随机场(CRF)和隐含狄利克雷分布(LDA)的模型。训练BiLSTM-CRF模型分词,采用困惑度-主题方差(perplexity-var)计算LDA模型最优主题数,构建BiLSTM-CRF-LDA模型挖掘内蒙古某煤矿安全隐患数据。研究结果表明:困惑度-主题方差指标能更准确地确定主题数;BiLSTM-CRF模型分词结果比jieba库更准确;BiLSTM-CRF-LDA模型能准确地挖掘出煤矿安全隐患类型、安全隐患空间分布和安全责任划分。研究结果可为煤矿安全风险排查与监督提供参考。 展开更多
关键词 煤矿安全隐患 BiLSTM CRF LDA 困惑度-主题方差
在线阅读 下载PDF
面向不平衡数据的机械设备故障命名实体识别 被引量:3
20
作者 党小超 刘涧 +2 位作者 董晓辉 祝忠彦 李芬芳 《计算机工程》 CAS CSCD 北大核心 2024年第9期104-112,共9页
命名实体识别作为构建知识图谱的基础任务,其识别效果直接影响知识图谱的质量。在实际生产中,机械故障数据通常包含大量的领域专业词汇,同时实体类型普遍存在分布不平衡的问题,这对准确识别故障实体构成了挑战。通用领域实体识别方法在... 命名实体识别作为构建知识图谱的基础任务,其识别效果直接影响知识图谱的质量。在实际生产中,机械故障数据通常包含大量的领域专业词汇,同时实体类型普遍存在分布不平衡的问题,这对准确识别故障实体构成了挑战。通用领域实体识别方法在这一领域效果欠佳,从而降低了知识图谱的质量。为应对上述问题,提出一种融合焦点损失(Focal Loss)函数和专业词典的实体识别方法。该方法使用Focal Loss函数应对实体类型不平衡问题,通过引入平衡因子和调制系数,改进传统的交叉熵损失函数,提升实体识别效果,同时将领域专业词汇嵌入到模型中,进一步提高实体识别性能,这一词典包含机械故障的领域术语,有助于模型更准确地识别机械设备故障命名实体。在自建的矿井提升机实验数据集上进行广泛实验验证,结果证明,融入Focal Loss后模型的F1值比主流模型BERT-BiLSTM-CRF提高了5.57个百分点,相比用于解决数据不平衡的典型方法SMOTE效果更优,在此基础上,通过嵌入领域词典,模型的F1值得到进一步提升,达到89.13%。 展开更多
关键词 命名实体识别 不平衡数据 焦点损失函数 机械设备故障 双向长短期记忆网络 条件随机场
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部