期刊文献+
共找到328篇文章
< 1 2 17 >
每页显示 20 50 100
基于ALBERT-XL的工业私有数据知识图谱构建方法
1
作者 胡迪 吴星辰 +1 位作者 刘晓鹏 伍志韬 《智能城市》 2025年第7期10-14,共5页
文章研究工业私有数据知识图谱的构建方法,在索引阶段针对工业私有数据小样本、碎片化导致的时空复杂度问题,提出利用预处理得到的工业领域通用知识图谱结构信息,对ALBERT模型的编码器注意力机制预训练调优,并将Transformer-XL框架融入A... 文章研究工业私有数据知识图谱的构建方法,在索引阶段针对工业私有数据小样本、碎片化导致的时空复杂度问题,提出利用预处理得到的工业领域通用知识图谱结构信息,对ALBERT模型的编码器注意力机制预训练调优,并将Transformer-XL框架融入ALBERT的Transformer结构中,提升其长文处理能力。结果表明,GraphRAG+ALBERT-XL模型能够有效生成内容保真度高的工业私有数据知识图谱,解决了传统方法的时空复杂度高、领域知识欠缺、远距离依赖建模难等问题,实验验证了其在冶炼加工行业数据处理中的高效性和准确性。 展开更多
关键词 工业私有数据 GraphRAG 知识图谱 albert
在线阅读 下载PDF
基于改进ALBERT-LDA模型的民航应急管理现状研究
2
作者 程明 李浦京 陈利人 《安全与环境学报》 北大核心 2025年第9期3626-3635,共10页
为提升民航应急管理能力,研究基于《中国民用航空应急管理规定》问卷数据,运用轻量级双向编码器表征模型(A Lite Bidirectional Encoder Representations from Transformers,ALBERT)和潜在狄利克雷分配模型(Latent Dirichlet Allocation... 为提升民航应急管理能力,研究基于《中国民用航空应急管理规定》问卷数据,运用轻量级双向编码器表征模型(A Lite Bidirectional Encoder Representations from Transformers,ALBERT)和潜在狄利克雷分配模型(Latent Dirichlet Allocation,LDA)进行文档类别划分,结合K-means和均匀流形逼近与投影方法(Uniform Manifold Approximation and Projection,UMAP)进行文档聚类及可视化,根据复杂网络理论构建关键词共现网络,分析网络特性和节点联系,应用逼近理想解排序法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)获得节点重要性排序。研究结果显示:网络的平均聚类系数为0.71~0.965,覆盖了不同部门、岗位和环境,代表了民航应急管理的普遍情况;在人员兼职、空管单位、支线机场等应急体系建设存在不足的情况下,建议民航系统通过增设专职应急管理机构、优化资源配置、加强培训支持等方式提升应急管理能力。研究结果可为民航应急体系建设提供数据支持。 展开更多
关键词 公共安全 应急管理 复杂网络 albert-LDA模型 TOPSIS模型
原文传递
基于ALBERT-BiGRU-BCEWithLogitsLoss的多标签分类方法研究
3
作者 谢淮东 卫沈傲 《科技创新与应用》 2025年第24期54-56,60,共4页
招采流程的资格审查涉及多个维度,增加分类的复杂性和难度。为解决这一问题,该文提出一种基于ALBERT-BiGRU-BCEWithLogitsLoss的多标签文本分类模型。首先,利用ALBERT预训练模型提取文本的全局语义特征,提升模型对文本语义信息的捕捉能... 招采流程的资格审查涉及多个维度,增加分类的复杂性和难度。为解决这一问题,该文提出一种基于ALBERT-BiGRU-BCEWithLogitsLoss的多标签文本分类模型。首先,利用ALBERT预训练模型提取文本的全局语义特征,提升模型对文本语义信息的捕捉能力。然后,将这些特征输入到BiGRU中,通过其双向上下文捕捉能力,进一步提取文本的前后文依赖关系。最后,结合BCEWithLogitsLoss损失函数,直接对logits输出进行概率计算和分类,简化模型结构并提高计算稳定性。实验结果证明该文方法的有效性,可以有效提升资格审查效率和准确率。 展开更多
关键词 多标签分类 albert BiGRU BCEWithLogitsLoss 自然语言处理
在线阅读 下载PDF
基于ALBERT-BiAGRU-CRF的命名实体识别方法
4
作者 仇全涛 张占雷 《计算机应用文摘》 2025年第10期126-131,共6页
为了降低现阶段命名实体识别(NER)模型的复杂度,并提升模型的泛化能力和识别效率,提出了一种基于ALBERT-BiAGRU-CRF的命名实体识别方法。该方法首先采用ALBERT模型对文本进行向量化处理,以获得丰富的上下文语义表示;然后,引入注意力机... 为了降低现阶段命名实体识别(NER)模型的复杂度,并提升模型的泛化能力和识别效率,提出了一种基于ALBERT-BiAGRU-CRF的命名实体识别方法。该方法首先采用ALBERT模型对文本进行向量化处理,以获得丰富的上下文语义表示;然后,引入注意力机制与双向门控循环单元(BiGRU)相结合,构建混合模型,从而更有效地提取关键特征并挖掘字符之间的内在联系;最后,通过条件随机场(CRF)层进行解码,获得最优标签序列。在《人民日报》与MSRA两个中文命名实体识别公开数据集上的实验结果显示,该模型分别达到了94.75%和98.04%的准确率,较多种现有NER方法在性能上均有所提升,验证了所提模型的有效性与可行性。 展开更多
关键词 albert 注意力机制 门控循环单元 命名实体识别 条件随机场
在线阅读 下载PDF
基于ALBERT模型的融合Emoji文本评论情感分析
5
作者 邹扬婷 《中国科技信息》 2025年第24期91-93,共3页
0背景随着社交媒体平台的迅速发展,评论成为网友们表达观点、抒发情感的主要手段,而Emoji符号在评论中扮演着日益重要角色。一方面Emoji符号可以直接代替文字进行思想表达,另一方面Emoji也能增强原文本内容所表达的情感,并且在一定场景... 0背景随着社交媒体平台的迅速发展,评论成为网友们表达观点、抒发情感的主要手段,而Emoji符号在评论中扮演着日益重要角色。一方面Emoji符号可以直接代替文字进行思想表达,另一方面Emoji也能增强原文本内容所表达的情感,并且在一定场景下Emoji甚至可以反转文本内容的情感。然而Emoji的灵活应用对情感分析工作带来了不可忽视的挑战。 展开更多
关键词 评论 albert模型 情感分析 社交媒体 情感表达 Emoji
在线阅读 下载PDF
Named Entity Identification of Chinese Poetry and Wine Culture Based on ALBERT
6
作者 YANG Zhuang LI Zhaofei +2 位作者 WANG Jihua WEI Xudong ZHANG Yijie 《Journal of Shanghai Jiaotong university(Science)》 2025年第5期1065-1072,共8页
The task of identifying Chinese named entities of Chinese poetry and wine culture is a key step in the construction of a knowledge graph and a question and answer system.Aimed at the characteristics of Chinese poetry ... The task of identifying Chinese named entities of Chinese poetry and wine culture is a key step in the construction of a knowledge graph and a question and answer system.Aimed at the characteristics of Chinese poetry and wine culture entities with different lengths and high training cost of named entity recognition models at the present stage,this study proposes a lite BERT+bi-directional long short-term memory+attentional mechanisms+conditional random field(ALBERT+BILSTM+Att+CRF).The method first obtains the characterlevel semantic information by ALBERT module,then extracts its high-dimensional features by BILSTM module,weights the original word vector and the learned text vector by attention layer,and finally predicts the true label in CRF module(including five types:poem title,author,time,genre,and category).Through experiments on data sets related to Chinese poetry and wine culture,the results show that the method is more effective than existing mainstream models and can efficiently extract important entity information in Chinese poetry and wine culture,which is an effective method for the identification of named entities of varying lengths of poetry. 展开更多
关键词 poetry and wine culture named entity identification deep learning albert bi-directional long short-term memory(BILSTM) attentional mechanisms(Att) conditional random field(CRF)
原文传递
基于ALBERT模型的园林植物知识实体与关系抽取方法 被引量:10
7
作者 陈晓玲 唐丽玉 +3 位作者 胡颖 江锋 彭巍 冯先超 《地球信息科学学报》 CSCD 北大核心 2021年第7期1208-1220,共13页
园林植物知识图谱可为顾及区域适应性、观赏性和生态性等因子的绿化树种的选型提供知识支持。植物描述文本的实体识别及关系抽取是知识图谱构建的关键环节。针对植物领域未有公开的标注数据集,本文阐述了园林植物数据集的构建流程,定义... 园林植物知识图谱可为顾及区域适应性、观赏性和生态性等因子的绿化树种的选型提供知识支持。植物描述文本的实体识别及关系抽取是知识图谱构建的关键环节。针对植物领域未有公开的标注数据集,本文阐述了园林植物数据集的构建流程,定义了园林植物的概念体系结构,完成了园林植物语料库的构建。针对现有Word2vec、ELMo和BERT等语言模型存在无法解决多义词、融合上下文能力差、运行速度慢等缺点,提出了嵌入ALBERT(A Lite BERT)预训练语言模型的实体识别和关系抽取模型。ALBERT预训练的动态词向量能够有效地表示文本特征,将其分别输入到BiGRU-CRF命名实体识别模型和BiGRU-Attention关系抽取模型中进行训练,进一步提升实体识别和关系抽取的效果。在园林植物语料库上进行方法的有效性验证,结果表明ALBERT-BiGRU-CRF命名实体识别模型的F1值为0.9517,ALBERT-BiGRU-Attention关系抽取模型的F1值为0.9161,相较于经典的语言模型(如Word2vec、ELMo和BERT等)性能有较为显著的提升。因此基于ALBERT模型的实体与关系抽取任务能有效提高识别分类效果,可将其应用于植物描述文本的实体关系抽取任务中,为园林植物知识图谱自动构建提供方法。 展开更多
关键词 知识图谱 信息抽取 语料库 园林植物 albert 词向量 实体识别 关系抽取
原文传递
融合ALBERT与规则的小麦病虫害命名实体识别 被引量:13
8
作者 刘合兵 张德梦 +2 位作者 熊蜀峰 马新明 席磊 《计算机科学与探索》 CSCD 北大核心 2023年第6期1395-1404,共10页
小麦病虫害中文命名实体识别是构建该领域知识图谱的关键步骤,针对小麦病虫害领域训练数据匮乏、实体结构复杂、实体类型多样及实体分布不均匀等问题,在充分挖掘隐含知识的前提下,采用了两种数据增广方法扩充句子语义信息,构建了小麦病... 小麦病虫害中文命名实体识别是构建该领域知识图谱的关键步骤,针对小麦病虫害领域训练数据匮乏、实体结构复杂、实体类型多样及实体分布不均匀等问题,在充分挖掘隐含知识的前提下,采用了两种数据增广方法扩充句子语义信息,构建了小麦病虫害实体识别语料库WpdCNER及其领域词典WpdDict,并在领域专家的指导下定义了16类实体;同时提出了一种基于规则修正的中文命名实体识别模型WPD-RA,该模型基于轻量级BERT+双向长短期记忆网络+条件随机场(ALBERT+BiLSTM+CRF)进行实体识别,并在识别后定义具体规则校准实体边界。融合规则后的ALBERT+BiLSTM+CRF模型取得了最好的识别结果,准确率为94.72%,召回率为95.23%,[F1]值为94.97%,相比不加规则的识别结果,其准确率、召回率、[F1]值分别增加了1.71个百分点、0.34个百分点、1.03个百分点。实验结果表明,该方法能有效识别小麦病虫害领域命名实体,识别性能优于其他模型,为食品安全、生物等其他领域命名实体识别提供了一种可借鉴的思路。 展开更多
关键词 小麦病虫害 数据增广 命名实体识别(NER) albert 规则修正
在线阅读 下载PDF
基于ALBERT与双向GRU的中医脏腑定位模型 被引量:7
9
作者 张德政 范欣欣 +1 位作者 谢永红 蒋彦钊 《工程科学学报》 EI CSCD 北大核心 2021年第9期1182-1189,共8页
脏腑定位,即明确病变所在的脏腑,是中医脏腑辨证的重要阶段.本文旨在通过神经网络模型搭建中医脏腑定位模型,输入症状文本信息,输出对应的病变脏腑标签,为实现中医辅助诊疗的脏腑辨证提供支持.将中医的脏腑定位问题建模为自然语言处理... 脏腑定位,即明确病变所在的脏腑,是中医脏腑辨证的重要阶段.本文旨在通过神经网络模型搭建中医脏腑定位模型,输入症状文本信息,输出对应的病变脏腑标签,为实现中医辅助诊疗的脏腑辨证提供支持.将中医的脏腑定位问题建模为自然语言处理中的多标签文本分类问题,基于中医的医案数据,提出一种基于预训练模型ALBERT和双向门控循环单元(Bi-GRU)的脏腑定位模型.对比实验和消融实验的结果表明,本文提出的方法在中医脏腑定位的问题上相比于多层感知机模型、决策树模型具有更高的准确性,与Word2Vec文本表示方法相比,本文使用的ALBERT预训练模型的文本表示方法有效提升了模型的准确率.在模型参数上,ALBERT预训练模型相比BERT模型降低了模型参数量,有效减小了模型大小.最终,本文提出的脏腑定位模型在测试集上F1值达到了0.8013. 展开更多
关键词 多标签文本分类 albert 门控循环单元 脏腑定位 中医
在线阅读 下载PDF
基于ALBERT-UniLM模型的文本自动摘要技术研究 被引量:6
10
作者 孙宝山 谭浩 《计算机工程与应用》 CSCD 北大核心 2022年第15期184-190,共7页
任务中的生成式摘要模型对原文理解不充分且容易生成重复文本等问题,提出将词向量模型ALBERT与统一预训练模型UniLM相结合的算法,构造出一种ALBERT-UniLM摘要生成模型。该模型采用预训练动态词向量ALBERT替代传统的BERT基准模型进行特... 任务中的生成式摘要模型对原文理解不充分且容易生成重复文本等问题,提出将词向量模型ALBERT与统一预训练模型UniLM相结合的算法,构造出一种ALBERT-UniLM摘要生成模型。该模型采用预训练动态词向量ALBERT替代传统的BERT基准模型进行特征提取获得词向量。利用融合指针网络的UniLM语言模型对下游生成任务微调,结合覆盖机制来降低重复词的生成并获取摘要文本。实验以ROUGE评测值作为评价指标,在2018年CCF国际自然语言处理与中文计算会议(NLPC-C2018)单文档中文新闻摘要评价数据集上进行验证。与BERT基准模型相比,ALBERT-UniLM模型的Rouge-1、Rouge-2和Rouge-L指标分别提升了1.57%、1.37%和1.60%。实验结果表明,提出的ALBERT-UniLM模型在文本摘要任务上效果明显优于其他基准模型,能够有效提高文本摘要的生成质量。 展开更多
关键词 自然语言处理 预训练语言模型 albert模型 UniLM模型 生成式摘要
在线阅读 下载PDF
基于ALBERT的网络威胁情报命名实体识别 被引量:2
11
作者 周景贤 王曾琪 《陕西科技大学学报》 北大核心 2023年第1期187-195,共9页
网络威胁情报实体识别是网络威胁情报分析的关键,针对传统词嵌入无法表征一词多义而难以有效识别网络威胁情报实体关键信息,同时面临指数级增长的威胁情报,识别模型的效率亟待提高等问题,提出一种基于ALBERT的网络威胁情报命名实体识别... 网络威胁情报实体识别是网络威胁情报分析的关键,针对传统词嵌入无法表征一词多义而难以有效识别网络威胁情报实体关键信息,同时面临指数级增长的威胁情报,识别模型的效率亟待提高等问题,提出一种基于ALBERT的网络威胁情报命名实体识别模型.该模型首先使用ALBERT提取威胁情报动态特征词向量,然后将特征词向量输入到双向长短期记忆网络(BiLSTM)层得到句子中每个词对应的标签,最后在条件随机场(CRF)层修正并以最大概率输出序列标签.识别模型对比实验结果显示,提出模型的F1值为92.21%,明显优于其他模型.在识别准确率相同的情况下,提出模型的时间和资源成本也较低,适用于网络威胁情报领域海量高效的实体识别任务. 展开更多
关键词 网络威胁情报 命名实体识别 BERT albert 双向长短期记忆网络 条件随机场
在线阅读 下载PDF
基于ALBERT-CNN的外卖评论情感分析 被引量:3
12
作者 胡胜利 张丽萍 《现代信息科技》 2022年第10期157-160,共4页
为了解决如何获取文本的位置信息和捕获文本中更多情感信息的问题,利用一种结合ALBERT模型和卷积神经网络CNN的外卖评论情感分析模型ALBERT-CNN的方法。首先,ALBERT对文本词向量表示,获得文本动态特征表示;其次,利用卷积神经网络CNN对... 为了解决如何获取文本的位置信息和捕获文本中更多情感信息的问题,利用一种结合ALBERT模型和卷积神经网络CNN的外卖评论情感分析模型ALBERT-CNN的方法。首先,ALBERT对文本词向量表示,获得文本动态特征表示;其次,利用卷积神经网络CNN对特征进行训练,有效获取更丰富的局部信息;最后,对ALBERT和CNN进行融合后提取的特征通过Softmax函数对外卖评论文本进行情感分类,并使用R_Drop对模型进行正则化。实验结果表明,与传统模型相比,使用了R_Drop的ALBERT-CNN模型的精确度P、召回率R和F1值均有提高。 展开更多
关键词 外卖评价 评论文本 情感分析 albert-CNN模型 R_Drop
在线阅读 下载PDF
基于ALBERT-BiLSTM模型的微博谣言识别方法研究 被引量:3
13
作者 孙尉超 陈涛 《计算机时代》 2020年第8期21-26,共6页
随着互联网的高速发展,网络上的信息剧增,如何识别网络谣言也成为当下研究热点之一。针对谣言初期的传播具有一定隐蔽性的特征,结合预训练语言模型ALBERT和双向长短期记忆网络设计了ALBERT-BiLSTM谣言识别模型,通过挖掘谣言内容的深层... 随着互联网的高速发展,网络上的信息剧增,如何识别网络谣言也成为当下研究热点之一。针对谣言初期的传播具有一定隐蔽性的特征,结合预训练语言模型ALBERT和双向长短期记忆网络设计了ALBERT-BiLSTM谣言识别模型,通过挖掘谣言内容的深层文本特征进行识别,使之在谣言初期也能应用。五折交叉验证实验结果表明,ALBERTBiLSTM模型在实验组中达到了最高的准确率98.095%、召回率98.014%和F1值98.098%,能够较好地识别微博谣言,对维护网络信息安全具有重要意义。 展开更多
关键词 谣言识别 预训练语言模型 albert 双向长短期记忆网络 albert-BiLSTM
在线阅读 下载PDF
基于藏文Albert预训练语言模型的图采样与聚合实体关系抽取 被引量:12
14
作者 于韬 尼玛次仁 +1 位作者 拥措 尼玛扎西 《中文信息学报》 CSCD 北大核心 2022年第10期63-72,共10页
实体关系抽取任务是对句子中实体对间的语义关系进行识别。该文提出了一种基于Albert预训练语言模型结合图采样与聚合算法(Graph Sampling and Aggregation,GraphSAGE)的实体关系抽取方法,并在藏文实体关系抽取数据集上实验。该文针对... 实体关系抽取任务是对句子中实体对间的语义关系进行识别。该文提出了一种基于Albert预训练语言模型结合图采样与聚合算法(Graph Sampling and Aggregation,GraphSAGE)的实体关系抽取方法,并在藏文实体关系抽取数据集上实验。该文针对藏文句子特征表示匮乏、传统藏文实体关系抽取模型准确率不高等问题,提出以下方案:①使用预先训练的藏文Albert模型获得高质量的藏文句子动态词向量特征;②使用提出的图结构数据构建与表示方法生成GraphSAGE模型的输入数据,并通过实验证明了该方法的有效性;③借鉴GraphSAGE模型的优势,利用其图采样与聚合操作进行关系抽取。实验结果表明,该文方法有效提高了藏文实体关系抽取模型的准确率,且优于基线实验效果。 展开更多
关键词 藏文 实体关系抽取 albert GraphSAGE
在线阅读 下载PDF
东非裂谷系Albert湖盆构造活动对沉积充填的影响 被引量:4
15
作者 郭瑞婧 季汉成 +3 位作者 温志新 房超 李超 李林致 《海洋地质前沿》 CSCD 2019年第3期1-12,共12页
Albert湖盆作为东非裂谷系重要的裂谷盆地,具有巨大的油气资源潜力。但前期资料匮乏,制约着Albert盆地的研究进展,目前仍存在着构造活动背景下沉积物响应特征不明确等亟待解决的问题。通过录井、测井及地震地质资料,结合Google Earth对... Albert湖盆作为东非裂谷系重要的裂谷盆地,具有巨大的油气资源潜力。但前期资料匮乏,制约着Albert盆地的研究进展,目前仍存在着构造活动背景下沉积物响应特征不明确等亟待解决的问题。通过录井、测井及地震地质资料,结合Google Earth对该区盆地结构、湖盆断裂体系和沉积体系开展研究,并深入探讨构造对沉积物分配的控制作用。研究表明,Albert湖盆发育非对称式地堑结构,盆地两侧以正断层发育为主,西侧陡,东侧缓;主要为三角洲-湖泊沉积体系,其中三角洲包括三角洲平原及前缘亚相,湖泊包括滨浅湖及深湖亚相。不同裂谷演化时期,构造对沉积物分配控制作用明显。低扩张阶段南侧断层活动强烈,沉积物主要从北侧入湖,主要发育河流及正常三角洲;初始断裂阶段西北侧断层活动强烈,沉积物从东南侧入湖,主要发育扇三角洲及辫状河三角洲;第2断裂阶段断裂活动基本终止,沉积物从东南、东北两方向入湖,主要发育扇三角洲、辫状河三角洲及河流相。湖盆内主要发育同向叠置型和相向平行型2类构造调节带,断层组合样式形成的构造低部位,作为沉积物搬运的有利通道,对沉积物的分配起到控制作用。 展开更多
关键词 东非裂谷系 albert湖盆 断裂系统 沉积相 构造调节带
在线阅读 下载PDF
基于ALBERT-TextCNN模型的多标签医疗文本分类方法 被引量:18
16
作者 郑承宇 王新 +2 位作者 王婷 邓亚萍 尹甜甜 《山东大学学报(理学版)》 CAS CSCD 北大核心 2022年第4期21-29,共9页
针对现有Word2Vec和Glove等静态词向量表征方法无法解决文本完整语义的问题,结合ALBERT预训练语言模型和TextCNN卷积神经网络,提出一种用于多标签医疗文本分类的深层神经网络模型ALBERT-TextCNN。该模型采用ALBERT预训练语言模型进行动... 针对现有Word2Vec和Glove等静态词向量表征方法无法解决文本完整语义的问题,结合ALBERT预训练语言模型和TextCNN卷积神经网络,提出一种用于多标签医疗文本分类的深层神经网络模型ALBERT-TextCNN。该模型采用ALBERT预训练语言模型进行动态字向量表示,通过其内部多层双向的Transfomer结构获取更高效的文本向量表达,并引入TextCNN卷积神经网络模型构造多标签分类器进行训练,提取不同抽象层次的语义信息特征。在中文健康问句数据集上进行算法性能测试,实验结果表明,该模型分类的整体F1值达到了90.5%,能有效提升医疗文本的多标签分类效果。 展开更多
关键词 albert TextCNN模型 多标签分类 医疗文本
原文传递
基于ALBERT预训练模型的事件抽取技术研究 被引量:3
17
作者 杜洁 骆力明 孙众 《计算机工程与科学》 CSCD 北大核心 2023年第4期711-717,共7页
信息抽取技术用于从非结构化文本数据中提取关注度较高的信息。事件抽取技术是信息抽取研究领域中具有挑战的研究方向。事件抽取的目的是从非结构化文本数据中抽取描述事件的关键元素,并以结构化的方式呈现。事件抽取被看作序列标注任务... 信息抽取技术用于从非结构化文本数据中提取关注度较高的信息。事件抽取技术是信息抽取研究领域中具有挑战的研究方向。事件抽取的目的是从非结构化文本数据中抽取描述事件的关键元素,并以结构化的方式呈现。事件抽取被看作序列标注任务,首先采用ALBERT预训练模型学习特征,其次引入条件随机场CRF模型提高序列标注性能,最后完成事件类型以及事件要素的识别分类。在ACE2005标准语料库上的实验结果表明,与现有模型相比,ALBERT-CRF模型在触发词识别和分类任务上的召回率和F值均有所提高。 展开更多
关键词 事件抽取 序列标注 albert模型 条件随机场模型
在线阅读 下载PDF
ALBERT预训练模型在医疗文书命名实体识别中的应用研究
18
作者 庞秋奔 李银 《信息与电脑》 2024年第6期152-156,共5页
中文电子病历命名实体识别主要是研究电子病历病程记录文书数据集,文章提出对医疗手术麻醉文书数据集进行命名实体识别的研究。利用轻量级来自Transformer的双向编码器表示(A Lite Bidirectional Encoder Representation from Transform... 中文电子病历命名实体识别主要是研究电子病历病程记录文书数据集,文章提出对医疗手术麻醉文书数据集进行命名实体识别的研究。利用轻量级来自Transformer的双向编码器表示(A Lite Bidirectional Encoder Representation from Transformers,ALBERT)预训练模型微调数据集和Tranfomers中的trainer训练器训练模型的方法,实现在医疗手术麻醉文书上识别手术麻醉事件命名实体与获取复杂麻醉医疗质量控制指标值。文章为医疗手术麻醉文书命名实体识别提供了可借鉴的思路,并且为计算复杂麻醉医疗质量控制指标值提供了一种新的解决方案。 展开更多
关键词 命名实体识别 轻量级来自Transformer的双向编码器表示(albert)模型 TRANSFORMERS 麻醉医疗质量控制指标 医疗手术麻醉文书
在线阅读 下载PDF
融合 Albert 模型的珍稀濒危植物知识图谱的构建 被引量:6
19
作者 田梦晖 陈明 席晓桃 《湖南农业大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第5期616-623,共8页
针对珍稀濒危植物形态特征、分类等级、濒危系数、保护措施等知识不明确的问题,设计了文本融合轻量级双向转换编码表示模型(Albert)的知识抽取模型框架,实现批量抽取珍稀濒危植物知识,从而构建珍稀濒危植物知识图谱:1)在现存一般性植物... 针对珍稀濒危植物形态特征、分类等级、濒危系数、保护措施等知识不明确的问题,设计了文本融合轻量级双向转换编码表示模型(Albert)的知识抽取模型框架,实现批量抽取珍稀濒危植物知识,从而构建珍稀濒危植物知识图谱:1)在现存一般性植物本体的基础上,采用自顶向下的方式构建珍稀濒危植物本体,得到5个体系,即物种分类体系、生长形态特征体系、命名体系、保护现状体系和生态习性体系;2)采取Albert预训练模型来增强下游任务模型输入向量的珍稀濒危植物属性描述文本语义的表征能力;3)利用BiLSTM–CRF模型和BiGRU–Attention模型分别实现命名实体识别和关系抽取。在珍稀濒危植物数据测试集上对模型的有效性进行验证,结果表明,命名实体识别模型和关系抽取模型的召回率和准确率的调和平均值(F1)值分别达到98.07%和93.76%,将得到的大量的实体和关系所形成的三元组存储在图数据库Neo4j中,完成珍稀濒危植物知识图谱的可视化展示。 展开更多
关键词 珍稀濒危植物 albert模型 知识图谱 本体 命名实体识别 关系抽取
在线阅读 下载PDF
东非裂谷系Albert湖凹陷新生代构造沉降特征 被引量:4
20
作者 郑晨宇 赵红岩 +5 位作者 邱春光 邹耀遥 王亮 胡滨 贾屾 沈传波 《地质科技通报》 CAS CSCD 北大核心 2021年第5期162-172,共11页
新生代形成的东非裂谷是威尔逊旋回萌芽阶段的典型陆内裂谷,长期以来备受国内外地质学家关注。Albert湖凹陷位于东非裂谷系的西支最北端,整体呈北西向带状展布的不对称(半)地堑。目前,该区已有较好的工业性油气发现,分析其沉降演化规律... 新生代形成的东非裂谷是威尔逊旋回萌芽阶段的典型陆内裂谷,长期以来备受国内外地质学家关注。Albert湖凹陷位于东非裂谷系的西支最北端,整体呈北西向带状展布的不对称(半)地堑。目前,该区已有较好的工业性油气发现,分析其沉降演化规律对进一步揭示该凹陷的构造沉降特征及其油气勘探潜力具有重要的意义。基于钻井资料,结合地震资料解释、沉降史、埋藏史与断层活动性分析,重新划分了构造单元,总结了构造沉降特征,探讨了沉降与断裂的关系、沉降中心迁移的规律及其对油气勘探的指示意义。研究表明:Albert湖凹陷东部的次级构造单元主要受到东部边界断裂的控制,F_(1)、F_(2)断层对东部陡断带、东部断阶带以及三个构造调节带的沉降变化及其形成起主要控制作用;南部次凹在早期沉降速率较大,有利于晚中新世形成巨厚的烃源岩,随着沉降中心向北迁移,北部次凹发育了上中新统和下上新统烃源岩;沉降中心周缘的构造带是油气运聚的有利指向区。研究成果为东非裂谷系Albert湖凹陷油气进一步勘探提供了新的依据。 展开更多
关键词 东非裂谷 albert湖凹陷 沉降史 成藏 沉降中心
在线阅读 下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部