期刊文献+
共找到141篇文章
< 1 2 8 >
每页显示 20 50 100
Railway accident entity extraction method based on accident phase classification and mutual learning
1
作者 Zhibo Cheng Yanhua Wu +2 位作者 Zheqian Liu Yong Shi Ze Li 《Railway Sciences》 2025年第6期815-832,共18页
Purpose–This study aims to enhance the accuracy of key entity extraction from railway accident report texts and address challenges such as complex domain-specific semantics,data sparsity and strong inter-sentence sem... Purpose–This study aims to enhance the accuracy of key entity extraction from railway accident report texts and address challenges such as complex domain-specific semantics,data sparsity and strong inter-sentence semantic dependencies.A robust entity extraction method tailored for accident texts is proposed.Design/methodology/approach–This method is implemented through a dual-branch multi-task mutual learning model named R-MLP,which jointly performs entity recognition and accident phase classification.The model leverages a shared BERT encoder to extract contextual features and incorporates a sentence span indexing module to align feature granularity.A cross-task mutual learning mechanism is also introduced to strengthen semantic representation.Findings–R-MLP effectively mitigates the impact of semantic complexity and data sparsity in domain entities and enhances the model’s ability to capture inter-sentence semantic dependencies.Experimental results show that R-MLP achieves a maximum F1-score of 0.736 in extracting six types of key railway accident entities,significantly outperforming baseline models such as RoBERTa and MacBERT.Originality/value–This demonstrates the proposed method’s superior generalization and accuracy in domainspecific entity extraction tasks,confirming its effectiveness and practical value. 展开更多
关键词 Accident report texts entity extraction Accident phase classification Multi-task model Mutual learning mechanism
在线阅读 下载PDF
Named Entity Recognition for Nepali Text Using Support Vector Machines 被引量:3
2
作者 Surya Bahadur Bam Tej Bahadur Shahi 《Intelligent Information Management》 2014年第2期21-29,共9页
Named Entity Recognition aims to identify and to classify rigid designators in text such as proper names, biological species, and temporal expressions into some predefined categories. There has been growing interest i... Named Entity Recognition aims to identify and to classify rigid designators in text such as proper names, biological species, and temporal expressions into some predefined categories. There has been growing interest in this field of research since the early 1990s. Named Entity Recognition has a vital role in different fields of natural language processing such as Machine Translation, Information Extraction, Question Answering System and various other fields. In this paper, Named Entity Recognition for Nepali text, based on the Support Vector Machine (SVM) is presented which is one of machine learning approaches for the classification task. A set of features are extracted from training data set. Accuracy and efficiency of SVM classifier are analyzed in three different sizes of training data set. Recognition systems are tested with ten datasets for Nepali text. The strength of this work is the efficient feature extraction and the comprehensive recognition techniques. The Support Vector Machine based Named Entity Recognition is limited to use a certain set of features and it uses a small dictionary which affects its performance. The learning performance of recognition system is observed. It is found that system can learn well from the small set of training data and increase the rate of learning on the increment of training size. 展开更多
关键词 Support VECTOR MACHINE Named entity Recognition MACHINE Learning classification Nepali LANGUAGE TEXT
在线阅读 下载PDF
A U-Shaped Network-Based Grid Tagging Model for Chinese Named Entity Recognition
3
作者 Yan Xiang Xuedong Zhao +3 位作者 Junjun Guo Zhiliang Shi Enbang Chen Xiaobo Zhang 《Computers, Materials & Continua》 SCIE EI 2024年第6期4149-4167,共19页
Chinese named entity recognition(CNER)has received widespread attention as an important task of Chinese information extraction.Most previous research has focused on individually studying flat CNER,overlapped CNER,or d... Chinese named entity recognition(CNER)has received widespread attention as an important task of Chinese information extraction.Most previous research has focused on individually studying flat CNER,overlapped CNER,or discontinuous CNER.However,a unified CNER is often needed in real-world scenarios.Recent studies have shown that grid tagging-based methods based on character-pair relationship classification hold great potential for achieving unified NER.Nevertheless,how to enrich Chinese character-pair grid representations and capture deeper dependencies between character pairs to improve entity recognition performance remains an unresolved challenge.In this study,we enhance the character-pair grid representation by incorporating both local and global information.Significantly,we introduce a new approach by considering the character-pair grid representation matrix as a specialized image,converting the classification of character-pair relationships into a pixel-level semantic segmentation task.We devise a U-shaped network to extract multi-scale and deeper semantic information from the grid image,allowing for a more comprehensive understanding of associative features between character pairs.This approach leads to improved accuracy in predicting their relationships,ultimately enhancing entity recognition performance.We conducted experiments on two public CNER datasets in the biomedical domain,namely CMeEE-V2 and Diakg.The results demonstrate the effectiveness of our approach,which achieves F1-score improvements of 7.29 percentage points and 1.64 percentage points compared to the current state-of-the-art(SOTA)models,respectively. 展开更多
关键词 Chinese named entity recognition character-pair relation classification grid tagging U-shaped segmentation network
在线阅读 下载PDF
融合知识图谱和大模型的高校科研管理问答系统设计 被引量:6
4
作者 王永 秦嘉俊 +1 位作者 黄有锐 邓江洲 《计算机科学与探索》 北大核心 2025年第1期107-117,共11页
科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科... 科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科研知识图谱。利用同时进行意图分类和实体提取的多任务模型进行语义解析。借助解析结果来生成查询语句,并从知识图谱中检索信息来回复常规问题。将大语言模型与知识图谱相结合,以辅助处理开放性问题。在意图和实体具有关联的数据集上的实验结果表明,采用的多任务模型在意图分类和实体识别任务上的F1值分别为0.958和0.937,优于其他对比模型和单任务模型。Cypher生成测试表明了自定义Prompt在激发大语言模型涌现能力方面的成效,利用大语言模型实现文本生成Cypher的准确率达到85.8%,有效处理了基于知识图谱的开放性问题。采用知识图谱、传统模型和大语言模型搭建的问答系统的准确性为0.935,很好地满足了智能问答的需求。 展开更多
关键词 知识图谱 多任务模型 意图分类 命名实体识别 大语言模型
在线阅读 下载PDF
高速铁路技术改造和大修整治项目知识图谱构建方法
5
作者 廉小亲 包可欣 +4 位作者 张刘刚 程智博 吴艳华 高超 龚永罡 《中国铁路》 北大核心 2025年第11期113-124,共12页
为解决当前高铁技改大修项目中存在的大量半结构化和非结构化项目文本数据难以直接存储利用和管理精细化不足等问题,以某高速铁路公司2013—2022年技改大修项目文本为研究对象,提出自顶向下与自底向上相结合的方案构建技改大修知识图谱... 为解决当前高铁技改大修项目中存在的大量半结构化和非结构化项目文本数据难以直接存储利用和管理精细化不足等问题,以某高速铁路公司2013—2022年技改大修项目文本为研究对象,提出自顶向下与自底向上相结合的方案构建技改大修知识图谱。研究提出RBC命名实体识别模型来抽取知识实体;构建Prompt模板并结合大模型抽取各实体之间的关系;提出基于Stacking的文本分类算法实现技改大修项目按专业自动分类。此外,针对实体冗余不规范化的问题,采用基于Levenshtein距离的实体消歧算法进行实体融合。实验结果表明,提出的RBC实体识别模型在各类实体上的F1值均大于90%,基于Stacking的文本分类算法在项目分类中精确率均大于80%,表现优异。研究共抽取技改大修实体数量1111个,实体关系1364条,并基于此构建技改大修知识图谱,实现对技改大修项目知识的可视化展示和关联查询,为开展高铁技改大修项目精细化管理与辅助决策提供技术支撑。 展开更多
关键词 高速铁路 知识图谱 技改大修 实体识别 文本分类 知识融合
在线阅读 下载PDF
联合边界生成的多目标学习的嵌套命名实体识别 被引量:1
6
作者 徐章杰 陈艳平 +2 位作者 扈应 黄瑞章 秦永彬 《计算机应用》 北大核心 2025年第7期2229-2236,共8页
命名实体识别(NER)旨在从非结构化文本中识别预定义的实体类型。基于跨度的NER方法通过枚举所有可能的跨度进行分类,然而文本中相邻的跨度共享上下文语义,会导致跨度之间的边界语义信息模糊,从而使模型难以获取跨度间的依赖信息。针对... 命名实体识别(NER)旨在从非结构化文本中识别预定义的实体类型。基于跨度的NER方法通过枚举所有可能的跨度进行分类,然而文本中相邻的跨度共享上下文语义,会导致跨度之间的边界语义信息模糊,从而使模型难以获取跨度间的依赖信息。针对跨度间边界语义信息模糊的问题,提出一种联合边界生成的多目标学习NER模型。该模型通过联合NER任务和边界生成任务,以多目标学习的方式进行共同训练。其中:使用边界生成任务作为辅助任务引导模型网络关注跨度的边界信息,以增强跨度的边界语义,进而提升NER的性能。在ACE2004、ACE2005和GENIA数据集上进行测试,所提模型的F1值分别达到了87.83%、86.90%和81.65%,实验结果充分验证了该模型在不同数据集上的有效性,也进一步验证了该模型在命名实体识别任务中的优越性能。 展开更多
关键词 命名实体识别 跨度分类 多目标学习 边界生成 神经网络
在线阅读 下载PDF
基于多尺度边框融合的实体语义增强方法
7
作者 吴灿 陈艳平 +2 位作者 扈应 黄瑞章 秦永彬 《计算机研究与发展》 北大核心 2025年第12期2983-2992,共10页
命名实体识别(named entity recognition,NER)是自然语言处理中的一项传统任务.基于跨度分类的方法是用来解决嵌套命名实体识别的主流方法.该方法通常是拼接实体边界的表示来获得跨度.然而,长实体容易导致2个实体边界之间的语义关联被弱... 命名实体识别(named entity recognition,NER)是自然语言处理中的一项传统任务.基于跨度分类的方法是用来解决嵌套命名实体识别的主流方法.该方法通常是拼接实体边界的表示来获得跨度.然而,长实体容易导致2个实体边界之间的语义关联被弱化,并且单一尺度的跨度无法完整地捕捉实体在不同上下文中的表现.对此提出了一种基于多尺度边框融合的实体语义增强方法.该方法将跨度表示为带有边界位置信息的边框.首先,将通过融合不同尺度实体特征得到多尺度边框以增强边框中的语义特征,使边框的上下文依赖性更强.然后,通过基于位置权重的注意力机制进一步细化边框的边界位置使得边框信息更准确.最后,同时预测边框的实体类别和相对于真实实体的位置偏移量,有效支持嵌套命名实体的识别和定位.该方法在ACE2004英文数据集、ACE2005英文数据集和Weibo中文数据集上分别取得了88.63%,88.53%,73.86%的F1值,证明了模型的有效性. 展开更多
关键词 命名实体识别 跨度分类 多尺度边框融合 实体语义增强 位置权重注意力机制
在线阅读 下载PDF
实景三维背景下事件的概念、分类与数据模型研究进展及展望
8
作者 王明明 曹一冰 +3 位作者 华一新 张江水 李圣卉 陈敏颉 《地球信息科学学报》 北大核心 2025年第7期1532-1550,共19页
【意义】事件作为表征现实世界复杂过程的重要单元,近年来受到各学科广泛关注。随着数字孪生、实景三维中国等重点工程的推进,基于实体的现实世界建模与表达需求日益突出,亟需从实体视角重新审视事件的定义、分类及数据模型体系,以支撑... 【意义】事件作为表征现实世界复杂过程的重要单元,近年来受到各学科广泛关注。随着数字孪生、实景三维中国等重点工程的推进,基于实体的现实世界建模与表达需求日益突出,亟需从实体视角重新审视事件的定义、分类及数据模型体系,以支撑多维信息表达与深层语义解析。【进展】本文首先从跨学科角度系统梳理了事件的概念内涵与定义特征,其次归纳了现有事件分类方式的理论依据与结构特征。同时,从建模理念与适用范围两个维度出发,提出三类事件数据模型划分框架:事件语义要素模型、基于本体的事件模型、面向事件的时空数据模型,并对其在“时间、空间、参与对象、事件关系与层次结构”等关键维度的表达能力进行了系统分析与对比评价,揭示了各模型在动态过程表达、通用性与扩展性等方面的应用优势与局限。【方法】在上述基础上,本文提出了基于时空实体的事件定义,并进一步提出两种面向实体建模与事件分析的新型分类方法:依据事件记录完整度的分类方式和依据变化过程类别的分类方式。【展望】未来研究可推动事件数据模型由“结构组织”向“语义融合”与“智能建构”转型,融合多类模型优势构建统一框架,协同定性与定量建模机制以支撑一体化分析,并引入人工智能,提升建模的智能性与自适应能力。 展开更多
关键词 实景三维 事件定义 事件分类 事件数据模型 事件本体模型 时空数据模型 时空实体 变化过程
原文传递
面向煤矿安全隐患文本的预训练语言模型构建
9
作者 李泽荃 刘飞翔 +2 位作者 赵嘉良 祁慧 李靖 《矿业安全与环保》 北大核心 2025年第3期185-192,共8页
煤矿各类安全管理信息化平台积累的大量非结构化文本数据目前并没有得到充分利用。为充分挖掘煤矿安全隐患文本知识,提出一种基于领域术语掩码语言建模(DP-MLM)和句子顺序预测建模(SOP)学习机制的煤矿安全领域预训练语言模型(CoalBERT)... 煤矿各类安全管理信息化平台积累的大量非结构化文本数据目前并没有得到充分利用。为充分挖掘煤矿安全隐患文本知识,提出一种基于领域术语掩码语言建模(DP-MLM)和句子顺序预测建模(SOP)学习机制的煤矿安全领域预训练语言模型(CoalBERT)。利用收集到的110万余条煤矿隐患排查记录数据和自构建的1 328个领域术语词典进行模型训练,并在煤矿安全隐患文本分类和命名实体识别2个任务上分别进行对比实验。研究结果表明:在文本分类实验中,CoalBERT模型总体结果的精准率、召回率和综合评价指标F_(1)值较双向编码器表征法预训练模型(BERT)分别提高0.34%、0.21%、0.27%;在命名实体识别实验中,CoalBERT模型的精准率和F_(1)值较BERT模型分别提高3.84%、2.13%。CoalBERT模型能够有效提升煤矿安全隐患文本语义理解能力,可为煤矿安全领域文本挖掘相关任务场景提供基础参考。 展开更多
关键词 BERT模型 煤矿安全隐患文本 文本分类 命名实体识别 预训练模型 任务微调
在线阅读 下载PDF
Language Adaptation for Entity Relation Classification via Adversarial Neural Networks 被引量:1
10
作者 Bo-Wei Zou Rong-Tao Huang +2 位作者 Zeng-Zhuang Xu Yu Hong Guo-Dong Zhou 《Journal of Computer Science & Technology》 SCIE EI CSCD 2021年第1期207-220,共14页
Entity relation classification aims to classify the semantic relationship between two marked entities in a given sentence,and plays a vital role in various natural language processing applications.However,existing stu... Entity relation classification aims to classify the semantic relationship between two marked entities in a given sentence,and plays a vital role in various natural language processing applications.However,existing studies focus on exploiting mono-lingual data in English,due to the lack of labeled data in other languages.How to effectively benefit from a richly-labeled language to help a poorly-labeled language is still an open problem.In this paper,we come up with a language adaptation framework for cross-lingual entity relation classification.The basic idea is to employ adversarial neural networks(AdvNN)to transfer feature representations from one language to another.Especially,such a language adaptation framework enables feature imitation via the competition between a sentence encoder and a rival language discriminator to generate effective representations.To verify the effectiveness of AdvNN,we introduce two kinds of adversarial structures,dual-channel AdvNN and single-channel AdvNN.Experimental results on the ACE 2005 multilingual training corpus show that our single-channel AdvNN achieves the best performance on both unsupervised and semi-supervised scenarios,yielding an improvement of 6.61%and 2.98%over the state-of-the-art,respectively.Compared with baselines which directly adopt a machine translation module,we find that both dual-channel and single-channel AdvNN significantly improve the performances(F1)of cross-lingual entity relation classification.Moreover,extensive analysis and discussion demonstrate the appropriateness and effectiveness of different parameter settings in our language adaptation framework. 展开更多
关键词 adversarial neural network entity relation classification language adaptation
原文传递
面向零信任的NPE身份标识研究
11
作者 苗青鹏 吴娅玲 赖增桂 《信息安全与通信保密》 2025年第11期110-118,共9页
非人员实体(NPE)在零信任环境中广泛存在,然而目前其身份标识方式缺乏统一标准,导致标识出现跨域可用性差、缺乏全局唯一性、难以管理等问题,不足以支撑零信任环境中的实体认证与授权安全性。围绕以上问题,通过分析NPE在零信任中的功能... 非人员实体(NPE)在零信任环境中广泛存在,然而目前其身份标识方式缺乏统一标准,导致标识出现跨域可用性差、缺乏全局唯一性、难以管理等问题,不足以支撑零信任环境中的实体认证与授权安全性。围绕以上问题,通过分析NPE在零信任中的功能与角色特点,提出一个分类框架,将NPE划分为3个大类和28个子类,并基于此框架构建了NPE的统一身份标识方案,保证标识的真实性、唯一性和可解析性,具有良好的跨域适用性,同时为零信任环境下的持续信任评估与细粒度动态访问控制提供支撑。 展开更多
关键词 零信任架构 非人员实体 分类框架 身份标识
在线阅读 下载PDF
基于大语言模型的施工质量知识图谱构建
12
作者 余端仁 史健勇 《土木工程与管理学报》 2025年第2期92-100,共9页
多模态知识图谱能够有效组织施工质量管理中的多源异构数据,解决传统文档存在的信息模态单一、数据分散、检索低效等问题。因此,本文基于本体与大语言模型技术提出一种施工质量知识图谱构建方法。首先,进行数据预处理与施工质量本体构建... 多模态知识图谱能够有效组织施工质量管理中的多源异构数据,解决传统文档存在的信息模态单一、数据分散、检索低效等问题。因此,本文基于本体与大语言模型技术提出一种施工质量知识图谱构建方法。首先,进行数据预处理与施工质量本体构建;其次,提出LLM-RE、“领域专家”提示策略等方法进行数据层构建,实现施工质量知识抽取;最后,将数据层自动实例化为多模态知识图谱,并基于图谱构建智能问答系统。实验结果表明,本研究设计了有效的施工质量本体,提出的数据层构建方法在规范条文分类、实体识别等问题上的F1值分别高达88.4%,81.2%。这有助于提升施工质量知识图谱的构建效率,实现施工质量知识的高效组织与复用,为质量缺陷防治和管控等提供支持。 展开更多
关键词 大语言模型 知识图谱 工程质量 本体 实体识别 文本分类
在线阅读 下载PDF
基于语料库的朝鲜语命名实体结构特征研究
13
作者 黄政豪 金光洙 《外语学刊》 北大核心 2025年第1期9-18,共10页
本文统计Klue⁃ner和Kochet⁃ner两个命名实体语料库中的新闻、评论和文化遗产文本数据包含的不同类别朝鲜语命名实体。根据统计结果分析朝鲜语命名实体的音节长度特征分布和格词尾结合率。分析结果表明,音节长度和格词尾的使用在命名实... 本文统计Klue⁃ner和Kochet⁃ner两个命名实体语料库中的新闻、评论和文化遗产文本数据包含的不同类别朝鲜语命名实体。根据统计结果分析朝鲜语命名实体的音节长度特征分布和格词尾结合率。分析结果表明,音节长度和格词尾的使用在命名实体分类中具有一定的规律可循。本文的研究成果可用于命名实体分类工作,同时也可以为朝鲜语命名实体语料库构建提供分布结构建议。 展开更多
关键词 朝鲜语 格词尾 命名实体识别 特征提取 名词分类
原文传递
铁路工程地理实体数据库建设技术研究
14
作者 胡玉雷 《铁道标准设计》 北大核心 2025年第3期40-47,共8页
在铁路工程领域,设计、施工与运维的智能化发展趋势对地理信息的表达和管理提出了更高要求。铁路行业地理信息主要通过传统CAD格式的数字地形图表达,重在可视化制图表达,缺乏各类扩展属性,难以满足协同设计、智能设计需求。结合铁路工... 在铁路工程领域,设计、施工与运维的智能化发展趋势对地理信息的表达和管理提出了更高要求。铁路行业地理信息主要通过传统CAD格式的数字地形图表达,重在可视化制图表达,缺乏各类扩展属性,难以满足协同设计、智能设计需求。结合铁路工程设计、施工、运维对地理实体数据库建设的需求,提出兼容国家标准的铁路工程地理实体分类与编码方法,研究地理实体的数据内容,提出数据生产方案、数据库结构及存储方案,并在长沙至赣州高铁项目中进行生产试验。试验效果表明,本文提出的一套铁路工程地理实体建库技术方案具有较高的可实施性。另外,地理实体较传统数字地形图生产成本更高,但其优势在于可以提供更丰富的扩展属性,支持各设计专业开展协同设计、智能设计等拓展应用。铁路工程地理实体数据库建设在分类及编码、数据生产方案、数据管理等方面还处在探索阶段,需要在研究、应用过程中不断完善。 展开更多
关键词 铁路工程 地理实体 数据库 分类与编码 生产方案
在线阅读 下载PDF
Relation Enhanced Neural Model for Type Classification of EntityMentions with a Fine-Grained Taxonomy
15
作者 Kai-Yuan Cui Peng-Jie Ren +2 位作者 Zhu-Min Chen Tao Lian Jun Ma 《Journal of Computer Science & Technology》 SCIE EI CSCD 2017年第4期814-827,共14页
Inferring semantic types of the entity mentions in a sentence is a necessary yet challenging task. Most of existing methods employ a very coarse-grained type taxonomy, which is too general and not exact enough for man... Inferring semantic types of the entity mentions in a sentence is a necessary yet challenging task. Most of existing methods employ a very coarse-grained type taxonomy, which is too general and not exact enough for many tasks. However, the performances of the methods drop sharply when we extend the type taxonomy to a fine-grained one with several hundreds of types. In this paper, we introduce a hybrid neural network model for type classification of entity mentions with a fine-grained taxonomy. There are four components in our model, namely, the entity mention component, the context component, the relation component, the already known type component, which are used to extract features from the target entity mention, context, relations and already known types of the entity mentions in surrounding context respectively. The learned features by the four components are concatenated and fed into a softmax layer to predict the type distribution. We carried out extensive experiments to evaluate our proposed model. Experimental results demonstrate that our model achieves state-of-the-art performance on the FIGER dataset. Moreover, we extracted larger datasets from Wikipedia and DBpedia. On the larger datasets, our model achieves the comparable performance to the state-of-the-art methods with the coarse-grained type taxonomy, but performs much better than those methods with the fine-grained type taxonomy in terms of micro-F1, macro-F1 and weighted-F1. 展开更多
关键词 entity mention classification entity mention relation fine-grained taxonomy
原文传递
基于大语言模型的漏洞文本分类方法
16
作者 孟楠 汤旭 周娟 《计算机工程与设计》 北大核心 2025年第9期2548-2553,共6页
近年来,大语言模型在多种下游任务上表现出了较强的理解和生成能力,但如何有效利用大语言模型来理解和分析漏洞仍是一个挑战。为此,提出了一种融合关键信息的上下文学习方法(key information in-context learning,KIICL)进行漏洞类型分... 近年来,大语言模型在多种下游任务上表现出了较强的理解和生成能力,但如何有效利用大语言模型来理解和分析漏洞仍是一个挑战。为此,提出了一种融合关键信息的上下文学习方法(key information in-context learning,KIICL)进行漏洞类型分类。通过提供上下文示例和漏洞关键信息突出漏洞描述中的细节,以强化大语言模型对漏洞描述的理解,进而提高分类能力。为获得关键信息,文章采用了基于条件随机场(CRF)的关键信息识别方法。实验结果表明,KIICL方法在大语言模型上比无示例样本方法提升了6.6%,比不包含关键信息的少量示例方法提升了2.2%,验证了KIICL方法的有效性。 展开更多
关键词 漏洞分类 关键信息抽取 上下文学习 大语言模型 条件随机场 命名实体识别 提示工程
在线阅读 下载PDF
基于深度学习的文本敏感信息识别综述
17
作者 朱雨龙 徐建光 舒历晨 《工业信息安全》 2025年第4期6-14,共9页
文本敏感信息识别是保障数据安全的关键技术,其研究具有重要现实意义。近年来,基于深度学习的方法得到了广泛关注,但现有研究大多只关注特定算法或场景,缺乏对该领域的归纳总结。文章通过调研相关文献,对基于深度学习的文本敏感信息识... 文本敏感信息识别是保障数据安全的关键技术,其研究具有重要现实意义。近年来,基于深度学习的方法得到了广泛关注,但现有研究大多只关注特定算法或场景,缺乏对该领域的归纳总结。文章通过调研相关文献,对基于深度学习的文本敏感信息识别技术进行体系化综述。首先梳理了基于敏感文本分类和基于敏感实体识别两类方法的技术演进,同时介绍了现有研究中常用的4个基准数据集的特性和适用场景;之后探讨了当前该领域研究面临的风险,并针对这些挑战分析了未来的发展趋势。文章通过构建“技术—挑战—趋势”的三维分析体系,为文本敏感信息识别技术的理论深化与应用创新提供系统性参考,助力信息安全治理能力提升。 展开更多
关键词 敏感信息识别 文本分类 命名实体识别 数据安全
在线阅读 下载PDF
“分类—协作”:农村人居环境整体性治理的实践逻辑
18
作者 黄佳鹏 《山东科技大学学报(社会科学版)》 2025年第2期99-106,共8页
对关中G镇农村人居环境整体性治理实践的分析发现,该模式通过治理事务分类与治理主体协作,对人居环境治理中的行政性、市场化与自治性事务进行了有效划分,以清晰界定公私边界、促进市场与社会责任共担,以及依托“行政规制—市场激励—... 对关中G镇农村人居环境整体性治理实践的分析发现,该模式通过治理事务分类与治理主体协作,对人居环境治理中的行政性、市场化与自治性事务进行了有效划分,以清晰界定公私边界、促进市场与社会责任共担,以及依托“行政规制—市场激励—社会动员”的协同耦合机制等方式,实现了治理过程中行政部门、市场主体与村级组织等多主体协作。在“分类—协作”框架下,农村人居环境治理不再是单一的自上而下的行政任务,亦非仅属于市场主体的业务,而是村级组织与村民的内生事务,即走向整体性治理。这不仅实现了农村人居环境治理过程中的空间再造、效率与效益兼具、资源撬动,以及“成本—收益”最优化,还通过体系再造与主体重塑,推动农民生活现代化转型与乡村善治。未来可持续强化村级组织及村干部在人居环境治理中的主导作用,给予他们更大的治理空间;同时提升多元资源整合能力,实现村内正式与非正式组织力量的有效融合,激发多主体有效协作。 展开更多
关键词 农村人居环境 事务分类 主体协作 村社本位 整体性治理
在线阅读 下载PDF
基于BERT的混合电力信息报文自动提取技术
19
作者 贺云隆 杨东华 +3 位作者 宋晓林 张闯 李佳燚 刘鑫宇 《无线电工程》 2025年第5期1105-1114,共10页
针对智能化电力系统运行维护过程中产生的大量电力信息报文缺乏有效提取技术的实际情况,提出了一种基于双向编码器表示的Transformer模型(Bidirectional Encoder Representations from Transformers, BERT)的混合电力信息报文自动提取技... 针对智能化电力系统运行维护过程中产生的大量电力信息报文缺乏有效提取技术的实际情况,提出了一种基于双向编码器表示的Transformer模型(Bidirectional Encoder Representations from Transformers, BERT)的混合电力信息报文自动提取技术,旨在提高电力系统中非结构化故障文本数据的分析效率。构建了一个包含BERT-SENet网络用于文本分类,以及BERT-Bi-LSTM-CRF网络用于命名实体识别的自动提取模型。通过整合文本分类和命名实体识别任务,模型能够有效地对电力故障文本进行自动分类和关键信息提取。实验结果表明,模型在文本分类和命名实体识别任务上均优于传统方法,为电力系统的信息化和智能化提供了有效支持。提升了电力系统故障处理的效率,为类似领域的文本数据自动分析提供了新的思路和方法。 展开更多
关键词 智慧电网 电力故障文本 自然语言处理 文本分类 命名实体识别 双向编码器表示的Transformer模型
在线阅读 下载PDF
利用自然语言处理技术提升医院档案信息提取的效率
20
作者 傅天一 《计算机应用文摘》 2025年第9期94-96,共3页
传统的档案信息提取方法主要依赖人工操作,这不仅耗时费力,还易出现错误,影响数据的准确性和可靠性。随着自然语言处理(Natural Language Processing,NLP)技术的迅速发展,医院档案信息提取的效率得到了显著提升。文章探讨了如何应用NLP... 传统的档案信息提取方法主要依赖人工操作,这不仅耗时费力,还易出现错误,影响数据的准确性和可靠性。随着自然语言处理(Natural Language Processing,NLP)技术的迅速发展,医院档案信息提取的效率得到了显著提升。文章探讨了如何应用NLP技术来提高医院档案信息提取的效率,重点介绍了文本分类、命名实体识别和关系抽取等关键技术。其中,文本分类可以自动对档案进行分类,有效组织信息;命名实体识别用于识别和提取关键信息,如患者姓名、疾病名称和药物等;关系抽取则可以揭示不同信息间的关系,帮助建立完整的信息网络。 展开更多
关键词 自然语言处理 档案信息提取 文本分类 命名实体识别 关系抽取 医疗信息处理
在线阅读 下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部