期刊文献+
共找到139篇文章
< 1 2 7 >
每页显示 20 50 100
Railway accident entity extraction method based on accident phase classification and mutual learning
1
作者 Zhibo Cheng Yanhua Wu +2 位作者 Zheqian Liu Yong Shi Ze Li 《Railway Sciences》 2025年第6期815-832,共18页
Purpose–This study aims to enhance the accuracy of key entity extraction from railway accident report texts and address challenges such as complex domain-specific semantics,data sparsity and strong inter-sentence sem... Purpose–This study aims to enhance the accuracy of key entity extraction from railway accident report texts and address challenges such as complex domain-specific semantics,data sparsity and strong inter-sentence semantic dependencies.A robust entity extraction method tailored for accident texts is proposed.Design/methodology/approach–This method is implemented through a dual-branch multi-task mutual learning model named R-MLP,which jointly performs entity recognition and accident phase classification.The model leverages a shared BERT encoder to extract contextual features and incorporates a sentence span indexing module to align feature granularity.A cross-task mutual learning mechanism is also introduced to strengthen semantic representation.Findings–R-MLP effectively mitigates the impact of semantic complexity and data sparsity in domain entities and enhances the model’s ability to capture inter-sentence semantic dependencies.Experimental results show that R-MLP achieves a maximum F1-score of 0.736 in extracting six types of key railway accident entities,significantly outperforming baseline models such as RoBERTa and MacBERT.Originality/value–This demonstrates the proposed method’s superior generalization and accuracy in domainspecific entity extraction tasks,confirming its effectiveness and practical value. 展开更多
关键词 Accident report texts entity extraction Accident phase classification Multi-task model Mutual learning mechanism
在线阅读 下载PDF
A U-Shaped Network-Based Grid Tagging Model for Chinese Named Entity Recognition
2
作者 Yan Xiang Xuedong Zhao +3 位作者 Junjun Guo Zhiliang Shi Enbang Chen Xiaobo Zhang 《Computers, Materials & Continua》 SCIE EI 2024年第6期4149-4167,共19页
Chinese named entity recognition(CNER)has received widespread attention as an important task of Chinese information extraction.Most previous research has focused on individually studying flat CNER,overlapped CNER,or d... Chinese named entity recognition(CNER)has received widespread attention as an important task of Chinese information extraction.Most previous research has focused on individually studying flat CNER,overlapped CNER,or discontinuous CNER.However,a unified CNER is often needed in real-world scenarios.Recent studies have shown that grid tagging-based methods based on character-pair relationship classification hold great potential for achieving unified NER.Nevertheless,how to enrich Chinese character-pair grid representations and capture deeper dependencies between character pairs to improve entity recognition performance remains an unresolved challenge.In this study,we enhance the character-pair grid representation by incorporating both local and global information.Significantly,we introduce a new approach by considering the character-pair grid representation matrix as a specialized image,converting the classification of character-pair relationships into a pixel-level semantic segmentation task.We devise a U-shaped network to extract multi-scale and deeper semantic information from the grid image,allowing for a more comprehensive understanding of associative features between character pairs.This approach leads to improved accuracy in predicting their relationships,ultimately enhancing entity recognition performance.We conducted experiments on two public CNER datasets in the biomedical domain,namely CMeEE-V2 and Diakg.The results demonstrate the effectiveness of our approach,which achieves F1-score improvements of 7.29 percentage points and 1.64 percentage points compared to the current state-of-the-art(SOTA)models,respectively. 展开更多
关键词 Chinese named entity recognition character-pair relation classification grid tagging U-shaped segmentation network
在线阅读 下载PDF
融合知识图谱和大模型的高校科研管理问答系统设计 被引量:5
3
作者 王永 秦嘉俊 +1 位作者 黄有锐 邓江洲 《计算机科学与探索》 北大核心 2025年第1期107-117,共11页
科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科... 科研管理是高校管理中的重要组成部分,但现有的科研管理系统难以满足用户的个性化需求。以高校科研管理向智能化转型为需求导向,将知识图谱、传统模型和大语言模型相结合,共同构建新一代高校科研管理问答系统。采集科研知识用于构建科研知识图谱。利用同时进行意图分类和实体提取的多任务模型进行语义解析。借助解析结果来生成查询语句,并从知识图谱中检索信息来回复常规问题。将大语言模型与知识图谱相结合,以辅助处理开放性问题。在意图和实体具有关联的数据集上的实验结果表明,采用的多任务模型在意图分类和实体识别任务上的F1值分别为0.958和0.937,优于其他对比模型和单任务模型。Cypher生成测试表明了自定义Prompt在激发大语言模型涌现能力方面的成效,利用大语言模型实现文本生成Cypher的准确率达到85.8%,有效处理了基于知识图谱的开放性问题。采用知识图谱、传统模型和大语言模型搭建的问答系统的准确性为0.935,很好地满足了智能问答的需求。 展开更多
关键词 知识图谱 多任务模型 意图分类 命名实体识别 大语言模型
在线阅读 下载PDF
联合边界生成的多目标学习的嵌套命名实体识别
4
作者 徐章杰 陈艳平 +2 位作者 扈应 黄瑞章 秦永彬 《计算机应用》 北大核心 2025年第7期2229-2236,共8页
命名实体识别(NER)旨在从非结构化文本中识别预定义的实体类型。基于跨度的NER方法通过枚举所有可能的跨度进行分类,然而文本中相邻的跨度共享上下文语义,会导致跨度之间的边界语义信息模糊,从而使模型难以获取跨度间的依赖信息。针对... 命名实体识别(NER)旨在从非结构化文本中识别预定义的实体类型。基于跨度的NER方法通过枚举所有可能的跨度进行分类,然而文本中相邻的跨度共享上下文语义,会导致跨度之间的边界语义信息模糊,从而使模型难以获取跨度间的依赖信息。针对跨度间边界语义信息模糊的问题,提出一种联合边界生成的多目标学习NER模型。该模型通过联合NER任务和边界生成任务,以多目标学习的方式进行共同训练。其中:使用边界生成任务作为辅助任务引导模型网络关注跨度的边界信息,以增强跨度的边界语义,进而提升NER的性能。在ACE2004、ACE2005和GENIA数据集上进行测试,所提模型的F1值分别达到了87.83%、86.90%和81.65%,实验结果充分验证了该模型在不同数据集上的有效性,也进一步验证了该模型在命名实体识别任务中的优越性能。 展开更多
关键词 命名实体识别 跨度分类 多目标学习 边界生成 神经网络
在线阅读 下载PDF
实景三维背景下事件的概念、分类与数据模型研究进展及展望
5
作者 王明明 曹一冰 +3 位作者 华一新 张江水 李圣卉 陈敏颉 《地球信息科学学报》 北大核心 2025年第7期1532-1550,共19页
【意义】事件作为表征现实世界复杂过程的重要单元,近年来受到各学科广泛关注。随着数字孪生、实景三维中国等重点工程的推进,基于实体的现实世界建模与表达需求日益突出,亟需从实体视角重新审视事件的定义、分类及数据模型体系,以支撑... 【意义】事件作为表征现实世界复杂过程的重要单元,近年来受到各学科广泛关注。随着数字孪生、实景三维中国等重点工程的推进,基于实体的现实世界建模与表达需求日益突出,亟需从实体视角重新审视事件的定义、分类及数据模型体系,以支撑多维信息表达与深层语义解析。【进展】本文首先从跨学科角度系统梳理了事件的概念内涵与定义特征,其次归纳了现有事件分类方式的理论依据与结构特征。同时,从建模理念与适用范围两个维度出发,提出三类事件数据模型划分框架:事件语义要素模型、基于本体的事件模型、面向事件的时空数据模型,并对其在“时间、空间、参与对象、事件关系与层次结构”等关键维度的表达能力进行了系统分析与对比评价,揭示了各模型在动态过程表达、通用性与扩展性等方面的应用优势与局限。【方法】在上述基础上,本文提出了基于时空实体的事件定义,并进一步提出两种面向实体建模与事件分析的新型分类方法:依据事件记录完整度的分类方式和依据变化过程类别的分类方式。【展望】未来研究可推动事件数据模型由“结构组织”向“语义融合”与“智能建构”转型,融合多类模型优势构建统一框架,协同定性与定量建模机制以支撑一体化分析,并引入人工智能,提升建模的智能性与自适应能力。 展开更多
关键词 实景三维 事件定义 事件分类 事件数据模型 事件本体模型 时空数据模型 时空实体 变化过程
原文传递
面向煤矿安全隐患文本的预训练语言模型构建
6
作者 李泽荃 刘飞翔 +2 位作者 赵嘉良 祁慧 李靖 《矿业安全与环保》 北大核心 2025年第3期185-192,共8页
煤矿各类安全管理信息化平台积累的大量非结构化文本数据目前并没有得到充分利用。为充分挖掘煤矿安全隐患文本知识,提出一种基于领域术语掩码语言建模(DP-MLM)和句子顺序预测建模(SOP)学习机制的煤矿安全领域预训练语言模型(CoalBERT)... 煤矿各类安全管理信息化平台积累的大量非结构化文本数据目前并没有得到充分利用。为充分挖掘煤矿安全隐患文本知识,提出一种基于领域术语掩码语言建模(DP-MLM)和句子顺序预测建模(SOP)学习机制的煤矿安全领域预训练语言模型(CoalBERT)。利用收集到的110万余条煤矿隐患排查记录数据和自构建的1 328个领域术语词典进行模型训练,并在煤矿安全隐患文本分类和命名实体识别2个任务上分别进行对比实验。研究结果表明:在文本分类实验中,CoalBERT模型总体结果的精准率、召回率和综合评价指标F_(1)值较双向编码器表征法预训练模型(BERT)分别提高0.34%、0.21%、0.27%;在命名实体识别实验中,CoalBERT模型的精准率和F_(1)值较BERT模型分别提高3.84%、2.13%。CoalBERT模型能够有效提升煤矿安全隐患文本语义理解能力,可为煤矿安全领域文本挖掘相关任务场景提供基础参考。 展开更多
关键词 BERT模型 煤矿安全隐患文本 文本分类 命名实体识别 预训练模型 任务微调
在线阅读 下载PDF
基于大语言模型的施工质量知识图谱构建
7
作者 余端仁 史健勇 《土木工程与管理学报》 2025年第2期92-100,共9页
多模态知识图谱能够有效组织施工质量管理中的多源异构数据,解决传统文档存在的信息模态单一、数据分散、检索低效等问题。因此,本文基于本体与大语言模型技术提出一种施工质量知识图谱构建方法。首先,进行数据预处理与施工质量本体构建... 多模态知识图谱能够有效组织施工质量管理中的多源异构数据,解决传统文档存在的信息模态单一、数据分散、检索低效等问题。因此,本文基于本体与大语言模型技术提出一种施工质量知识图谱构建方法。首先,进行数据预处理与施工质量本体构建;其次,提出LLM-RE、“领域专家”提示策略等方法进行数据层构建,实现施工质量知识抽取;最后,将数据层自动实例化为多模态知识图谱,并基于图谱构建智能问答系统。实验结果表明,本研究设计了有效的施工质量本体,提出的数据层构建方法在规范条文分类、实体识别等问题上的F1值分别高达88.4%,81.2%。这有助于提升施工质量知识图谱的构建效率,实现施工质量知识的高效组织与复用,为质量缺陷防治和管控等提供支持。 展开更多
关键词 大语言模型 知识图谱 工程质量 本体 实体识别 文本分类
在线阅读 下载PDF
基于语料库的朝鲜语命名实体结构特征研究
8
作者 黄政豪 金光洙 《外语学刊》 北大核心 2025年第1期9-18,共10页
本文统计Klue⁃ner和Kochet⁃ner两个命名实体语料库中的新闻、评论和文化遗产文本数据包含的不同类别朝鲜语命名实体。根据统计结果分析朝鲜语命名实体的音节长度特征分布和格词尾结合率。分析结果表明,音节长度和格词尾的使用在命名实... 本文统计Klue⁃ner和Kochet⁃ner两个命名实体语料库中的新闻、评论和文化遗产文本数据包含的不同类别朝鲜语命名实体。根据统计结果分析朝鲜语命名实体的音节长度特征分布和格词尾结合率。分析结果表明,音节长度和格词尾的使用在命名实体分类中具有一定的规律可循。本文的研究成果可用于命名实体分类工作,同时也可以为朝鲜语命名实体语料库构建提供分布结构建议。 展开更多
关键词 朝鲜语 格词尾 命名实体识别 特征提取 名词分类
原文传递
铁路工程地理实体数据库建设技术研究
9
作者 胡玉雷 《铁道标准设计》 北大核心 2025年第3期40-47,共8页
在铁路工程领域,设计、施工与运维的智能化发展趋势对地理信息的表达和管理提出了更高要求。铁路行业地理信息主要通过传统CAD格式的数字地形图表达,重在可视化制图表达,缺乏各类扩展属性,难以满足协同设计、智能设计需求。结合铁路工... 在铁路工程领域,设计、施工与运维的智能化发展趋势对地理信息的表达和管理提出了更高要求。铁路行业地理信息主要通过传统CAD格式的数字地形图表达,重在可视化制图表达,缺乏各类扩展属性,难以满足协同设计、智能设计需求。结合铁路工程设计、施工、运维对地理实体数据库建设的需求,提出兼容国家标准的铁路工程地理实体分类与编码方法,研究地理实体的数据内容,提出数据生产方案、数据库结构及存储方案,并在长沙至赣州高铁项目中进行生产试验。试验效果表明,本文提出的一套铁路工程地理实体建库技术方案具有较高的可实施性。另外,地理实体较传统数字地形图生产成本更高,但其优势在于可以提供更丰富的扩展属性,支持各设计专业开展协同设计、智能设计等拓展应用。铁路工程地理实体数据库建设在分类及编码、数据生产方案、数据管理等方面还处在探索阶段,需要在研究、应用过程中不断完善。 展开更多
关键词 铁路工程 地理实体 数据库 分类与编码 生产方案
在线阅读 下载PDF
基于大语言模型的漏洞文本分类方法
10
作者 孟楠 汤旭 周娟 《计算机工程与设计》 北大核心 2025年第9期2548-2553,共6页
近年来,大语言模型在多种下游任务上表现出了较强的理解和生成能力,但如何有效利用大语言模型来理解和分析漏洞仍是一个挑战。为此,提出了一种融合关键信息的上下文学习方法(key information in-context learning,KIICL)进行漏洞类型分... 近年来,大语言模型在多种下游任务上表现出了较强的理解和生成能力,但如何有效利用大语言模型来理解和分析漏洞仍是一个挑战。为此,提出了一种融合关键信息的上下文学习方法(key information in-context learning,KIICL)进行漏洞类型分类。通过提供上下文示例和漏洞关键信息突出漏洞描述中的细节,以强化大语言模型对漏洞描述的理解,进而提高分类能力。为获得关键信息,文章采用了基于条件随机场(CRF)的关键信息识别方法。实验结果表明,KIICL方法在大语言模型上比无示例样本方法提升了6.6%,比不包含关键信息的少量示例方法提升了2.2%,验证了KIICL方法的有效性。 展开更多
关键词 漏洞分类 关键信息抽取 上下文学习 大语言模型 条件随机场 命名实体识别 提示工程
在线阅读 下载PDF
基于深度学习的文本敏感信息识别综述
11
作者 朱雨龙 徐建光 舒历晨 《工业信息安全》 2025年第4期6-14,共9页
文本敏感信息识别是保障数据安全的关键技术,其研究具有重要现实意义。近年来,基于深度学习的方法得到了广泛关注,但现有研究大多只关注特定算法或场景,缺乏对该领域的归纳总结。文章通过调研相关文献,对基于深度学习的文本敏感信息识... 文本敏感信息识别是保障数据安全的关键技术,其研究具有重要现实意义。近年来,基于深度学习的方法得到了广泛关注,但现有研究大多只关注特定算法或场景,缺乏对该领域的归纳总结。文章通过调研相关文献,对基于深度学习的文本敏感信息识别技术进行体系化综述。首先梳理了基于敏感文本分类和基于敏感实体识别两类方法的技术演进,同时介绍了现有研究中常用的4个基准数据集的特性和适用场景;之后探讨了当前该领域研究面临的风险,并针对这些挑战分析了未来的发展趋势。文章通过构建“技术—挑战—趋势”的三维分析体系,为文本敏感信息识别技术的理论深化与应用创新提供系统性参考,助力信息安全治理能力提升。 展开更多
关键词 敏感信息识别 文本分类 命名实体识别 数据安全
在线阅读 下载PDF
“分类—协作”:农村人居环境整体性治理的实践逻辑
12
作者 黄佳鹏 《山东科技大学学报(社会科学版)》 2025年第2期99-106,共8页
对关中G镇农村人居环境整体性治理实践的分析发现,该模式通过治理事务分类与治理主体协作,对人居环境治理中的行政性、市场化与自治性事务进行了有效划分,以清晰界定公私边界、促进市场与社会责任共担,以及依托“行政规制—市场激励—... 对关中G镇农村人居环境整体性治理实践的分析发现,该模式通过治理事务分类与治理主体协作,对人居环境治理中的行政性、市场化与自治性事务进行了有效划分,以清晰界定公私边界、促进市场与社会责任共担,以及依托“行政规制—市场激励—社会动员”的协同耦合机制等方式,实现了治理过程中行政部门、市场主体与村级组织等多主体协作。在“分类—协作”框架下,农村人居环境治理不再是单一的自上而下的行政任务,亦非仅属于市场主体的业务,而是村级组织与村民的内生事务,即走向整体性治理。这不仅实现了农村人居环境治理过程中的空间再造、效率与效益兼具、资源撬动,以及“成本—收益”最优化,还通过体系再造与主体重塑,推动农民生活现代化转型与乡村善治。未来可持续强化村级组织及村干部在人居环境治理中的主导作用,给予他们更大的治理空间;同时提升多元资源整合能力,实现村内正式与非正式组织力量的有效融合,激发多主体有效协作。 展开更多
关键词 农村人居环境 事务分类 主体协作 村社本位 整体性治理
在线阅读 下载PDF
基于BERT的混合电力信息报文自动提取技术
13
作者 贺云隆 杨东华 +3 位作者 宋晓林 张闯 李佳燚 刘鑫宇 《无线电工程》 2025年第5期1105-1114,共10页
针对智能化电力系统运行维护过程中产生的大量电力信息报文缺乏有效提取技术的实际情况,提出了一种基于双向编码器表示的Transformer模型(Bidirectional Encoder Representations from Transformers, BERT)的混合电力信息报文自动提取技... 针对智能化电力系统运行维护过程中产生的大量电力信息报文缺乏有效提取技术的实际情况,提出了一种基于双向编码器表示的Transformer模型(Bidirectional Encoder Representations from Transformers, BERT)的混合电力信息报文自动提取技术,旨在提高电力系统中非结构化故障文本数据的分析效率。构建了一个包含BERT-SENet网络用于文本分类,以及BERT-Bi-LSTM-CRF网络用于命名实体识别的自动提取模型。通过整合文本分类和命名实体识别任务,模型能够有效地对电力故障文本进行自动分类和关键信息提取。实验结果表明,模型在文本分类和命名实体识别任务上均优于传统方法,为电力系统的信息化和智能化提供了有效支持。提升了电力系统故障处理的效率,为类似领域的文本数据自动分析提供了新的思路和方法。 展开更多
关键词 智慧电网 电力故障文本 自然语言处理 文本分类 命名实体识别 双向编码器表示的Transformer模型
在线阅读 下载PDF
利用自然语言处理技术提升医院档案信息提取的效率
14
作者 傅天一 《计算机应用文摘》 2025年第9期94-96,共3页
传统的档案信息提取方法主要依赖人工操作,这不仅耗时费力,还易出现错误,影响数据的准确性和可靠性。随着自然语言处理(Natural Language Processing,NLP)技术的迅速发展,医院档案信息提取的效率得到了显著提升。文章探讨了如何应用NLP... 传统的档案信息提取方法主要依赖人工操作,这不仅耗时费力,还易出现错误,影响数据的准确性和可靠性。随着自然语言处理(Natural Language Processing,NLP)技术的迅速发展,医院档案信息提取的效率得到了显著提升。文章探讨了如何应用NLP技术来提高医院档案信息提取的效率,重点介绍了文本分类、命名实体识别和关系抽取等关键技术。其中,文本分类可以自动对档案进行分类,有效组织信息;命名实体识别用于识别和提取关键信息,如患者姓名、疾病名称和药物等;关系抽取则可以揭示不同信息间的关系,帮助建立完整的信息网络。 展开更多
关键词 自然语言处理 档案信息提取 文本分类 命名实体识别 关系抽取 医疗信息处理
在线阅读 下载PDF
基于全面质量管理视角的县域医共体医学检验中心模式研究
15
作者 黄二丹 朱亮 +8 位作者 王书平 杜江 宋超 吕坚 莫红梅 安勇 谢席平 焦梦涵 府伟灵 《现代医院》 2025年第9期1313-1316,共4页
目的 探讨现有县域医共体下医学检验中心的不同建设模式及其经验,并分析和讨论不同建设模式的特点,为县域检验中心建设提供参考。方法 按照全面质量管理理论中的“人、机、料、法、环”五大因素设计县域医学检验中心访谈提纲和调查问卷... 目的 探讨现有县域医共体下医学检验中心的不同建设模式及其经验,并分析和讨论不同建设模式的特点,为县域检验中心建设提供参考。方法 按照全面质量管理理论中的“人、机、料、法、环”五大因素设计县域医学检验中心访谈提纲和调查问卷,调研全国11家县域检验中心,分析不同县域检验中心建设模式、投入收益等。并通过文献研究和案例研究梳理县域医学检验中心建设模式及特征。结果 县域医学检验中心建设模式主要分为5种,不同模式有不同特征,通过县域医共体下检验中心建设模式投入收益分析,县域医学检验中心与乡镇卫生院分配转送样本的利润比例趋近于5∶5更有利于维持县域医学检验中心样本来源的稳定。县域医学检验中心建设模式与县域医疗服务能力和乡镇医疗服务能力密切相关。结论 县医院能力较强的县域倾向于以县医院检验科为平台建设相对独立的区域检验中心;不同模式县域检验中心都应该以优质检验服务覆盖全县为基本目标;县域检验中心成功的关键在于调动基层人员积极性。 展开更多
关键词 县域医学检验中心 全面质量管理 紧密型医共体 建设模式分类
暂未订购
Named Entity Recognition for Nepali Text Using Support Vector Machines 被引量:3
16
作者 Surya Bahadur Bam Tej Bahadur Shahi 《Intelligent Information Management》 2014年第2期21-29,共9页
Named Entity Recognition aims to identify and to classify rigid designators in text such as proper names, biological species, and temporal expressions into some predefined categories. There has been growing interest i... Named Entity Recognition aims to identify and to classify rigid designators in text such as proper names, biological species, and temporal expressions into some predefined categories. There has been growing interest in this field of research since the early 1990s. Named Entity Recognition has a vital role in different fields of natural language processing such as Machine Translation, Information Extraction, Question Answering System and various other fields. In this paper, Named Entity Recognition for Nepali text, based on the Support Vector Machine (SVM) is presented which is one of machine learning approaches for the classification task. A set of features are extracted from training data set. Accuracy and efficiency of SVM classifier are analyzed in three different sizes of training data set. Recognition systems are tested with ten datasets for Nepali text. The strength of this work is the efficient feature extraction and the comprehensive recognition techniques. The Support Vector Machine based Named Entity Recognition is limited to use a certain set of features and it uses a small dictionary which affects its performance. The learning performance of recognition system is observed. It is found that system can learn well from the small set of training data and increase the rate of learning on the increment of training size. 展开更多
关键词 Support VECTOR MACHINE Named entity Recognition MACHINE Learning classification Nepali LANGUAGE TEXT
在线阅读 下载PDF
室内实景三维重建技术综述 被引量:7
17
作者 康志忠 杨俊涛 《时空信息学报》 2024年第1期1-10,共10页
构建语义丰富、几何精确且拓扑完备的室内三维模型是实景三维中国建设中一项富有挑战性的任务,在室内导航与位置服务、虚拟现实、智能家居等领域都有重要的应用价值。室内空间结构布局复杂、实体要素类型多样及杂乱遮挡等因素给室内实... 构建语义丰富、几何精确且拓扑完备的室内三维模型是实景三维中国建设中一项富有挑战性的任务,在室内导航与位置服务、虚拟现实、智能家居等领域都有重要的应用价值。室内空间结构布局复杂、实体要素类型多样及杂乱遮挡等因素给室内实景三维重建带来诸多挑战。近些年,室内实景三维重建受到广泛关注,然而关于现有方法的系统性总结仍较为欠缺。本文对室内实景三维重建最新技术的研究进展进行整理和归纳。首先,简要总结当前主流的室内空间三维数据采集手段;其次,从室内实景三维模型构建过程中涉及的关键环节出发,从实体要素语义识别和分类、实体要素几何模型生成、空间拓扑特征组织与表达方面对现有方法及其优缺点进行综述;最后,对室内实景三维重建相关研究现存的技术挑战进行分析总结,并对未来研究趋势进行展望。 展开更多
关键词 室内实景三维 数据配准 实体要素分类 空间拓扑模型 实体要素几何模型
在线阅读 下载PDF
融合知识图谱的影视视频标签分类算法研究
18
作者 蒋洪迅 张琳 孙彩虹 《计算机科学与探索》 CSCD 北大核心 2024年第1期161-174,共14页
鉴于视频感知方式的多样性,视频标签层级分类算法均从视觉和文本模态入手,训练联合模型共同推断视频内容。但现有研究通常只适用于粗粒度的分类,针对影视剧名的分类,则需要更加细粒度的识别。提出了一个融合知识图谱的影视视频标签分类... 鉴于视频感知方式的多样性,视频标签层级分类算法均从视觉和文本模态入手,训练联合模型共同推断视频内容。但现有研究通常只适用于粗粒度的分类,针对影视剧名的分类,则需要更加细粒度的识别。提出了一个融合知识图谱的影视视频标签分类算法。首先,使用了基于大规模通用数据训练的多模态预训练模型提取了视觉和文本的特征,训练了一个多任务的视频标签预测模型,得到视频的类型、题材和实体三级标签;通过在多任务学习网络中引入相似性任务提高分类模型训练的难度,使得同类样本特征更加紧密,且更好地表达样本差异。其次,对于最细粒度的实体标签,提出了一个局部注意力头扩展的实体纠错模型,引入外部知识图谱的共现信息对前置模型的预测结果做修正,得到更准确的实体标签预测结果。采集豆瓣的半结构化数据构建了影视知识图谱并对影视视频标签分类模型进行了实证研究。视频标签分类的实验结果表明,首先,基于多任务网络结构,在训练分类任务时加入交叉熵损失函数和相似性损失函数对模型进行共同约束优化了特征表达,在类型、题材、实体标签的Top-1分类准确率上分别提升了3.70%、3.35%和16.57%;其次,针对前置模型的困难样本提出的全局-局部注意力机制模型,在引入了知识图谱信息之后,实体标签的Top-1分类准确率从38.7%提升到45.6%。该研究是使用图片-文本对数据在多模态视频标签分类问题上新的尝试,为少量数据样本情况下的短视频标签分类提供了新的研究思路。 展开更多
关键词 知识图谱 视频标签分类 多模态内容理解 实体纠错
在线阅读 下载PDF
融合时序分类的科技领域实体增长预测研究
19
作者 陈果 陈智力 陈霜澜 《情报理论与实践》 CSSCI 北大核心 2024年第2期116-123,共8页
[目的/意义]科技领域实体增长机制是进行预测型科技情报分析的核心,要有效地进行科技发展态势感知和预测,必须深入了解科技领域细粒度知识增长机制。文章提出并验证了融合时序分类的科技领域实体增长预测方案。[方法/过程]首先,根据实... [目的/意义]科技领域实体增长机制是进行预测型科技情报分析的核心,要有效地进行科技发展态势感知和预测,必须深入了解科技领域细粒度知识增长机制。文章提出并验证了融合时序分类的科技领域实体增长预测方案。[方法/过程]首先,根据实体词频时间序列的增长模式,将实体分为可拟合、有趋势和无规律3种类别;其次,利用曲线拟合、局部加权回归方法抽取特征,构建特征向量,再用MLP模型实现了高精度的实体分类;最后,构建融合时序分类的集成模型与基线模型进行对比验证效果。[结果/结论]根据实验结果,验证显示集成预测模型相对于基线模型,误差减少了13%以上,进一步证实了预测结果在科学性和准确性方面的优势。综合考虑,所提出的融合时间序列分类的实体增长预测方案在可行性和应用价值方面具备潜力。 展开更多
关键词 时间序列分类 领域实体 实体增长预测 集成模型
原文传递
基于跨度和边界探测的实体关系联合抽取模型
20
作者 廖涛 许锦涛 《湖北民族大学学报(自然科学版)》 CAS 2024年第2期178-184,共7页
针对大多数跨度模型将文本分割成跨度序列时,产生大量非实体跨度,导致了数据不平衡和计算复杂度高等问题,提出了基于跨度和边界探测的实体关系联合抽取模型(joint extraction model for entity relationships based on span and boundar... 针对大多数跨度模型将文本分割成跨度序列时,产生大量非实体跨度,导致了数据不平衡和计算复杂度高等问题,提出了基于跨度和边界探测的实体关系联合抽取模型(joint extraction model for entity relationships based on span and boundary detection,SBDM)。SBDM首先使用训练Transformer的双向编码器表征量(bidirectional encoder representations from Transformer,BERT)模型将文本转化为词向量,并融合了通过图卷积获取的句法依赖信息以形成文本的特征表示;接着通过局部信息和句子上下文信息去探测实体边界并进行标记,以减少非实体跨度;然后将实体边界标记形成的跨度序列进行实体识别;最后将局部上下文信息融合到1个跨度实体对中并使用sigmoid函数进行关系分类。实验表明,SBDM在SciERC(multi-task identification of entities,relations,and coreference for scientific knowledge graph construction)数据集、CoNLL04(the 2004 conference on natural language learning)数据集上的关系分类指标S F1分别达到52.86%、74.47%,取得了较好效果。SBDM用于关系分类任务中,能促进跨度分类方法在关系抽取上的研究。 展开更多
关键词 实体关系 联合抽取 句法依赖 跨度 实体边界 图卷积 关系分类
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部