为提升民航应急管理能力,研究基于《中国民用航空应急管理规定》问卷数据,运用轻量级双向编码器表征模型(A Lite Bidirectional Encoder Representations from Transformers,ALBERT)和潜在狄利克雷分配模型(Latent Dirichlet Allocation...为提升民航应急管理能力,研究基于《中国民用航空应急管理规定》问卷数据,运用轻量级双向编码器表征模型(A Lite Bidirectional Encoder Representations from Transformers,ALBERT)和潜在狄利克雷分配模型(Latent Dirichlet Allocation,LDA)进行文档类别划分,结合K-means和均匀流形逼近与投影方法(Uniform Manifold Approximation and Projection,UMAP)进行文档聚类及可视化,根据复杂网络理论构建关键词共现网络,分析网络特性和节点联系,应用逼近理想解排序法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)获得节点重要性排序。研究结果显示:网络的平均聚类系数为0.71~0.965,覆盖了不同部门、岗位和环境,代表了民航应急管理的普遍情况;在人员兼职、空管单位、支线机场等应急体系建设存在不足的情况下,建议民航系统通过增设专职应急管理机构、优化资源配置、加强培训支持等方式提升应急管理能力。研究结果可为民航应急体系建设提供数据支持。展开更多
中文电子病历命名实体识别主要是研究电子病历病程记录文书数据集,文章提出对医疗手术麻醉文书数据集进行命名实体识别的研究。利用轻量级来自Transformer的双向编码器表示(A Lite Bidirectional Encoder Representation from Transform...中文电子病历命名实体识别主要是研究电子病历病程记录文书数据集,文章提出对医疗手术麻醉文书数据集进行命名实体识别的研究。利用轻量级来自Transformer的双向编码器表示(A Lite Bidirectional Encoder Representation from Transformers,ALBERT)预训练模型微调数据集和Tranfomers中的trainer训练器训练模型的方法,实现在医疗手术麻醉文书上识别手术麻醉事件命名实体与获取复杂麻醉医疗质量控制指标值。文章为医疗手术麻醉文书命名实体识别提供了可借鉴的思路,并且为计算复杂麻醉医疗质量控制指标值提供了一种新的解决方案。展开更多
工程规范是工程建设过程中常用的重要标准文件之一。面对这些非结构化工程规范文本,高效、准确地从中抽取相关知识,并将这些知识以可视化形式呈现,对于提高知识的利用效率、提升管理人员对工程规范文本的理解效率有着重要的作用。针对...工程规范是工程建设过程中常用的重要标准文件之一。面对这些非结构化工程规范文本,高效、准确地从中抽取相关知识,并将这些知识以可视化形式呈现,对于提高知识的利用效率、提升管理人员对工程规范文本的理解效率有着重要的作用。针对典型的工程规范文本,提出一种基于深度学习的工程规范知识抽取方法,融合ALBERT(A Lite Bidirectional Encoder Representation from Transformers)、BiLSTM(Bi-directional Long Shot-Term Memory)和CRF(Conditional Random Fields),建立工程规范实体识别模型,增强文本语义特征,获得工程规范中的实体;融合Attention机制和BiLSTM提取工程规范中的关系,根据所提取出的知识构建工程规范知识图谱。以《给水排水管道工程施工及验收规范》为典型实例对该方法进行了验证,结果表明,工程规范实体识别的F1值为78.18%,优于传统模型;关系抽取的F1值为98.35%。利用所抽取知识建立了工程规范知识图谱,通过基于知识图谱的全局信息展示、特定信息检索,提升工程规范的利用效率,辅助工程现场施工。展开更多
研究自然语言处理(natural language processing,NLP)技术和机器人流程自动化(robot process automation,RPA)技术在业务自动化领域的应用特点,将RPA技术和人工智能(artificial intelligence,AI)技术相结合来优化多种业务场景,包括智能...研究自然语言处理(natural language processing,NLP)技术和机器人流程自动化(robot process automation,RPA)技术在业务自动化领域的应用特点,将RPA技术和人工智能(artificial intelligence,AI)技术相结合来优化多种业务场景,包括智能业务查询、业务填充、语义理解等自动化业务操作以求提升效率。然后提出智能业务自动化系统的业务框架、全词覆盖方法和ALBERT模型等技术在业务自动化领域的应用,通过相关实验测试所提方法的效果,验证了结合文本分类的业务自动化设计与应用在企业数字化转型中是一种可行的方案。展开更多
文摘为提升民航应急管理能力,研究基于《中国民用航空应急管理规定》问卷数据,运用轻量级双向编码器表征模型(A Lite Bidirectional Encoder Representations from Transformers,ALBERT)和潜在狄利克雷分配模型(Latent Dirichlet Allocation,LDA)进行文档类别划分,结合K-means和均匀流形逼近与投影方法(Uniform Manifold Approximation and Projection,UMAP)进行文档聚类及可视化,根据复杂网络理论构建关键词共现网络,分析网络特性和节点联系,应用逼近理想解排序法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)获得节点重要性排序。研究结果显示:网络的平均聚类系数为0.71~0.965,覆盖了不同部门、岗位和环境,代表了民航应急管理的普遍情况;在人员兼职、空管单位、支线机场等应急体系建设存在不足的情况下,建议民航系统通过增设专职应急管理机构、优化资源配置、加强培训支持等方式提升应急管理能力。研究结果可为民航应急体系建设提供数据支持。
文摘中文电子病历命名实体识别主要是研究电子病历病程记录文书数据集,文章提出对医疗手术麻醉文书数据集进行命名实体识别的研究。利用轻量级来自Transformer的双向编码器表示(A Lite Bidirectional Encoder Representation from Transformers,ALBERT)预训练模型微调数据集和Tranfomers中的trainer训练器训练模型的方法,实现在医疗手术麻醉文书上识别手术麻醉事件命名实体与获取复杂麻醉医疗质量控制指标值。文章为医疗手术麻醉文书命名实体识别提供了可借鉴的思路,并且为计算复杂麻醉医疗质量控制指标值提供了一种新的解决方案。
文摘工程规范是工程建设过程中常用的重要标准文件之一。面对这些非结构化工程规范文本,高效、准确地从中抽取相关知识,并将这些知识以可视化形式呈现,对于提高知识的利用效率、提升管理人员对工程规范文本的理解效率有着重要的作用。针对典型的工程规范文本,提出一种基于深度学习的工程规范知识抽取方法,融合ALBERT(A Lite Bidirectional Encoder Representation from Transformers)、BiLSTM(Bi-directional Long Shot-Term Memory)和CRF(Conditional Random Fields),建立工程规范实体识别模型,增强文本语义特征,获得工程规范中的实体;融合Attention机制和BiLSTM提取工程规范中的关系,根据所提取出的知识构建工程规范知识图谱。以《给水排水管道工程施工及验收规范》为典型实例对该方法进行了验证,结果表明,工程规范实体识别的F1值为78.18%,优于传统模型;关系抽取的F1值为98.35%。利用所抽取知识建立了工程规范知识图谱,通过基于知识图谱的全局信息展示、特定信息检索,提升工程规范的利用效率,辅助工程现场施工。
文摘研究自然语言处理(natural language processing,NLP)技术和机器人流程自动化(robot process automation,RPA)技术在业务自动化领域的应用特点,将RPA技术和人工智能(artificial intelligence,AI)技术相结合来优化多种业务场景,包括智能业务查询、业务填充、语义理解等自动化业务操作以求提升效率。然后提出智能业务自动化系统的业务框架、全词覆盖方法和ALBERT模型等技术在业务自动化领域的应用,通过相关实验测试所提方法的效果,验证了结合文本分类的业务自动化设计与应用在企业数字化转型中是一种可行的方案。