期刊文献+
共找到97篇文章
< 1 2 5 >
每页显示 20 50 100
Dart Games Optimizer with Deep Learning-Based Computational Linguistics Named Entity Recognition
1
作者 Mesfer Al Duhayyim Hala J.Alshahrani +5 位作者 Khaled Tarmissi Heyam H.Al-Baity Abdullah Mohamed Ishfaq Yaseen Amgad Atta Abdelmageed Mohamed IEldesouki 《Intelligent Automation & Soft Computing》 SCIE 2023年第9期2549-2566,共18页
Computational linguistics is an engineering-based scientific discipline.It deals with understanding written and spoken language from a computational viewpoint.Further,the domain also helps construct the artefacts that... Computational linguistics is an engineering-based scientific discipline.It deals with understanding written and spoken language from a computational viewpoint.Further,the domain also helps construct the artefacts that are useful in processing and producing a language either in bulk or in a dialogue setting.Named Entity Recognition(NER)is a fundamental task in the data extraction process.It concentrates on identifying and labelling the atomic components from several texts grouped under different entities,such as organizations,people,places,and times.Further,the NER mechanism identifies and removes more types of entities as per the requirements.The significance of the NER mechanism has been well-established in Natural Language Processing(NLP)tasks,and various research investigations have been conducted to develop novel NER methods.The conventional ways of managing the tasks range from rule-related and hand-crafted feature-related Machine Learning(ML)techniques to Deep Learning(DL)techniques.In this aspect,the current study introduces a novel Dart Games Optimizer with Hybrid Deep Learning-Driven Computational Linguistics(DGOHDL-CL)model for NER.The presented DGOHDL-CL technique aims to determine and label the atomic components from several texts as a collection of the named entities.In the presented DGOHDL-CL technique,the word embed-ding process is executed at the initial stage with the help of the word2vec model.For the NER mechanism,the Convolutional Gated Recurrent Unit(CGRU)model is employed in this work.At last,the DGO technique is used as a hyperparameter tuning strategy for the CGRU algorithm to boost the NER’s outcomes.No earlier studies integrated the DGO mechanism with the CGRU model for NER.To exhibit the superiority of the proposed DGOHDL-CL technique,a widespread simulation analysis was executed on two datasets,CoNLL-2003 and OntoNotes 5.0.The experimental outcomes establish the promising performance of the DGOHDL-CL technique over other models. 展开更多
关键词 named entity recognition deep learning natural language processing computational linguistics dart games optimizer
在线阅读 下载PDF
一种基于部署价值的命名网内计算接入转发机制
2
作者 饶威勇 朱轶 《南京邮电大学学报(自然科学版)》 北大核心 2025年第2期103-112,共10页
现有的命名网内计算调用过程,针对数据不在用户侧的计算场景,默认采用数据优先调用规则向数据源转发,进而在回传路径上加载计算服务,而当回传路径计算资源有限时,网内节点会出现频繁置换计算服务而降低了计算资源利用率。针对这一问题,... 现有的命名网内计算调用过程,针对数据不在用户侧的计算场景,默认采用数据优先调用规则向数据源转发,进而在回传路径上加载计算服务,而当回传路径计算资源有限时,网内节点会出现频繁置换计算服务而降低了计算资源利用率。针对这一问题,提出一种基于部署价值的命名网内计算接入转发机制。该机制部署于接入路由器处,一方面通过命名架构下的兴趣包-数据包交互机制获取网内节点的资源信息;另一方面提出服务部署价值的概念,用以表征网内节点消耗CPU资源部署服务所能获得的流量处理能力,进而在接入路由器处动态决策实施数据优先转发或计算优先转发。仿真结果表明,与单一的数据优先调用机制相比,所提出机制能够显著降低计算服务在网内节点的置换次数,在有效提升网内节点资源利用率的同时,降低用户服务请求时延,提高用户的服务调用体验。 展开更多
关键词 命名网内计算 部署价值 服务置换 计算优先转发 数据优先转发
在线阅读 下载PDF
面向空间科学领域的命名实体识别技术发展与应用展望
3
作者 杨鑑 高凯 +1 位作者 孙逸峰 杜栩辰 《空间科学与试验学报》 2025年第2期62-72,共11页
命名实体识别作为自然语言处理领域的核心任务之一,其目标是从文本中自动提取具有特定意义的实体。在空间科学领域,命名实体识别技术为海量空间探测数据解析、航天任务报告分析及天体物理文献挖掘等关键任务提供了基础支撑。重点关注命... 命名实体识别作为自然语言处理领域的核心任务之一,其目标是从文本中自动提取具有特定意义的实体。在空间科学领域,命名实体识别技术为海量空间探测数据解析、航天任务报告分析及天体物理文献挖掘等关键任务提供了基础支撑。重点关注命名实体识别在卫星载荷参数提取、深空探测目标识别及空间环境监测报告分析等场景中的技术适配与优化需求。综述了命名实体识别技术的发展历史,分析了从早期的基于规则和机器学习方法到当前深度学习驱动的模型的演变过程。重点讨论了深度学习模型在空间科学文本处理中的特殊应用,包括探测器日志中的复合实体识别、多模态空间数据融合等关键技术。同时,指出了命名实体识别技术在空间科学领域面临的主要挑战,包括处理多语言任务报告、空间专业术语消歧,以及星载设备的实时处理需求等。最后,提出了面向空间科学研究的命名实体识别技术发展路径,为后续空间站科学实验数据管理、行星探测目标识别等重大需求提供技术支撑。 展开更多
关键词 命名实体识别 空间科学 深空探测 多模态学习 星载计算
在线阅读 下载PDF
CDN域名识别与防御技术的综述
4
作者 魏嘉男 蒋星宇 +2 位作者 吴涵 张文博 杨慧 《通信技术》 2025年第5期457-462,共6页
内容分发网络(Content Delivery Network,CDN)在互联网基础架构的使用频率与日俱增,其安全性正逐渐成为网络防护领域的关键。研究CDN域名识别与防御技术,可以帮助安全研究人员和网络防护人员了解CDN基础设施的运行机制,识别潜在的安全... 内容分发网络(Content Delivery Network,CDN)在互联网基础架构的使用频率与日俱增,其安全性正逐渐成为网络防护领域的关键。研究CDN域名识别与防御技术,可以帮助安全研究人员和网络防护人员了解CDN基础设施的运行机制,识别潜在的安全威胁。首先,梳理了当前典型的CDN域名识别技术,深入探讨了不同方式识别CDN域名的实现过程,并列举了主流CDN域名识别工具进行参考。其次,探讨了CDN防御技术,从而帮助网络安全人员在开发与使用CDN过程中提升CDN的安全性与抵御恶意行为的能力。最后,对CDN技术的未来发展方向进行了阐述,并介绍了云边缘CDN的情况及面临的挑战。 展开更多
关键词 CDN 域名解析 内容分发 云边缘计算
在线阅读 下载PDF
基于VB 6.0的岩石薄片鉴定辅助系统设计与应用
5
作者 刘明伟 甄淼 +3 位作者 张铁安 刘宇崴 高洪岩 赵雨生 《实验科学与技术》 2025年第4期54-59,共6页
岩石薄片鉴定被应用于地质学领域,具有鉴定手段简便、经济、快捷等优点,但在实际工作中,传统的岩石定名和斜长石、角闪石、辉石进一步划分等,还是通过人工计算、投图方法确定,计算繁琐、效率低。岩石薄片鉴定辅助系统将传统的定名、投... 岩石薄片鉴定被应用于地质学领域,具有鉴定手段简便、经济、快捷等优点,但在实际工作中,传统的岩石定名和斜长石、角闪石、辉石进一步划分等,还是通过人工计算、投图方法确定,计算繁琐、效率低。岩石薄片鉴定辅助系统将传统的定名、投图方法与计算机相结合,根据相关教材、论文中提出的测量与鉴定方法,利用VB 6.0编程语言实现人机交互式操作,具有操作简捷、显示直观的特点,提高了工作效率与鉴定精度,对岩石薄片鉴定工作具有重要的实用意义。 展开更多
关键词 岩石薄片鉴定 岩石定名 投图求解 人机交互 操作简捷
在线阅读 下载PDF
面向边缘计算资源分配的防假名拍卖机制
6
作者 张震东 付晓东 +1 位作者 刘骊 彭玮 《小型微型计算机系统》 CSCD 北大核心 2024年第5期1046-1053,共8页
边缘计算激励机制可以激励用户参与到资源分配的过程中来.为防范不诚实用户对资源分配的操纵,现有激励机制致力于使参与者在投标时给出他们的真实估值,但未考虑对假名攻击的对抗策略.为解决现有机制缺乏对抗假名攻击的能力这一问题,首先... 边缘计算激励机制可以激励用户参与到资源分配的过程中来.为防范不诚实用户对资源分配的操纵,现有激励机制致力于使参与者在投标时给出他们的真实估值,但未考虑对假名攻击的对抗策略.为解决现有机制缺乏对抗假名攻击的能力这一问题,首先,对假名攻击投标决策手段进行分析,设计了假名过滤算法和结合边缘服务器成本的最小临界值定价算法,假名过滤算法剔除可能的假名用户,定价算法则保证了假名用户无法通过操纵临界价格提高效用.然后,证明了该防假名拍卖机制满足真实性和个体理性,此外还证明了该机制对假名攻击具有抗操纵性.实验结果表明,该机制能够在满足真实性的同时,保证用户无法通过单方面发起假名攻击增加效用. 展开更多
关键词 边缘计算 资源分配 组合拍卖 防假名拍卖
在线阅读 下载PDF
基于本地收益最大化的命名网内计算部署机制
7
作者 田建业 朱轶 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第4期756-764,共9页
命名网内计算(named in-network computing,NINC)是一种基于命名数据网络架构、在网络设备处提供泛在计算服务的新兴计算方案。如何有效在单个路由器上部署多个NINC服务,仍有待探索。针对这一问题,提出了本地部署收益与本地服务收益的概... 命名网内计算(named in-network computing,NINC)是一种基于命名数据网络架构、在网络设备处提供泛在计算服务的新兴计算方案。如何有效在单个路由器上部署多个NINC服务,仍有待探索。针对这一问题,提出了本地部署收益与本地服务收益的概念,前者表征NINC服务本地部署后降低转发流量所获得的CPU资源节约量,后者表征所部署的NINC服务每消耗单位CPU资源所获得的流量处理能力。在此基础上,设计了一种基于本地收益最大化的NINC部署机制。该机制中,路由器周期性预评估拟部署NINC服务的本地部署收益与本地服务收益,进而将部署问题转化为一个背包问题,求解出优化的NINC服务部署方案。仿真结果表明,相较于基于流行度的机制,该机制能够有效提高网内计算流量处理能力,在网内计算服务所需数据量均匀分布的一般性场景下,单个路由器可获得约20%~27%的处理能力提升。 展开更多
关键词 命名数据网络 网内计算 软件路由器 优化部署 收益最大化
在线阅读 下载PDF
论我国刑法中的计算机犯罪 被引量:14
8
作者 赵廷光 皮勇 《现代法学》 CSSCI 北大核心 1999年第4期101-103,共3页
本文首先阐明计算机犯罪的概念和基本特点,提出狭义和广义计算机犯罪的定义。依据犯罪构成理论分析我国刑法中的非法侵入计算机信息系统罪和破坏计算机信息系统罪,以及认定这两种犯罪应当注意的若干问题。并根据其他计算机犯罪的基本... 本文首先阐明计算机犯罪的概念和基本特点,提出狭义和广义计算机犯罪的定义。依据犯罪构成理论分析我国刑法中的非法侵入计算机信息系统罪和破坏计算机信息系统罪,以及认定这两种犯罪应当注意的若干问题。并根据其他计算机犯罪的基本特征,归纳出其可能触犯刑法中的若干罪名。 展开更多
关键词 计算机犯罪 犯罪构成 罪名
在线阅读 下载PDF
基于层叠条件随机场的旅游领域命名实体识别 被引量:37
9
作者 郭剑毅 薛征山 +3 位作者 余正涛 张志坤 张宜浩 姚贤明 《中文信息学报》 CSCD 北大核心 2009年第5期47-52,共6页
针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到... 针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到高层模型,以词为切分粒度,结合复杂特征,实现嵌套景点、特产风味、地点的识别。最后进行了两组相关实验,结果表明,在开放测试中,层叠条件随机场模型相比于单层模型,F值提高了8个百分点;相比于HMM模型,正确率提高了8个百分点,召回率提高了22个百分点,F值提高了15个百分点。 展开更多
关键词 计算机应用 中文信息处理 旅游领域 命名实体识别 层叠条件随机场 特征模板
在线阅读 下载PDF
基于用户查询日志的命名实体挖掘 被引量:8
10
作者 翟海军 郭嘉丰 +1 位作者 王小磊 许洪波 《中文信息学报》 CSCD 北大核心 2010年第1期71-76,116,共7页
针对大规模查询日志中丰富的命名实体的挖掘是数据挖掘领域中的重要研究课题。已有的研究工作提出了一种基于种子实体的抽取框架,利用实体间的分布相似度进行挖掘。然而该工作只有当种子实体仅属于单个语义类别时才能取得好的结果,实际... 针对大规模查询日志中丰富的命名实体的挖掘是数据挖掘领域中的重要研究课题。已有的研究工作提出了一种基于种子实体的抽取框架,利用实体间的分布相似度进行挖掘。然而该工作只有当种子实体仅属于单个语义类别时才能取得好的结果,实际上命名实体往往可能从属于多个类别。该文通过引入一个弱指导话题模型,利用少量的人工指导信息,很好地解决了实体的类别模糊性,提高了挖掘的有效性。实验表明该文提出的方法在实体挖掘性能上显著优于已有的方法。 展开更多
关键词 计算机应用 中文信息处理 分开命名实体 用户查询日志 话题模型
在线阅读 下载PDF
汉字识别的计算机模拟 被引量:7
11
作者 彭聃龄 刘颖 陈鹰 《应用心理学》 CSSCI 1996年第1期9-16,共8页
本文总结了作者近年来在连结主义的理论框架下 ,用计算机模拟汉字识别的工作。文章分三部分。第一部分说明了计算机模拟与人工智能的关系。第二部分介绍了作者提出的两个模型 :汉字识别与命名的连结主义模型和基于语义的词汇判断的计算... 本文总结了作者近年来在连结主义的理论框架下 ,用计算机模拟汉字识别的工作。文章分三部分。第一部分说明了计算机模拟与人工智能的关系。第二部分介绍了作者提出的两个模型 :汉字识别与命名的连结主义模型和基于语义的词汇判断的计算模型。两个模型分别成功地模拟了汉字识别中的频率效应、形声字读音中的规则效应、声旁效应、语义启动效应、语境与频率的交互作用等。第三部分讨论了模拟工作的意义、分布表征、学习算法等问题。研究表明 :认知的计算机模拟能验证人类认知实验的结果 ,对结果提出合理的解释 ,并能指导进一步的实验研究。 展开更多
关键词 汉字识别 命名 词汇判断 计算机模拟
在线阅读 下载PDF
基于隐私保护技术的DNS通信协议 被引量:3
12
作者 张海阔 陆忠华 +4 位作者 陈闻宇 陈连栋 左鹏 王珏 徐彦之 《科技导报》 CAS CSCD 北大核心 2019年第8期97-103,共7页
域名系统(DNS)是互联网基础服务,是互联网访问的重要入口,域名隐私保护是DNS安全的研究热点。提出了一种基于用户数据报协议(UDP)的DNS传输中用户隐私保护的加密方法:DNSDEA(DNS data encryption algorithm)。该方法采用PKI加密体系与DN... 域名系统(DNS)是互联网基础服务,是互联网访问的重要入口,域名隐私保护是DNS安全的研究热点。提出了一种基于用户数据报协议(UDP)的DNS传输中用户隐私保护的加密方法:DNSDEA(DNS data encryption algorithm)。该方法采用PKI加密体系与DNS协议相融合,不仅解决了域名隐私保护问题,而且与传统DNS体系相兼容,保持了DNS系统的简单、高效的技术特点。与当前的DNS加密方法相比,DNSDEA提高了任务并行的并行化粒度,降低了加密情况下DNS查询的延时。 展开更多
关键词 域名系统 隐私保护 并行 加密 延时
原文传递
一种新的用于网络病毒监测定位的域名系统 被引量:1
13
作者 李旲 仇贲 +3 位作者 曹轶群 焦健 山秀明 任勇 《计算机工程》 CAS CSCD 北大核心 2005年第19期56-58,共3页
针对网络环境下对被病毒感染网络节点准确定位的需要,构造了用于网络病毒监测定位的域名系统。病毒侵害主要影响文件系统,病毒驻存的主要载体为本地硬盘,因而将硬盘作为病毒监测网络的识别节点,并以主机的硬盘序列号作为网络终端节点的... 针对网络环境下对被病毒感染网络节点准确定位的需要,构造了用于网络病毒监测定位的域名系统。病毒侵害主要影响文件系统,病毒驻存的主要载体为本地硬盘,因而将硬盘作为病毒监测网络的识别节点,并以主机的硬盘序列号作为网络终端节点的标识,应用DNS服务器的成熟技术和分布结构,实现节点硬盘序列号与IP地址的双向映射,并进行动态数据维护,达到了对网络节点的准确辨识和定位。为网络上病毒感染节点的定位和查找,以及对病毒散布源头的追寻创造了条件。 展开更多
关键词 病毒 域名系统 定位 名字系统
在线阅读 下载PDF
面向商务信息抽取的产品命名实体识别研究 被引量:48
14
作者 刘非凡 赵军 +3 位作者 吕碧波 徐波 于浩 夏迎炬 《中文信息学报》 CSCD 北大核心 2006年第1期7-13,共7页
市场信息化使得商务信息抽取、市场内容管理日益成为信息科学领域的一个研究热点。产品命名实体识别作为其中非常重要的关键技术之一也逐渐受到人们的关注。本文面向商务信息抽取对产品命名实体进行了定义并系统分析了其识别任务的特点... 市场信息化使得商务信息抽取、市场内容管理日益成为信息科学领域的一个研究热点。产品命名实体识别作为其中非常重要的关键技术之一也逐渐受到人们的关注。本文面向商务信息抽取对产品命名实体进行了定义并系统分析了其识别任务的特点和难点,提出了一种基于层级隐马尔可夫模型(hierarchical hid-den Markov model)的产品命名实体识别方法,实现了汉语自由文本中产品命名实体识别和标注的原型系统。实验表明,该系统在电子数码和手机领域均取得了令人满意的实验结果,对产品名实体、产品型号实体、产品品牌实体整体识别性能的F值分别为79.7%,86.9%,75.8%。通过和最大熵模型相比较,验证了HHMM对于处理多尺度嵌套序列有更强的表征能力。 展开更多
关键词 计算机应用 中文信息处理 产品命名实体识别 商务信息抽取 层级隐马尔可夫模型
在线阅读 下载PDF
边界模板和局部统计相结合的中国人名识别 被引量:13
15
作者 李中国 刘颖 《中文信息学报》 CSCD 北大核心 2006年第5期44-50,共7页
本文提出了一种基于篇章信息的中国人名识别算法。我们从标注语料中提取人名左右边界词语及人名用字频度作为系统知识源。识别过程是:首先利用带有频度的边界模板识别出可能的人名,并把识别结果扩散到整篇文章以召回数据稀疏导致的遗漏... 本文提出了一种基于篇章信息的中国人名识别算法。我们从标注语料中提取人名左右边界词语及人名用字频度作为系统知识源。识别过程是:首先利用带有频度的边界模板识别出可能的人名,并把识别结果扩散到整篇文章以召回数据稀疏导致的遗漏人名。然后应用上下文局部统计量及几条启发式规则对识别结果进行边界校正。该算法具有线性时间复杂度,大规模开放测试(针对1354篇新闻报道约304万字,含人名3.7万个)的正确率为94.52%,召回率为98.97%,效果非常令人满意。 展开更多
关键词 计算机应用 中文信息处理 人名识别 命名实体识别 边界模板 局部统计量 词法分析
在线阅读 下载PDF
基于统计的中文地名识别 被引量:49
16
作者 黄德根 岳广玲 杨元生 《中文信息学报》 CSCD 北大核心 2003年第2期36-41,共6页
本文针对有特征词的中文地名识别进行了研究。该系统使用从大规模地名词典和真实文本语料库得到的统计信息以及针对地名特点总结出来的规则 ,通过计算地名的构词可信度和接续可信度从而识别中文地名。该模型对自动分词的切分作了有效的... 本文针对有特征词的中文地名识别进行了研究。该系统使用从大规模地名词典和真实文本语料库得到的统计信息以及针对地名特点总结出来的规则 ,通过计算地名的构词可信度和接续可信度从而识别中文地名。该模型对自动分词的切分作了有效的调整 ,系统闭式召回率和精确率分别为 90 2 4 %和 93 14 % ,开式召回率和精确率分别达 86 86 %和 91 4 8%。 展开更多
关键词 计算机应用 中文信息处理 中文地名识别 构词可信度 接续可信度 自动分词
在线阅读 下载PDF
《知网》在命名实体识别中的应用研究 被引量:11
17
作者 郑逢强 林磊 +1 位作者 刘秉权 孙承杰 《中文信息学报》 CSCD 北大核心 2008年第5期97-101,共5页
命名实体识别是自然语言处理领域的一项基础研究,它对于语言的深层处理有重要意义。该文以最大熵模型为基础来进行名实体识别,提出了基于《知网》的两种改进策略来增强模型的泛化性能。第一种策略是将《知网》中词的义原作为特征加入到... 命名实体识别是自然语言处理领域的一项基础研究,它对于语言的深层处理有重要意义。该文以最大熵模型为基础来进行名实体识别,提出了基于《知网》的两种改进策略来增强模型的泛化性能。第一种策略是将《知网》中词的义原作为特征加入到最大熵模型中;第二种策略是利用《知网》来计算最大熵模型中词特征之间的概念相似度。在北京大学《人民日报》语料上的实验结果表明第一种策略可以有效地提高名实体识别的性能,第二种策略的改进效果不明显。 展开更多
关键词 计算机应用 中文信息处理 名实体识别 概念相似度 《知网》 最大熵模型
在线阅读 下载PDF
基于篇章的中文地名识别研究 被引量:18
18
作者 唐旭日 陈小荷 +1 位作者 许超 李斌 《中文信息学报》 CSCD 北大核心 2010年第2期24-32,共9页
该文介绍了以篇章为单位的中文地名识别方法和系统实现。地名识别包括简单地名识别和复杂地名识别两个阶段。简单地名识别由基于条件随机场的识别模块和基于篇章地名关系的识别模块顺序构成,以原始文本为输入,直接利用地名内部结构和相... 该文介绍了以篇章为单位的中文地名识别方法和系统实现。地名识别包括简单地名识别和复杂地名识别两个阶段。简单地名识别由基于条件随机场的识别模块和基于篇章地名关系的识别模块顺序构成,以原始文本为输入,直接利用地名内部结构和相邻字信息进行地名识别和文本分词,然后利用篇章地名关系和地名性判断进一步处理。复杂地名识别以简单地名识别结果为输入,采用条件随机场识别。系统在封闭测试和开放测试中F-1值分别达到92.87%和89.76%。研究发现,在地名性判断中地名确信度低的字串对于地名识别干扰性较大,篇章地名关系能够在不降低识别精确度的情况下有效提高召回率,综合利用地名短距离和长距离依存关系可以有效提高地名识别效果。 展开更多
关键词 计算机应用 中文信息处理 篇章地名关系 条件随机场 地名性判断
在线阅读 下载PDF
SVM与规则相结合的中文地名自动识别 被引量:32
19
作者 李丽双 黄德根 +1 位作者 陈春荣 杨元生 《中文信息学报》 CSCD 北大核心 2006年第5期51-57,共7页
在分析中文文本中地名特点的基础上,提出了一种支持向量机(SVM)与规则相结合的中文地名自动识别方法:按字抽取特征向量的属性,然后将这些属性转换成二进制向量并建立训练集,采用多项式Kernel函数,得到SVM识别地名的机器学习模型;通过对... 在分析中文文本中地名特点的基础上,提出了一种支持向量机(SVM)与规则相结合的中文地名自动识别方法:按字抽取特征向量的属性,然后将这些属性转换成二进制向量并建立训练集,采用多项式Kernel函数,得到SVM识别地名的机器学习模型;通过对错误识别结果的分析,构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面导致召回率偏低的不足。实验表明,用SVM与规则相结合的机制识别中文文本中的地名是有效的:系统开式召回率、精确率和F-值分别达89.57%、93.52%和91.50%。 展开更多
关键词 计算机应用 中文信息处理 中文地名识别 支持向量机 机器学习 基于规则的后处理
在线阅读 下载PDF
基于单字提示特征的中文命名实体识别快速算法 被引量:25
20
作者 冯元勇 孙乐 +1 位作者 李文波 张大鲲 《中文信息学报》 CSCD 北大核心 2008年第1期104-110,共7页
近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear-chain)模型一般采用L-BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降... 近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear-chain)模型一般采用L-BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降低特征的规模,并通过在推理过程中引入任务相关的人工知识压缩Viterbi和Baum-Welch格搜索空间,提高了训练的速度。在中文863命名实体识别评测语料和SIGHAN06语料集上进行的实验表明,该算法在不影响中文命名实体识别精度的同时,有效地降低了模型的训练代价。 展开更多
关键词 计算机应用 中文信息处理 中文命名实体识别 条件随机场 自然语言处理 机器学习
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部