期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
IESRL:An information extraction system for research level
1
作者 Fuhai LENG Rujiang BAI Qingsong ZHU 《Chinese Journal of Library and Information Science》 2013年第4期16-27,共12页
Purpose:In order to annotate the semantic information and extract the research level information of research papers,we attempt to seek a method to develop an information extraction system.Design/methodology/approach:S... Purpose:In order to annotate the semantic information and extract the research level information of research papers,we attempt to seek a method to develop an information extraction system.Design/methodology/approach:Semantic dictionary and conditional random field model(CRFM)were used to annotate the semantic information of research papers.Based on the annotation results,the research level information was extracted through regular expression.All the functions were implemented on Sybase platform.Findings:According to the result of our experiment in carbon nanotube research,the precision and recall rates reached 65.13%and 57.75%,respectively after the semantic properties of word class have been labeled,and F-measure increased dramatically from less than 50%to60.18%while added with semantic features.Our experiment also showed that the information extraction system for research level(IESRL)can extract performance indicators from research papers rapidly and effectively.Research limitations:Some text information,such as that of format and chart,might have been lost due to the extraction processing of text format from PDF to TXT files.Semantic labeling on sentences could be insufficient due to the rich meaning of lexicons in the semantic dictionary.Research implications:The established system can help researchers rapidly compare the level of different research papers and find out their implicit innovation values.It could also be used as an auxiliary tool for analyzing research levels of various research institutions.Originality/value:In this work,we have successfully established an information extraction system for research papers by a revised semantic annotation method based on CRFM and the semantic dictionary.Our system can analyze the information extraction problem from two levels,i.e.from the sentence level and noun(phrase)level of research papers.Compared with the extraction method based on knowledge engineering and that on machine learning,our system shows advantages of the both. 展开更多
关键词 Research papers information extraction Semantic labeling Regular expression Conditional random fields Research level
原文传递
基于机器视觉的快递面单信息提取算法研究与实现
2
作者 刘佰鑫 朱冬冬 《仪器仪表用户》 2025年第3期93-95,共3页
机器视觉技术的本质就是利用计算机软件来模拟人类视觉系统,智能机器人可自动识别图像或文字信息,并采取区块分割形式来识别大量的图像或者文字,按照用户要求完成信息提取操作。我国目前已进入“智慧物流”时代,如何利用机器视觉技术来... 机器视觉技术的本质就是利用计算机软件来模拟人类视觉系统,智能机器人可自动识别图像或文字信息,并采取区块分割形式来识别大量的图像或者文字,按照用户要求完成信息提取操作。我国目前已进入“智慧物流”时代,如何利用机器视觉技术来提升快递物流系统的自动化与智能化水平,已成为我国建设智慧物流体系过程中的关键所在。建立在机器视觉理论基础上的快递面单信息提取算法具有精准性与实时性,并能够适应快递面单信息识别与提取工作量迅猛增长的现状,显示出机器视觉技术应用于智慧物流建设的价值所在。本文主要探讨基于机器视觉的快递面单信息提取算法建构方案,结合快递行业的发展需求加以完善。 展开更多
关键词 机器视觉 快递面单信息提取算法 技术实现
在线阅读 下载PDF
正则表达式的Web数据提取研究 被引量:4
3
作者 刘松业 《电脑编程技巧与维护》 2008年第15期89-91,共3页
Internet正在日益成为一个重要的信息来源,如何对Web数据进行检索和加工,使得用户能够更好地利用Internet上的数据资源己经成为了新的研究热点。文中论述了半自动化数据提取算法,其中使用了基于扩展正则表达式的信息槽提取算法和基于网... Internet正在日益成为一个重要的信息来源,如何对Web数据进行检索和加工,使得用户能够更好地利用Internet上的数据资源己经成为了新的研究热点。文中论述了半自动化数据提取算法,其中使用了基于扩展正则表达式的信息槽提取算法和基于网页特性的事件分割算法。同时描述了利用这些算法的信息提取系统,并详细介绍了系统的体系结构和实现细节。该系统可以被用于真实的Web环境中以提高存储、利用信息的效率,在一定程度上解决在Internet上获取信息及利用信息的困难。 展开更多
关键词 数据提取 算法 正则表达式 半结构化数据
在线阅读 下载PDF
基于多标签数据的降维与分类算法的研究
4
作者 汤文伟 于威威 《现代计算机(中旬刊)》 2016年第5期3-9,共7页
现在为人们所熟知的是单标签的分类,传统的监督学习的方法主要应用在单标签的数据中,但随着数据的日益丰富,单标签已经不能再完整地描述一个样本的信息,现在往往一条样本会对应多个标签,所以多标签数据的分类逐渐的成为数据挖掘的一个... 现在为人们所熟知的是单标签的分类,传统的监督学习的方法主要应用在单标签的数据中,但随着数据的日益丰富,单标签已经不能再完整地描述一个样本的信息,现在往往一条样本会对应多个标签,所以多标签数据的分类逐渐的成为数据挖掘的一个重要研究方向。虽然多标签能够更好地去描述一个样本的信息,但多标签数据通常是那种特征数目很大的数据,对这样的数据直接进行处理很困难,同时这些高维数据往往存在维度灾难的问题,所以对多标签数据进行分类之前做好数据的降维对最终的分类起着不可忽视的作用。提出一种基于采用条件互信息(最小冗余最大依赖准则,MDMR)来进行特征集的选择,去除无用的特征信息,然后通过一种改进的KNN算法对数据进行分类,实验表明这种方法使平均查全率提高2.5%。 展开更多
关键词 单标签 多标签 条件互信息 特征提取 KNN算法
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部