期刊文献+

基于Web资源的信息抽取技术 被引量:9

The Technology of Information Extraction for Web Resource
在线阅读 下载PDF
导出
摘要 Web资源含有大量的有用信息 ,但由于它们欠结构化 ,不能为传统的数据库型查询系统所利用。如何将这些信息抽取出来 ,转化成结构化信息 ,供其它信息集成系统所利用 ,成为该领域的研究热点。本文介绍了一个简单的 Web信息抽取模型 ,对于基于该模型的 wrapper归纳技术进行了探讨 ,并描述了一个 There is plenty of useful information in web resource.It can't be used by the traditional database query system because it is not well-structured.Recently considerable attention has been received on how to extract it from web resource and transfer it to structured information that can be used by other information integration systems.This paper presents a simple web information extraction model,discussed the technology of wrapper induction based on the model and describes automatic generation prototype system of wrapper.
作者 郭志红
出处 《情报科学》 CSSCI 北大核心 2002年第12期1282-1284,共3页 Information Science
关键词 WEB资源 信息抽取 wrapper归纳技术 自动生成原型系统 Information extraction Wrapper induction Automatic generation prototype system
  • 相关文献

参考文献3

  • 1[1]Nicholas Kushmerick. Wrapper induction: Efficiency and expressiveness. Artifical Intelligence 118 (2000): 15~68
  • 2[2]Ling Liu, Calton Pu, Wei Han. An XML-enabled data extraction toolkit for web sources. Information Systems 26 (2001): 563~583
  • 3[3]Armaud Sahuguet, Fabien Azavant. Building intelligent Web applications using lightweight wrappers. Data & knowledge Engineering 36 (2001): 283~286

同被引文献58

引证文献9

二级引证文献30

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部