网际网上半结构化数据抽取与知识发现方法及其实现被引量：7

On Semi-structured Data Extraction from WWW and Its Schema Knowledge Discovery Method

下载PDF

导出

摘要 1.引言在信息化程度日益提高的今天,半结构化信息已遍及社会的各个领域。例如,网际网(World WideWeb,又称WWW)已成为一个巨大的信息源,然而WWW上的信息并不能以一种通用的方式进行查询及操纵,大量的信息是以静态的HTML文本形式存储并只能通过浏览器来浏览,因此如何有效利用这类信息显得尤为重要。 It is well known that World Wide Web has become a huge information resource. However, the information on WWW can not be queried and mainpulated in a general way. Large amount of information is stored in a static HTML format and can only be viewed through browser. Therefore, it is very important for us to utilize this kind of information effectively. This paper proposes a semi-structured data extraction method to get the useful information embedded in a group of relevant web pages, and store it with OEM (Object Exchange Model). Then, we adopt data mining method to discover schema knowledge implicit in the semi-structured data.

作者陈恩红范焱王行甫蔡庆生

机构地区中国科学技术大学计算机系

出处《计算机科学》 CSCD 北大核心 1999年第10期49-52,共4页 Computer Science

基金国家自然科学基金

关键词网际网数据抽取知识发现半结构化数据 Semi-structured data, Knowledge discovery

分类号 TP393 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1叶煊陈恩红等.关联规则的发现算法研究[J].小型微型计算机系统,.
2王清毅,陈恩红,蔡庆生.知识发现的若干问题及应用研究[J].计算机科学,1997,24(5):73-77. 被引量：34

共引文献33

1黄越岭,张小真,沈艳多.可视化远程教育管理系统研究[J].西南师范大学学报（自然科学版）,2006,31(6):100-104. 被引量：1
2罗平,阳广元,甯佐斌.数据挖掘方法和知识发现研究[J].图书情报工作,2011,55(S1):217-219. 被引量：2
3刘敏林,刘伯运.信息技术在柴油机维修决策支持系统中的应用[J].中国水运（下半月）,2009,9(2):122-123.
4李敏.数据挖掘在辅助决策系统的应用研究[J].微计算机信息,2004,20(5):96-97. 被引量：36
5吴为英.基于GIS的空间数据挖掘技术[J].山东科技大学学报（自然科学版）,2004,23(3):15-17. 被引量：5
6鲁小琴,束炯,王铮.数据仓库在城市环境管理中的应用[J].东北测绘,2002,25(4):26-30. 被引量：1
7刘伯运,常汉宝,欧阳光耀.基于数据仓库和信息挖掘的柴油机维修决策支持系统[J].船海工程,2005,34(6):31-33. 被引量：5
8为最佳产品投票[J].纺织装饰科技,2006(4):25-25.
9乔延江,李澎涛,苏钢强,肖培根,王永炎.中药(复方)KDD研究开发的意义[J].北京中医药大学学报,1998,21(3):15-17. 被引量：52
10王冰清,怀进鹏.IDSS 中数据仓库和数据挖掘的研究与实现[J].北京航空航天大学学报,1998,24(4):399-402. 被引量：14

同被引文献47

1陈国良,林洁,顾乃杰.分布式存储的并行串匹配算法的设计与分析[J].软件学报,2000,11(6):771-778. 被引量：10
2宋伟(SONG Wei).Internet数据挖掘原理及实现(Internet data mining principle and implementation)[J].重庆：重庆通信学院学报(Chongqing： Chongqing University of Post and Telecommunication ),2001,13(2):58-58.
3Mohseni 张录娥译.Web数据库开发人员指南(The GuidebookWeb of Web Database development personnel)[M].北京:机械工业出版社(Beijing:China machine press),1997.120-124.
4朱洪,陈增武,段振华等.算法设计与分析.上海:上海科技文献出版社.2005.
5HAN Jia-wei,Micheline Kamber. Data Mining Concepts and Techniques. 北京:机械T工业出版社,2001,8.
6Kurt Cagle.XML高级开发指南.北京:电子工业出版社,2001,6.
7陈国良.并行算法的设计与分析.北京:高等教育出版社,2004,5.
8Florescu D Levy Alon,et al. Database Techniques for the World-Wide-Web: A Surver
9Simple Object Access Protocol(SOAP)11.W3C Note 08 May 2000. http://wwww3org/TR/SOAP/
10SOAP Toolkit,20.Microsoft Corp, http://msdnmicrosoftcom/ soap.

引证文献7

1杜威,邹先霞,魏长华.基于OLAP的Web日志挖掘的研究与探讨[J].计算机与现代化,2004(12):106-109. 被引量：3
2何莹.关系数据库的模式抽取[J].现代计算机,2009,15(4):100-103.
3何莹.关系数据库的模式抽取[J].信息技术,2009,33(8):117-120. 被引量：1
4陈洪军,陈新度,陈庆新.WEB环境下机电产品知识模型的知识获取与维护[J].机电工程技术,2011,40(4):33-37.
5宋伟,王举成,马根峰,赵济林.Internet数据挖掘原理及实现[J].重庆邮电学院学报（自然科学版）,2001,13(2):58-61. 被引量：10
6黄奇,李伟,接晓莉.网络半结构化信息资源的描述[J].图书情报工作,2002,46(2):70-72. 被引量：4
7范亚芹,刘颖,李兴男.Web数据挖掘原理及实现[J].吉林大学学报（信息科学版）,2003,21(4):370-373. 被引量：17

二级引证文献35

1杨洋.Web数据挖掘的分析与探讨[J].装备制造技术,2006(5):63-64. 被引量：1
2谷兰英,王明常.多元地学信息系统的设计与实现[J].吉林大学学报（地球科学版）,2005,35(S1):155-158. 被引量：2
3曹士信,金鑫.空间军事系统综合集成研讨厅中基于移动Agent的数据挖掘结构研究[J].军事运筹与系统工程,2005,19(3):61-64.
4陈红亚.基于文本挖掘的主动信息服务[J].情报杂志,2004,23(10):46-47. 被引量：3
5袁毅,陈厉周.一种基于Agent技术的WebMining模型[J].电脑知识与技术（技术论坛）,2005(1):41-43. 被引量：1
6曼丽春,朱宏.WEB数据挖掘研究与探讨[J].西南民族大学学报（自然科学版）,2005,31(2):302-306. 被引量：10
7曼丽春,朱宏,杨全胜.Web数据挖掘研究与探讨[J].现代电子技术,2005,28(8):3-6. 被引量：29
8祖巧红,陈定方,胡吉全.分析型客户关系管理系统的研究[J].湖北工业大学学报,2005,20(3):58-59. 被引量：5
9贾文举,张颖,孟祥岗.一个基于数据仓库Web日志的数据挖掘实例[J].佳木斯大学学报（自然科学版）,2005,23(4):522-524.
10安娜.论学科信息门户的网络资源编目[J].高校图书情报论坛,2006,5(2):24-26. 被引量：2

1李腊元,胡修林,张蕴玉.一种局部网际网传输通信协议的研究分析[J].系统工程与电子技术,1994,16(3):28-38. 被引量：1
2赵丽,鞠九滨.一个基于网际网的异构型分布式系统:通信、命名、保护[J].计算机工程与应用,1990,26(10):109-115.
3刘达顷,石冰心.Internet网际网的关键技术之一：CGI技术的探讨[J].计算机技术,1997(12):165-166.
4信息时代呼唤网际网UPS——网际网UPS在网络远程控制和管理方面的应用[J].上海微型计算机,1998(20):39-39.
5南湘浩.构建自主可控的网际网[J].金融电子化,2014(2):10-13.
6郭佑民,郭怀峥.丰富多彩的Internet——兼介《Internet新用户指南》和《Internet使用手册》[J].博览群书,1996,0(4):41-42.
7禾苗.网络的分类[J].中国管理信息化,1998,0(2):47-47.
8罗云野.Internet——一个全球网络之网络[J].图书馆杂志,1995,14(1):30-32. 被引量：2
9细数互联网与安全防护那些事儿[J].电脑爱好者,2013(23):74-78.
10听松涛.轻松打理网际快车文件管理的技巧[J].计算机与网络,2008,34(10):20-21.

计算机科学

1999年第10期

浏览历史

内容加载中请稍等...

网际网上半结构化数据抽取与知识发现方法及其实现被引量：7

参考文献2

共引文献33

同被引文献47

引证文献7

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

网际网上半结构化数据抽取与知识发现方法及其实现 被引量：7

参考文献2

共引文献33

同被引文献47

引证文献7

二级引证文献35

相关作者

相关机构

相关主题

浏览历史

网际网上半结构化数据抽取与知识发现方法及其实现被引量：7