基于搜索引擎的知识发现被引量：3

Knowledge Discovery Based on the Search Engine

下载PDF

导出

摘要数据挖掘一般用于高度结构化的大型数据库,以发现其中所蕴含的知识。随着在线文本的增多,其中所蕴含的知识也越来越丰富,但是,它们却难以被分析利用。因而,研究一套行之有效的方案发现文本中所蕴含的知识是非常重要的,也是当前重要的研究课题。该文利用搜索引擎Google获取相关Web页面,进行过滤和清洗后得到相关文本,然后,进行文本聚类,利用Episode进行事件识别和信息抽取,数据集成及数据挖掘,从而实现知识发现。最后给出了原型系统,对知识发现进行实践检验,收到了很好的效果。 Data mining is typically applied to large databases of highly structured information in order to discover new knowledge.Though the amount of potentially valuable knowledge contained in document collections can be great,they are often difficult to analyze.Therefore,it is important to develop methods to efficiently discover knowledge embedded in these document repositories,and text mining becomes an important research area too.This paper describes an approach for mining knowledge from web pages,at first,gets web pages from the web by search engine Google,then filters out the irrelevant documents,takes text categorization,extracts information and recognizes the event type by episode,integrates and mines the data in order to discover new knowledge.Finally,a prototype based on this theory is developed,and then the result is described in detail.

作者马玉春宋瀚涛

机构地区北京理工大学计算机系

出处《计算机工程与应用》 CSCD 北大核心 2004年第30期178-180,220,共4页 Computer Engineering and Applications

关键词搜索引擎文本聚类 EPISODE 信息抽取知识发现 search engine,text categorization,episode,information extraction,knowledge discovery

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1Raymond Kosala,Hendrik Blockeel. Web mining research:A survey[J].SIGKDD Explorations,2000;2(1): 1～15
2中国新闻社.http:∥www.chinanews.com.cn/,2003-10-01
3Google.http :∥www.google.com/, 2003-10-01
4Sergey Brin,Lawrence Page.The Anatomy of a Large-scale Hypertextual Web Search Engine[J].Computer Networks and ISDN Systems,1998 ;30:107～117
5Salton G,Wong A,Young C S.A Vector Space Model for Automatic Indexing[J].Communications of the ACM, 1975; 18(5) :613～620
6Hearst M A,Pedersen J. Reexamining the Cluster Hypothesis:Scatter/Gather on Retrieval Results[C].In:Proc of the 19th Annual Int ACM/SIGIR Conf Zurich:76～84
7H Ahonen,O Heinonen. Applying Data Mining Techniques in Text Analysis[R].Report C-1997-23 ,University of Helsinki ,Department of Computer Science, 1997-03
8U Nahm,R Mooney.Text Mining with Information Extraction[C].In:Proceedings of the AAAI 2002 Spring Symposium on Mining Answers from Texts and Knowledge Bases,2002

同被引文献28

1郭跃华,尹柳营.创新网络组织学习研究[J].管理学报,2004,1(3):345-349. 被引量：6
2李姗姗,宁洪,陈波,彭绍亮.通用数据仓库元数据模型的研究[J].计算机工程与科学,2004,26(5):52-55. 被引量：12
3张延国.基于搜索引擎的个性化知识推送系统[J].中国信息导报,2004(6):60-61. 被引量：17
4五玉法,李敬良.知识管理的职能及其与组织学习的关系[J].经济论坛,2004(18):55-55. 被引量：2
5林山,蓝海林,黄培伦.组织学习、知识创新与组织创新的互动研究[J].科学管理研究,2004,22(5):26-28. 被引量：17
6员巧云,程刚.近年来我国数据挖掘研究综述[J].情报学报,2005,24(2):250-256. 被引量：46
7郑双怡.文本挖掘及其在知识管理中的应用[J].中南民族大学学报（人文社会科学版）,2005,25(4):127-130. 被引量：26
8王前,李作学,金福.基于我国传统思维方式的个体隐性知识评价指标分析[J].科技进步与对策,2005,22(7):37-39. 被引量：9
9Mervat Tallawy. Knowledge Management Methodology:an Empirical Approach in Core Sectors in Escwa Member Countries. Economic and Social Commission For Western Asia, 2003, PP30-37.
10Leanne,M.Whicker & Kate,M.Andrews. HRM in the Knowledge Economy:Realizing the Potential.Asia Pacific Journal of Human Resources,2003.

引证文献3

1曹龙,陈菊红.提高组织知识管理水平的柔性人力资源管理策略[J].科学学与科学技术管理,2005,26(8):86-91. 被引量：14
2欧兆虎.知识管理与知识评价[J].图书情报知识,2006,23(3):100-103. 被引量：12
3陈丹,郑增威.增量式索引技术在信息搜索引擎中的应用[J].现代图书情报技术,2007(6):87-90. 被引量：2

二级引证文献28

1万希,杨萍.基于知识管理的人力资源管理环境改善[J].云南财经大学学报（社会科学版）,2009(6):98-100. 被引量：1
2崔鸽.柔性管理对新时期乡镇企业人力资源管理的启示[J].安徽农业科学,2006,34(9):1976-1978. 被引量：2
3胡翠华.证券产业价值链构造的规范分析——界定及构造依据[J].工业技术经济,2007,26(5):151-155. 被引量：1
4穆向明,应必.基于知识管理的企业人力资源管理研究[J].科技管理研究,2007,27(8):231-232. 被引量：9
5李顺龙.学科视野下的图书馆知识管理研究[J].重庆职业技术学院学报,2007,16(5):163-165.
6储节旺,郭春侠,陈亮.国内外知识管理流程研究述评[J].情报理论与实践,2007,30(6):858-861. 被引量：39
7张敏霞.基于高并发及大数据量的B2B商务系统的设计与实现[J].河南工业大学学报（社会科学版）,2009,5(1):41-44. 被引量：8
8王小青,刘怀亮.基于人力资源的知识管理能力成熟度研究[J].情报杂志,2009,28(4):125-127. 被引量：5
9张斯龙.知识管理与科技期刊信息化[J].情报探索,2010(8):85-88. 被引量：2
10万田力,赵姜.知识管理和民航企业人力资源开发[J].现代商业,2010(33):153-154. 被引量：1

1朱奭,俞晓婷.三维动画Episode的设计与制作[J].现代计算机,2014,20(21):18-21.
2乙太.时隔九年的感动!《最终幻想XV EPISODE DUSCAE》完全体验报告[J].游戏机实用技术,2015(8):14-19.
3刘斌,张楠.基于LS-SVM的在线文本识别方法[J].微电子学与计算机,2009,26(3):192-194. 被引量：2
4LIN Shukuan,WANG Ya,WANG Jue,GUO Tianzhu,QIAO Jianzhong.Frequent 2-Episode Mining with Minimal Occurrences Based on Episode Matrix and Lock State[J].Chinese Journal of Electronics,2012,21(4):633-635.
5Wang Xin-miao,Huang Tian-xi,Yan Pu-liu,Chong Yan-wen.Knowledge Discovery from Communication Network Alarm Databases[J].Wuhan University Journal of Natural Sciences,2000,5(2):194-198. 被引量：1
6Gansu Releases 12-episode Animation Series ＂Legend of Dunhuang＂[J].China & The World Cultural Exchange,2014,80(4):5-6.
7孙力娟,甘学士,王汝传.基于智能技术的分布式实时入侵检测系统模型研究[J].计算机应用,2005,25(B12):72-74. 被引量：1
8丁剑,韩萌,李娟.概念漂移数据流挖掘算法综述[J].计算机科学,2016,43(12):24-29. 被引量：14
9Zhou Xiaoyan.A Speedier Era[J].Beijing Review,2013,56(43):36-37.
10Alev Kdicgedik,Suleyman C Efe,Ahmet S Gurbuz,Emrah Acar,Mehmet F Yilmaz,Asian Erdogan,Gokhan Kahveci,Ibrahim A Izgi,Cevat Kirma.Left Atrial Mechanical Function and Aortic Stiffness in Middle-aged Patients with the First Episode of Atrial Fibrillation[J].Chinese Medical Journal,2017(2):143-148. 被引量：1

计算机工程与应用

2004年第30期

浏览历史

内容加载中请稍等...

基于搜索引擎的知识发现被引量：3

参考文献8

同被引文献28

引证文献3

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于搜索引擎的知识发现 被引量：3

参考文献8

同被引文献28

引证文献3

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于搜索引擎的知识发现被引量：3