摘要
Web信息抽取技术已成为一个活跃的研究领域。本文根据信息抽取的原理,对现有的信息抽取技术进行了分类,结合典型的系统讨论各取技术的特点。
出处
《福建电脑》
2007年第7期48-49,共2页
Journal of Fujian Computer
参考文献3
-
1李善平,尹奇韡,胡玉杰,郭鸣,付相君.本体论研究综述[J].计算机研究与发展,2004,41(7):1041-1052. 被引量:278
-
2王庆一,王继成,周源远,袁春风.多信息块Web页面的信息抽取[J].计算机应用研究,2002,19(10):23-26. 被引量:21
-
3Stephen Soderland. Learning Information Extraction Rules for Semi-Structured and Free Text[J] 1999,Machine Learning(1-3):233~272
二级参考文献78
-
1[1]Joachim Hammer, Hector Garcia-Molina, Jumghoo Cho, et al.Extracting Semistructured Information from the Web [C].Proceedings of the First Workshop on Management of Semistructured Data, Tucson, Arizona, 1997.18-25.
-
2[2]Arnaud Sahuguet, Fabien Azavant. Building Light-weight Wrap-pers for Legacy Web Data-sources Using W4F[C]. International Conference on Very Large Databases (VLDB), Edinburgh,Scotland, 1999.738-741.
-
3[3]S Soderland. Learning Information Extraction Rules for Semi-structured and FreeText [ J ]. Machine Learning, 1999, 1-44.
-
4[4]N Kushmerick, D Weld, B Doorenbos. Wrapper Induction for Information Extraction [ C ]. In Proceedings of the Fifteenth International Joint Conference on Artificial Intelligence (IJCAI-97), Osaka, Japan, 1997.729-737.
-
5[5]Ion Muslea, Steve Minton, Craig Knoblock. Stalker: Learning Extraction Rules for Semistructured, Web-based Information Sources [ C ]. AAAI-98 Workshop on "AI & Information Integration", Madison, 1998.74-81.
-
6[6]Ion Muslea. Extraction Patterns: From Information Extraction to Wrapper Induction[ R]. Technical Report, Information Sciences Institute, University of Southern Californi, 1998.
-
7D Fensel,C Bussler.The Web service modeling framework WSMF.http://www.wsmo.org/papers/publications/wsmf.paper.pdf,2004-05-18
-
8D Fensel,V R Benjamins,E Motta,et al.UPML:A framework for knowledge system reuse.The 16th Int'l Joint Conf on AI (IJCAI-99),Sweden,1999
-
9P Karp,M Riley,S Paley,et al.EcoCyc:Electronic encyclopedia of E coli genes and metabolism.Nucleic Acids Research,1999,27(1):55~58
-
10A Gangemi,G Steve,F Giacomelli.ONIONS:An ontological methodology for taxonomic knowledge integration.The ECAI-96 Workshop on Ontological Engineering,Budapest,1996
共引文献296
-
1张逸,李渴,邵振国,罗海荣.基于标准文件的电能质量领域本体构建方法[J].电力系统自动化,2020,44(17):102-111. 被引量:7
-
2高俊杰,邓贵仕.基于本体的范例推理系统研究综述[J].计算机应用研究,2009,26(2):406-410. 被引量:10
-
3李洋.基于Web的信息抽取研究[J].吉林工程技术师范学院学报,2007,23(12):70-71. 被引量:2
-
4李洋,栾吉华.一种新的Web信息抽取方法研究[J].科技资讯,2007,5(35):80-81.
-
5孙永新,闫大顺,李晟.语义Web的初步逻辑研究[J].软件导刊,2010,9(5):29-31.
-
6徐方斌,刘仁义,张丰,杜震洪,曾志,卢英萍.一种使用语义和遗传进化思想的CAD和GIS数据转换方法[J].浙江大学学报(理学版),2012,39(5):587-592. 被引量:3
-
7姜传菊.试论Web中的数据挖掘[J].现代图书情报技术,2003(S1):162-164. 被引量:5
-
8宫禹.基于语义相似度的智能搜索方法研究[J].黑龙江科学,2010,1(3):26-29.
-
9刘雅冬.领域本体的构建方法研究[J].商情,2008(5):125-125.
-
10王坤,王芳.基于本体理论的冶金设备分类编码方法[J].中国冶金,2015,25(4):66-70.
同被引文献80
-
1王波,姚敏.基于信息抽取的匿名用户兴趣描述[J].华南理工大学学报(自然科学版),2004,32(z1):117-120. 被引量:1
-
2周明建,高济,李飞.基于本体论的Web信息抽取[J].计算机辅助设计与图形学学报,2004,16(4):535-541. 被引量:34
-
3陈兰,左志宏,熊毅,孟令谦.一种新的基于Ontology的信息抽取方法[J].计算机应用研究,2004,21(8):155-157. 被引量:18
-
4俞士汶,段慧明,朱学锋,张化瑞.综合型语言知识库的建设与利用[J].中文信息学报,2004,18(5):1-10. 被引量:31
-
5吴扬扬,陈锻生.识别和抽取Web列表中的关系信息[J].计算机科学,2004,31(6):86-88. 被引量:3
-
6王睿,张能立,万歆.一种基于JFree Chart的Web统计图表[J].微机发展,2005,15(3):117-120. 被引量:15
-
7翟东升,余旸,李莉.网络信息抽取技术及其在TBT预警中的应用[J].现代图书情报技术,2005(9):76-79. 被引量:1
-
8梁晓涛,谢荣传.基于OWL描述本体的语义信息抽取[J].计算机技术与发展,2006,16(1):62-65. 被引量:2
-
9谢红薇,周慧,李娟莉.基于应急案例本体的信息抽取的模型及应用[J].电脑开发与应用,2006,19(2):46-48. 被引量:3
-
10郭志鑫.基于本体的文档引文元数据信息抽取[J].微计算机信息,2006,22(06X):304-306. 被引量:18
引证文献6
-
1李斌.浅谈web信息抽取[J].大众科技,2010,12(4):48-49.
-
2张莉萍.基于领域本体构建的Web信息抽取[J].嘉兴学院学报,2010,22(6):107-111. 被引量:4
-
3谭锋,李天真,崔亮亮.Web信息抽取系统研究综述[J].科技创新导报,2010,7(34):2-2. 被引量:3
-
4王存昕,蒋文蓉.针对淘宝商家客户管理系统的研究与开发[J].上海第二工业大学学报,2011,28(2):165-170. 被引量:2
-
5阳广元.国内基于本体的信息抽取研究现状与热点分析[J].图书馆理论与实践,2017,0(5):38-43. 被引量:1
-
6张莉萍.基于领域本体构建的Web信息抽取[J].知识管理论坛,2011(5):27-32.
二级引证文献10
-
1张晓燕.基于需求级软件复用技术研究[J].山东轻工业学院学报(自然科学版),2011,25(3):92-96.
-
2卢美玲.军事通信抗干扰技术研究[J].科协论坛(下半月),2013(1):97-98. 被引量:6
-
3魏尊强,舒红平,王亚强.基于序列标注的中医症状名识别技术研究[J].山东工业技术,2015(8):237-238. 被引量:5
-
4马小红.淘宝网店运营过程的动态数据分析[J].电子商务,2015,16(7):44-45. 被引量:2
-
5陈阳.基于淘宝某商品销售量监控系统[J].科技经济市场,2016(2):170-171. 被引量:2
-
6阳广元.国内基于本体的信息抽取研究现状与热点分析[J].图书馆理论与实践,2017,0(5):38-43. 被引量:1
-
7陈雅迪,张雪蕾,李娟.面向机构知识库的课程信息元数据抽取系统设计与实现[J].情报探索,2017(7):78-83. 被引量:1
-
8王瀚琳.实体关系抽取技术的研究[J].数码设计,2020,9(13):45-45.
-
9王扬,郑阳,杨青,王旭强,田雨婷.基于联合序列标注深度学习的层级信息抽取[J].计算机应用与软件,2021,38(8):167-174. 被引量:3
-
10阎思宇,李绪辉,陈沐坤,朱海锋,谭杰骏,高旷,王永博,黄桥,任相颖,靳英辉,王行环.面向真实世界的知识挖掘与知识图谱补全研究(二):非结构化电子病历信息抽取方法及进展[J].医学新知,2023,33(5):358-365. 被引量:8
-
1王军.Web信息抽取技术简述[J].河南科技,2013,32(10):5-6.
-
2贺令亚,柳佳刚.基于Web的包装器技术的现状与发展[J].电脑开发与应用,2007,20(6):27-29. 被引量:6
-
3于成龙.中文网页信息抽取技术及分类算法研究[J].山东理工大学学报(自然科学版),2011,25(3):108-110.
-
4崔春,龚捷.Web信息抽取研究综述[J].电脑知识与技术,2011,7(4):2279-2280. 被引量:2
-
5沈杰.信息抽取技术面临的挑战及其策略[J].计算机光盘软件与应用,2011(8):3-4.
-
6卢红杰.基于Web数据的信息抽取技术[J].兰台世界(上旬),2006(04S):52-53.
-
7史树敏,刘东升.信息抽取与信息检索技术比较研究[J].计算机科学,2006,33(B12):141-145.
-
8李冠宇,刘军,张俊.分布式异构数据集成系统的研究与实现[J].计算机应用研究,2004,21(3):96-98. 被引量:31
-
9张东站,宋瀚涛,宋学艳,孔令标.基于角色的异构数据库联合使用[J].计算机工程,2004,30(5):3-5. 被引量:4
-
10陈洪平,方巍,李林,崔志明.复杂Web页的Wrapper自动化生成技术研究[J].微电子学与计算机,2010,27(4):62-65.