期刊文献+

Web网页识别算法研究 被引量:8

Research on the Recognizing Algorithm of Web Pages
在线阅读 下载PDF
导出
摘要 WWW上的文本信息挖掘工作是网络信息处理领域的新课题。本文研究了两种机器学习算法———Rocchio算法和Widrow Hoff算法在Web网页识别领域中的应用 。 Text information mining on WWW is a new trend in network information searching field. We apply two machine learning algorithms——Rocchio algorithm and Widrow Hoff algorithm to recognize Web pages and compare them to some custom algorithms.
出处 《情报学报》 CSSCI 北大核心 2001年第1期77-81,共5页 Journal of the China Society for Scientific and Technical Information
关键词 特征提取 机器学习算法 WWW 网页识别 网络信息处理 文本信息挖掘工作 character extraction, machine learning, World Wide Web, recognizing of Web pages.
  • 相关文献

参考文献2

二级参考文献12

共引文献33

同被引文献21

引证文献8

二级引证文献30

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部