期刊文献+

JavaScript引擎在动态网页采集技术中的应用 被引量:37

Extracting Dynamic URLs Using JavaScript Engine
在线阅读 下载PDF
导出
摘要 怎样提取网页中由JavaScript脚本动态生成的URL,一直是网页采集器设计的一个难题,文中给出了一个基于JavaScript引擎的通用的解决办法和模块实现以及测试结果。 How to extract URLs that are dynamically created by JavaScript code in web pages? This paper presents a general solution exploiting a JavaScript engine named SpiderMonkey. This paper also describes its module implementation and gives some experimental results.
出处 《计算机应用》 CSCD 北大核心 2004年第2期33-36,共4页 journal of Computer Applications
基金 国家973规划资助项目(G1998030413) 中科院计算所领域前沿青年基金资助项目(20016280-8)
关键词 网页采集 JavaScfipt引擎 URL提取 SpiderMonkey web retrieval JavaScript engine URL extraction SpiderMonkey
  • 相关文献

参考文献4

  • 1[1]Eich B. JavaScript C Engine Embedder's Guide[EB/OL]. Http://www.mozilla.org/js/spidermonkey/apidoc/jsguide.html, mozilla.org, march 16, 2000.
  • 2[2]ECMA. ECMA-Script Language Specification Edition 3[EB/OL]. Http://www.mozilla.org/js/language/E262 3.pdf, European Computer manufacturer Association, march 24, 2000.
  • 3[3]Netscape. JavaScript C Engine API Reference[EB/OL]. http://developer.netscape.com/docs/manuals/javascriptapi/index.htm, Netscape Communications Corp., December 17, 1998.
  • 4[4]Netscape. JavaScript 1.5 References[EB/OL]. http://devedge.netscape.com/library/manuals/2000/javascript/1.5/guide/, Netscape Communications Corp., September 28, 2000.

同被引文献207

引证文献37

二级引证文献131

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部