摘要
怎样提取网页中由JavaScript脚本动态生成的URL,一直是网页采集器设计的一个难题,文中给出了一个基于JavaScript引擎的通用的解决办法和模块实现以及测试结果。
How to extract URLs that are dynamically created by JavaScript code in web pages? This paper presents a general solution exploiting a JavaScript engine named SpiderMonkey. This paper also describes its module implementation and gives some experimental results.
出处
《计算机应用》
CSCD
北大核心
2004年第2期33-36,共4页
journal of Computer Applications
基金
国家973规划资助项目(G1998030413)
中科院计算所领域前沿青年基金资助项目(20016280-8)