用Java实现Web下载技术的探讨
How to Download a Website Using Java?
摘要
本文介绍了使用 Java技术实现整个 Web网站下载和解析的方法。根据该方法开发的系统采用灵活的可定制的方式实现下载 ,下载过程中对网站的各种类型资源进行解析并分类保存到本地文件或者数据库中 。
出处
《微型电脑应用》
2003年第11期54-56,59,共4页
Microcomputer Applications
参考文献8
-
1朱国进,陈家训.Web资源查找机理剖析[J].微型电脑应用,1999,15(6):1-4. 被引量:6
-
2Subrahmanyam Allamaraju 等 闻道工作室译.J2EE服务器端高级编程[M].北京:机械工业出版社,2001..
-
3SubrahmanyamAllamaraju 等.J2EE服务器端高级编程[M].机械工业出版社,2001年9月..
-
4潘春华,常敏,武港山.面向Web的信息收集工具的设计与开发[J].计算机应用研究,2002,19(6):144-147. 被引量:14
-
5何凌云,孙恒,王命延.Web信息自动搜索系统的设计与研究[J].计算机与现代化,2002(6):32-35. 被引量:2
-
6霍艳蓉.Web信息检索的关键技术[J].现代图书情报技术,2002(6):31-32. 被引量:8
-
7James William Allamaraju ,James W Cooper,Jave Design Patterns.
-
8RFC - 2068, 2616 http://www. ietf. org/iesg/Irfc-index. txt.
二级参考文献21
-
1翁惠玉,马范援,朱义军,杨传厚.网络搜索引擎的现状分析[J].情报学报,1999,18(S1):105-107. 被引量:25
-
2[1]Martijn Koster. Guidelines for Robot Writers [EB/OL]. http ://info. webcrawler. com/mak/projects/robots/guidelines. html.
-
3[2]Oskari Heinonen, et al. WWW Robots and Search Engines[Z].(1996).
-
4[3]David Pallmann. Progrmming Bots, Spiders , and Intelligent Agent in Microsoft Visual C++[M].北京:北京希望电子出版社,1999.41-59.
-
5[4]M Koster. A Standard for Robot Exclusion[EB/OL] .http://info. webcrawler. com/mak/ projects/ robots/norobots. html.
-
6[5]HTML4.01规范[EB/OL].http://www.3c.org/TR/html4.
-
7[6]http://www.w3.org/TR/html4/references.html # ref-RFC2616[EB/OL].
-
8[7]David Eichmann. The RBSE Spider - Balancing Effective Search Aginst Web Load [ C ]. In Proceedings of the First International World Wide Web Conference 1994. 113-120.
-
9[8]Oliver A McBryan. GENV and WWW: Tools for Taming the Web[C]. In Proceedings of the First International World Wide Web Conference 1994.79-90.
-
10[9]Brian Pinkerton. Finding What Peolple Want: Experiences with the WebCrawler[C]. In Proceedings of the Second International World Wide Web Conference, 1994.
共引文献39
-
1王利民.刍议电子文件档案的Web检索[J].中北大学学报(社会科学版),2007,23(S1):236-238.
-
2刘大川,张仕斌.基于PKI的身份认证的设计与实现[J].成都信息工程学院学报,2006(z1):81-85. 被引量:1
-
3王勇,陈楠.基于Java语言的电子邮件系统的实现[J].现代电子技术,2004,27(9):26-27. 被引量:10
-
4高昊江,张宜生,刘凡,梁书云.面向Web服务的企业信息系统集成开发技术研究与应用[J].计算机工程与科学,2004,26(6):105-109. 被引量:21
-
5刘惠康,鲍考明.基于Servlet程序的分析与实现[J].武汉科技大学学报,2004,27(3):291-293. 被引量:1
-
6龚蛟腾.元搜索引擎研究[J].情报杂志,2004,23(10):77-78. 被引量:15
-
7张强,邱丽芳,翁海珊,王小群,卢梅.基于Applet和Servlet的机械设计网上实验软件设计[J].仪器仪表用户,2005,12(3):101-102.
-
8郭晔.基于Agent的智能个性化信息检索系统模型研究[J].微电子学与计算机,2005,22(6):210-213. 被引量:12
-
9王松涛,岳丽华.基于J2EE架构的纺织品业务信息系统的设计与实现[J].工业控制计算机,2005,18(8):45-46.
-
10韦加强,潘荫荣.基于J2EE平台和MVC模型的电子政务系统的设计[J].信息技术,2005,29(8):49-51. 被引量:3
-
1刀刀疤.快速运行 让程序分门别类[J].网友世界,2009(16):44-44.
-
2曹春华.网页图片,分类保存一键定[J].电脑知识与技术(经验技巧),2013(10):110-110.
-
3夏通,宋艳,叶吉超.基于图像匹配算法的智能视频监控抓图系统[J].电世界,2017,58(3):28-30.
-
4黄华.软件下载网的设计[J].中国科技博览,2015,0(29):310-310.
-
5郭金艳,沈精虎,张岐家.基于自顶向下的直角坐标机器人设计库的开发[J].机械,2015,42(8):40-43.
-
6风雨彩虹.吃尽网络文章管好系统资源[J].网友世界,2007(6):24-25.
-
7文渊.找个密码好管家[J].计算机与网络,2001,0(9):12-12.
-
8寿晓蕾.一个常被遗忘的角落——附件(二) 菜鸟也来当导演[J].电脑爱好者(普及版),2007,0(11):9-11.
-
9杨兴平.用Resplendent Registrar管理注册表技巧[J].大众软件,2005(18):68-69.
-
10无人喝彩.海量音乐轻松分类[J].电脑迷,2008,0(10):77-77.