网络机器人Java编程指南

网络机器人Java编程指南
作 者: Jeff Heaton 童兆丰 童兆丰
出版社: 电子工业出版社
丛编项: 计算机网络技术
版权说明: 本书为公共版权或经版权方授权,请支持正版图书
标 签: Java
ISBN 出版时间 包装 开本 页数 字数
未知 暂无 暂无 未知 0 暂无

作者简介

暂缺《网络机器人Java编程指南》作者简介

内容简介

这是一本研究如何实现具有Web访问能力的网络机器人的书。该书从Internet编程的基本原理出发,深入浅出、循序渐进地阐述了网络机器人程序Spider、Bot、Aggregator的实现技术,并分析了每种程序的优点及适用场合。本书提供了大量的有效源代码,并对这些代码进行了详细的分析。通过本书的介绍,你可以很方便地利用这些技术,设计并实现网络蜘蛛或网络信息搜索器等机器人程序。本书通俗易懂,适合于具有一定Java编程基础的软件开发人员阅读,也可供Web开发人员作为技术参考资料使用。

图书目录

目 录

第1章 Java套接字编程技术

套接字家族

网络编程

Java I/O编程技术

代理的问题

Java中的套接字编程

客户端套接字

服务器套接字

小结

第2章 分析超文本传输协议

地址格式

使用套接字进行HTTP编程

Bot包的HTTP类组

实现细节

小结

第3章 通过HTTPS访问加密站点

HTTP与HTTPS

通过Java使用HTTPS

HTTP用户认证

安全访问

实现细节

小结

第4章 解析HTML

使用HTML

Bot关心的标签

需要特殊处理的HTML

使用Bot类解析HTML

使用Swing类解析HTML

Bot包HTML解析例子

实现细节

小结

第5章 发送表单

使用表单

用于普通发送的Bot类

实现细节

小结

第6章 解释数据

CSV文件的结构

QIF文件的结构

XML文件格式

小结

第7章 探索Cookie

分析Cookie

用于Cookie处理的Bot类

实现细节

小结

第8章 编写Spider程序

网站的结构

Spider程序的结构

构造Spider程序

小结

第9章 编写大型Spider程序

多线程

用Java实现多线程

线程同步

使用数据库

高性能的Spider程序

实现细节

小结

第10章 编写Bot程序

构造典型的Bot程序

使用CatBot程序

CatBot实例

实现细节

小结

第11章 编写Aggregator程序

在线汇总与离线汇总

构造底层Bot

构造气象Aggregator程序

小结

第12章 负责任地使用Bot程序

与网站协商

Web站点管理员的措施

负责任的Spider程序

实现细节

小结

第13章 Bot程序的未来

Internet信息的传送

理解XML

传送XML数据

Bot和SOAP

小结

附录A Bot包

附录B 各种与HTTP相关的字符

附录C 故障诊断

附录D 安装Tomcat系统

附录E 在Windows下编译实例

附录F 在Unix下编译实例

附录G 重新编译Bot包

术语表