第1章 Java套接字编程技术 1
套接字家族 1
网络编程 2
Java I/O编程技术 8
代理的问题 14
Java中的套接字编程 16
客户端套接字 17
服务器套接字 29
小结 35
第2章 分析超文本传输协议 36
地址格式 36
使用套接字进行HTTP编程 40
Bot包的HTTP类组 49
实现细节 61
小结 69
第3章 通过HTTPS访问加密站点 70
HTTP与HTTPS 70
通过Java使用HTTPS 71
HTTP用户认证 75
安全访问 80
实现细节 89
小结 97
使用HTML 98
第4章 解析HTML 98
Bot关心的标签 100
需要特殊处理的HTML 104
使用Bot类解析HTML 107
使用Swing类解析HTML 108
Bot包HTML解析例子 113
实现细节 130
小结 141
第5章 发送表单 142
使用表单 142
用于普通发送的Bot类 147
实现细节 161
小结 165
第6章 解释数据 166
CSV文件的结构 166
QIF文件的结构 171
XML文件格式 178
小结 187
第7章 探索Cookie 189
分析Cookie 189
用于Cookie处理的Bot类 203
实现细节 204
小结 210
第8章 编写Spider程序 211
网站的结构 211
Spider程序的结构 214
构造Spider程序 217
小结 236
第9章 编写大型Spider程序 238
多线程 238
用Java实现多线程 239
线程同步 242
使用数据库 245
高性能的Spider程序 251
实现细节 252
小结 281
第10章 编写Bot程序 282
构造典型的Bot程序 282
使用CatBot程序 296
CatBot实例 300
实现细节 305
小结 321
第11章 编写Aggregator程序 322
在线汇总与离线汇总 322
构造底层Bot 323
构造气象Aggregator程序 329
小结 333
第12章 负责任地使用Bot程序 334
与网站协商 334
Web站点管理员的措施 339
负责任的Spider程序 341
实现细节 354
小结 358
第13章 Bot程序的未来 360
Internet信息的传送 360
理解XML 361
传送XML数据 364
Bot和SOAP 367
小结 368
附录 369
附录A Bot包 369
附录B 各种与HTTP相关的字符 382
附录C 故障诊断 392
附录D 安装Tomcat系统 398
附录E 在Windows下编译实例 402
附录F 在Unix下编译实例 407
附录G 重新编译Bot包 410
术语表 412