《网络机器人Java编程指南》PDF下载

  • 购买积分:14 如何计算积分?
  • 作  者:(美)Jeff Heaton著;童兆丰等译
  • 出 版 社:北京:电子工业出版社
  • 出版年份:2002
  • ISBN:750537740X
  • 页数:420 页
图书介绍:

第1章 Java套接字编程技术 1

套接字家族 1

网络编程 2

Java I/O编程技术 8

代理的问题 14

Java中的套接字编程 16

客户端套接字 17

服务器套接字 29

小结 35

第2章 分析超文本传输协议 36

地址格式 36

使用套接字进行HTTP编程 40

Bot包的HTTP类组 49

实现细节 61

小结 69

第3章 通过HTTPS访问加密站点 70

HTTP与HTTPS 70

通过Java使用HTTPS 71

HTTP用户认证 75

安全访问 80

实现细节 89

小结 97

使用HTML 98

第4章 解析HTML 98

Bot关心的标签 100

需要特殊处理的HTML 104

使用Bot类解析HTML 107

使用Swing类解析HTML 108

Bot包HTML解析例子 113

实现细节 130

小结 141

第5章 发送表单 142

使用表单 142

用于普通发送的Bot类 147

实现细节 161

小结 165

第6章 解释数据 166

CSV文件的结构 166

QIF文件的结构 171

XML文件格式 178

小结 187

第7章 探索Cookie 189

分析Cookie 189

用于Cookie处理的Bot类 203

实现细节 204

小结 210

第8章 编写Spider程序 211

网站的结构 211

Spider程序的结构 214

构造Spider程序 217

小结 236

第9章 编写大型Spider程序 238

多线程 238

用Java实现多线程 239

线程同步 242

使用数据库 245

高性能的Spider程序 251

实现细节 252

小结 281

第10章 编写Bot程序 282

构造典型的Bot程序 282

使用CatBot程序 296

CatBot实例 300

实现细节 305

小结 321

第11章 编写Aggregator程序 322

在线汇总与离线汇总 322

构造底层Bot 323

构造气象Aggregator程序 329

小结 333

第12章 负责任地使用Bot程序 334

与网站协商 334

Web站点管理员的措施 339

负责任的Spider程序 341

实现细节 354

小结 358

第13章 Bot程序的未来 360

Internet信息的传送 360

理解XML 361

传送XML数据 364

Bot和SOAP 367

小结 368

附录 369

附录A Bot包 369

附录B 各种与HTTP相关的字符 382

附录C 故障诊断 392

附录D 安装Tomcat系统 398

附录E 在Windows下编译实例 402

附录F 在Unix下编译实例 407

附录G 重新编译Bot包 410

术语表 412