第1章 绪论 1
1.1 对基于Agent的计算的认识 1
1.2 基于Agent的计算研究进展 3
1.2.1 基于Agent计算的思维状态模型 4
1.2.2 多Agent协调、协商与合作求解 11
1.2.3 Agent组织 16
1.2.4 MAS的社会性 21
1.2.5 多Agent形式语义方法 23
1.2.6 MAS拍卖 25
1.2.7 面向Agent的程序设计语言 29
1.2.8 测试床与应用系统 34
1.3 本书各章的组织 37
第2章 个体Agent模型 43
2.1 概述 43
2.2 Agent的BDI模型 45
2.2.1 语法定义 45
2.2.2 语义模型 46
2.2.3 语义解释 47
2.2.4 信念、愿望和意图 48
2.2.5 动态BDI模型 53
2.3 Agent的BDI效用模型 55
2.3.1 直观分析 55
2.3.2 语言和语法 56
2.3.3 语义 57
2.3.4 模型性质公理 60
2.3.5 BEL,GOAL和INTEND关系公理 60
2.3.6 模型实现分析 61
2.4 并发Agent的模型 63
2.4.1 语法 63
2.4.2 语义模型 64
2.4.3 模型基本性质 67
2.4.4 举例 68
2.5 并发Agent的操作模型 69
2.5.1 π-演算 69
2.5.2 直观含义 70
2.5.3 模型定义 70
2.5.4 并发Agent内核语言 75
2.5.5 举例 77
2.6 小结 80
第3章 群体Agent的社会模型 83
3.1 概述 83
3.2 社会Agent的BDO模型 87
3.2.1 MAS的分层模型 87
3.2.2 承诺、意图和义务 87
3.2.3 语法定义 88
3.2.4 语义模型 90
3.2.5 基本性质 92
3.2.6 群体现象 95
3.2.7 举例 95
3.2.8 模型对比分析 96
3.3 计算Agent的社会模型 98
3.3.1 模型 98
3.3.2 重构 102
3.4 BDO Agent和MAS结构设计 106
3.4.1 分析 106
3.4.2 MAS的概念层次 107
3.4.3 BDO Agent结构 109
3.4.4 BDO Script和Robocup的部分描述 111
3.5 小结 113
第4章 多Agent系统协商方法 115
4.1 概述 115
4.2 MAS的一种动态行为 118
4.2.1 收益函数与理性假设 119
4.2.2 Agent的理性与系统行为 121
4.2.3 最小理性假设下的系统行为 122
4.2.4 分离理性假设下的系统行为 122
4.2.5 惟一理性假设下的系统行为 124
4.2.6 举例 124
4.3 多Agent协商算法 125
4.3.1 Agent的意图与Pareto*理性 127
4.3.2 多Agent协商算法 134
4.3.3 举例 142
4.4 多Agent多遇学习协调方法 145
4.4.1 Nash平衡 147
4.4.2 0历史学习方法 149
4.4.3 1历史学习方法 152
4.4.4 ∞历史学习方法 154
4.4.5 δ历史学习方法 158
4.5小结 160
第5章 Agent对抗 163
5.1 概述 163
5.2 基于BDI的对手模型 166
5.2.1 对手模型 167
5.2.2 跟踪算法 168
5.2.3 算法分析 170
5.2.4 算法推广 171
5.2.5 实验分析 172
5.3 个体对抗 174
5.3.1 Agent通信 174
5.3.2 KQML的语义 176
5.3.3 基于对手模型的协商算法 179
5.3.4 基于对手模型的欺骗算法 180
5.3.5 对抗策略 185
5.3.6 实验分析 185
5.4 群体对抗 186
5.4.1 群体意图的表示 187
5.4.2 群体意图的生成与执行过程 189
5.4.3 群体意图跟踪算法 191
5.4.4 实验分析 194
5.5 小结 196
第6章 多Agent系统的语义模型 199
6.1 概述 199
6.2 Agent组织形成的形式描述和语义 202
6.2.1 化学抽象机 202
6.2.2 Agent组织结构的设计 203
6.2.3 Agent组织结构设计的形式描述 204
6.2.4 Agent组织结构设计过程的形式语义 206
6.3 受限AGENT0的操作语义 208
6.3.1 AGENT0语言 208
6.3.2 约定和假设 209
6.3.3 基于π-演算的受限AGENT0操作语义 210
6.3.4 受限AGENT0的CAM语义 214
6.3.5 讨论 216
6.4 多Agent信念逻辑的Aumann语义 216
6.4.1 MBL的Kripke语义与广义Aumann语义 216
6.4.2 MPBL及概率Aumann语义 221
6.5 概率信念逻辑的概率模态语义及完备性 227
6.5.1 正规概率模态语义 227
6.5.2 PBLω的概率模态语义及完备性 229
6.5.3 PBL?的概率模态语义及弱完备性 234
6.6 多Agent系统形式规范中的进程演算 239
6.6.1 基于内部选择的CCS系统及弱互模拟的同余性 239
6.6.2 基于并行动作的π-演算及强互模拟的同余性 247
6.6.3 传递知识的进程演算 259
6.7 小结 264
第7章 Agent的个性模型 265
7.1 概述 265
7.2 个性的定义 266
7.3 具有个性的Agent结构 267
7.3.1 结构描述 267
7.3.2 目标实现机制 268
7.4 交互与组织 270
7.4.1 交互 270
7.4.2 组织 270
7.5 具有个性的行为网络 271
7.5.1 行为网络描述 271
7.5.2 活性传播计算 272
7.5.3 活动选择 273
7.6 小结 273
第8章 Agent组织与联盟 275
8.1 概述 275
8.2 基于思维状态传递的组织表示 277
8.2.1 利用思维传递函数描述Agent关系 277
8.2.2 组织描述 279
8.2.3 组织表示的应用 280
8.3 Agent组织的递归模型 281
8.3.1 Agent组织结构的递归模型 282
8.3.2 模型分析 283
8.3.3 Agent组织的形成 286
8.3.4 用递归模型描述Agent组织 286
8.4 一种基于π-演算的Agent组织模型 288
8.4.1 角色和组织框架 289
8.4.2 组织形成过程举例 292
8.4.3 组织动作的思维状态效果 294
8.4.4 实验分析和算法实现 295
8.4.5 讨论 297
8.5 Agent组织的承诺机制 298
8.5.1 多Agent系统的承诺 298
8.5.2 Agent组织的承诺关系 299
8.5.3 承诺的语法和语义 300
8.5.4 承诺的性质 302
8.5.5 基于承诺的组织形成 303
8.5.6 举例 305
8.6 面向结构的组织形成 306
8.6.1 组织描述框架 306
8.6.2 面向结构的Agent组织形成方法 308
8.6.3 举例 312
8.7 联盟演化机制 313
8.7.1 问题的描述与分析 313
8.7.2 联盟等价性 314
8.7.3 联盟演化 315
8.7.4 基于组织论的演化机制 317
8.8 小结 319
第9章 Agent社会 321
9.1 概述 321
9.2 基于信念-愿望-意图和效用的社会承诺机制 324
9.2.1 基本框架 324
9.2.2 社会承诺的决策和通信机制 326
9.2.3 社会承诺过程 328
9.2.4 举例 331
9.3 基于市场模型的MAS社会规范 331
9.3.1 Coleman的社会理论 332
9.3.2 规范的定义 335
9.3.3 权利分配、规范的制定和废除 337
9.3.4 对称利益形势下的共同禁止规范 339
9.3.5 举例 340
9.4 Agent行为规范 343
9.4.1 一种行为规范框架 343
9.4.2 基于人工神经网络的规范机制 345
9.4.3 规范效益与应用分类 348
9.4.4 实验分析 349
9.5 小结 351
第10章 多Agent系统拍卖方法 353
10.1 概述 353
10.2 一种拍卖模型 358
10.2.1 模型 358
10.2.2 拍卖方法的评价标准 359
10.3 一种边际效用递减的组合拍卖求解算法 360
10.3.1 组合拍卖模型 361
10.3.2 物品分配算法 362
10.3.3 基于多物品不可转移检查算法的分析 365
10.4 一种多属性拍卖方法 366
10.4.1 多属性拍卖模型 367
10.4.2 多属性拍卖MAV 367
10.4.3 MAV的评价 371
10.5 小结 373
第11章 多Agent系统合作求解方法 375
11.1 概述 375
11.2 基于BDI的多Agent交互 379
11.2.1 语法定义 379
11.2.2 语义模型 380
11.2.3 语义解释 381
11.2.4 单Agent间的BDI 382
11.2.5 社会承诺和联合意图 384
11.2.6 合作的形成过程 387
11.3 多Agent系统的一种合作机制 389
11.3.1 面向任务域TOD 389
11.3.2 测试床结构和交互流程 390
11.3.3 合作交互策略 391
11.3.4 实验分析 394
11.4 群体Agent合作求解的逻辑模型 396
11.4.1 语法和语义模型 397
11.4.2 公理 399
11.4.3 群体Agent合作求解过程 400
11.4.4 举例 404
11.5 群体Agent合作策略的表示与评估 406
11.5.1 基于影响图的群体Agent合作求解模型 406
11.5.2 情景演算语言——ConGolog 408
11.5.3 评估算法 409
11.5.4 举例 412
11.5.5 讨论 413
11.6 小结 415
第12章 多Agent学习 417
12.1 概述 417
12.2 多Agent Markov对策中的再励学习 421
12.2.1 再励学习与Markov对策 421
12.2.2 多Agent Markov对策再励学习算法 423
12.2.3 学习算法的收敛性 424
12.2.4 实验分析 426
12.3 Agent组织规则的再励学习 428
12.3.1 组织规则学习环境与算法 428
12.3.2 算法改进 431
12.3.3 实验分析 433
12.4 一种基于角色跟踪的群体Agent再励学习 434
12.4.1 群体Agent学习模型 434
12.4.2 基于角色跟踪的再励学习算法 436
12.4.3 再励学习算法的评价标准 437
12.4.4 实验分析 438
12.5 一种基于特征向量提取的FMDP模型求解方法 440
12.5.1 FMDP模型和线性规划 440
12.5.2 状态特征向量 442
12.5.3 线性规划的近似求解 443
12.5.4 举例 446
12.5.5 基于状态特征向量的再励学习算法 447
12.5.6 实验分析 449
12.6 小结 451
第13章 Agent平台与测试床 453
13.1 概述 453
13.2 多Agent动态交互测试床 456
13.2.1 多Agent篇章理解 456
13.2.2 类市场体系结构 457
13.2.3 TUMIT的类自由市场体系结构 458
13.2.4 理论框架与算法 463
13.2.5 实验分析 469
13.2.6 TUMIT分析 473
13.3 交易市场测试床 475
13.3.1 信息物品分析 475
13.3.2 iMarket测试床 477
13.3.3 实验分析 480
13.3.4 买方合作竞标实验 483
13.4 多Agent系统实验环境 485
13.4.1 MAS/TH-4的系统结构 485
13.4.2 虚拟分布计算环境VDCE 486
13.4.3 资源管理Agent和通信管理Agent 492
13.4.4 多Agent篇章理解系统 493
13.5 测试床TH-Soccer和MAS/TH-5 498
13.5.1 TH-Soccer测试床 498
13.5.2 MAS/TH-5测试床 501
13.6 小结 508
第14章 Agent技术应用 511
14.1 概述 511
14.2 工业生产中的Agent 516
14.2.1 Agent技术应用的共同问题 516
14.2.2 产品设计Agent 517
14.2.3 计划与日程安排Agent 519
14.3 信息检索和管理Agent 520
14.3.1 个人信息Agent 520
14.3.2 Web Agent 521
14.3.3 多Agent信息检索系统 522
14.4 Agent技术的适用性 523
14.5 小结 525
参考文献 527
附录 Robocup的部分描述 565