前言 1
第1章 绪论 1
引言 1
多智能体系统与自治智能体 2
多智能体系统 2
自治智能体 3
多智能体的环境 5
自治智能体研究的基本问题 5
相关研究领域 8
多智能体强化学习 9
单智能体的强化学习 10
马尔可夫决策过程 11
Q学习 12
多智能体环境下的强化学习 13
多智能体的博弈学习 14
博弈学习的基本概念 14
多智能体博弈学习方法 17
交易代理体的自动协商 22
研究内容 22
性能评价 23
模型分类 24
研究方法 25
第2章 基于多智能体学习的电子市场定价 29
引言 29
基于内省推理的虚拟行动学习 31
老练学习 31
协调博弈 32
从协调博弈得到的启示 33
基于内省推理的博弈学习方法 34
实例验证与仿真 39
协调博弈实例验证 39
少数者博弈 40
经典协调博弈 42
电子市场智能定价 43
具有多个吸收状态的Q学习 43
电子市场定价的马尔可夫博弈模型 46
基于强化学习的定价算法 48
基于IIFPWL的定价算法仿真 53
定价算法的实际应用 55
相关工作 57
本章小结 58
第3章 配货电子市场的多智能体合作学习 59
引言 59
基于黑板模型的多智能体合作学习 60
一个例子 60
基于黑板模型的多智能体学习 61
格子世界仿真 63
BBMML算法的收敛性 65
BBMML算法的改进 66
基于进化算法的多智能体学习 67
进化的BBMML 67
进化的BBMML仿真 69
基于状态空间划分的多智能体在线学习 71
Q表的泛化 71
通信原语 72
操作原语 73
SSPML算法 74
SSPML仿真 75
配货电子市场的合作学习 77
相关工作 79
本章小结 79
第4章 基于市场机制的多智能体协商模型 81
引言 81
问题描述及预备知识 82
电子市场原料配置问题 82
资源分配问题的价格机制求解 84
基于市场价格机制的协商模型 86
基于市场价格机制的协商 86
MMN仿真 89
基于边际效用的定价方法 91
基于边际效用的定价方法 92
MUMMN仿真 95
具有预动行为的动态原料配置 96
污染治理市场的应用实例 97
引言 97
问题描述和形式化分析 98
完全信息环境下的污染治理 99
不完全信息环境下的污染治理 100
本章小结 101
第5章 基于自适应模糊推理的交易智能体协商 103
引言 103
连续的双向拍卖协议 104
交易智能体的模糊规则 105
Sugeno控制器及其扩展 105
卖方智能体的模糊规则 105
卖方智能体的模糊规则 107
交易智能体的自适应模糊推理 108
仿真实验 110
本章小结 112
第6章 基于模糊约束规划模型的商品搜索引擎 113
引言 113
模糊约束求解问题 115
带优先级的模糊约束问题 115
带模糊语言变量的PFCSP 117
PFCSP的规划模型及其求解 120
PFCSP问题的规划模型 120
卖方效用函数的BP神经网络拟合 121
PFCSP求解的混合智能算法 122
PFCSP及其规划模型的性质 124
协商模型 127
交易智能体的形式化定义 127
交易智能体的协商过程 129
协商模型的性质 132
相关工作 134
本章小结 136
第7章 基于模糊相似关系的自动协商系统 137
预备知识 137
效用函数 137
模糊相似函数 138
启发式协商算法 138
仿真验证 140
本章小结 142
第8章 基于粗糙集的交易知识获取方法 143
Rough集知识约简基本概念 144
可变精度rough集理论 145
基于辨识矩阵的属性约简算法 146
基于可变精度rough集模型的属性值约简方法 147
将约简规则转变为模糊约束 149
第9章 基于多智能体的电子市场联盟问题 151
引言 151
结伴购买的博奕策略 152
模型及其分析 152
结盟的信用机制 153
算法及其分析 154
买方智能体结盟的利益分配及其结盟策略 155
联盟内利益分配 155
结盟策略 157
仿真实验 158
多智能体结盟博弈问题的演化算法 160
引言 160
资源结盟博弈 161
遗传算法 163
仿真实验与结果分析 167
第10章 基于智能体的供应商选择策略 170
引言 170
Gittins吸引子 170
供应商选择问题 171
问题描述 171
引入购买概率 172
商品价格不同的情形 172
引入信用学习机制 173
方法及算例 173
方法 173
算例 174
参考文献 176