《用户体验度量 量化用户体验的统计学方法》PDF下载

  • 购买积分:11 如何计算积分?
  • 作  者:(美)JeffSauro,(美)JamesR.Lewis著
  • 出 版 社:北京:机械工业出版社
  • 出版年份:2014
  • ISBN:9787111459040
  • 页数:282 页
图书介绍:本书共10章,第1章综述全书,概要分析了本书组织结构和特点;第2章综述量化用户研究常用方法的背景知识和方法,涉及用户研究、数据、可用性测试、需求收集等;第3章深入分析如何汇总数据及计算误差幅度,涉及完成率的置信区间、等级量表、连续性数据的置信区间等;第4章和第5章分别阐述了在进行基准比较和组间比较时如何判定是否存在统计显著的差异;第6章和第7章从总结性研究和形成性研究两个方面阐释如何找到适合研究的样本量;第8章广泛讨论标准化可用性的问卷;针对持久的统计争论的讨论第9章提出用户研究者应该为他们的分析进行有力辩护;第10章提供更多与用户研究相关的统计学信息。

第1章 导论 1

1.1简介 1

1.2本书的组织结构 1

1.3如何使用本书 2

1.3.1应该使用何种检验 2

1.3.2我需要多大的样本量 5

1.3.3你不必手动计算 6

1.4本章要点 7

1.5本章思考题 7

1.6参考资料 8

第2章 量化用户研究 9

2.1什么是用户研究 9

2.2用户研究的数据 9

2.3可用性测试 10

2.3.1样本量 10

2.3.2代表性和随机性 10

2.3.3数据收集 12

2.3.4任务完成率 12

2.3.5可用性问题 13

2.3.6任务时间 14

2.3.7出错数 14

2.3.8满意度评分 14

2.3.9复合分数 14

2.4 A/B测试 15

2.5调查数据 15

2.5.1等级量表 15

2.5.2净推荐值 16

2.5.3评论和开放性数据 16

2.6需求收集 16

2.7本章要点 17

2.8参考资料 17

第3章 我们的估算到底有多准确 19

3.1简介 19

3.1.1置信区间=误差幅度的两倍 19

3.1.2置信区间提供了精确度和位置 20

3.1.3置信区间的三个组成部分 20

3.2完成率的置信区间 20

3.2.1置信区间的历史 21

3.2.2 Wald区间:对于小样本来说就太不靠谱了 21

3.2.3精确置信区间 22

3.2.4 Wald校正区间:增加两个成功与两个失败 22

3.2.5完成率的最佳点估计 24

3.2.6遭遇可用性问题的置信区间 26

3.3等级量表和其他连续性数据的置信区间 26

3.3.1任务时长数据的置信区间 29

3.3.2任务时长均值还是任务时长中位数 30

3.3.3几何均值 30

3.3.4大样本任务时长的置信区间 32

3.3.5围绕中位数的置信区间 33

3.4本章要点 34

3.5本章思考题 35

3.6参考资料 36

第4章 我们达到或超过目标了吗 38

4.1简介 38

4.2单侧检验和双侧检验 40

4.3完成率与基准的比对 41

4.3.1小样本检验 42

4.3.2大样本检验 44

4.4满意度分数与基准的比对 46

4.5任务时间和基准的比对 50

4.6本章要点 54

4.7本章思考题 54

4.8参考资料 57

第5章 不同设计之间有统计学差异吗 59

5.1简介 59

5.2比较两个平均值(等级量表和反应时) 59

5.2.1被试内设计比较——配对t检验 60

5.2.2比较任务时长 62

5.2.3组间比较(双样本t检验) 64

5.2.4 t检验的假设 68

5.3比较完成率、转换率以及A/B测试 69

5.3.1组间比较 69

5.3.2组内比较 78

5.4本章要点 86

5.5本章思考题 88

5.6参考资料 94

第6章 我们需要多大的样本量 第一部分:总结性研究 95

6.1简介 95

6.1.1我们为何要关注 95

6.1.2可用性研究的类型至关重要 96

6.1.3总结性可用性测试样本量预估的基本原则 96

6.2预估数值 97

6.3比较数值 104

6.4如何控制变异性 109

6.5二项置信区间样本量的估计 110

6.5.1大样本的二项样本量估计 110

6.5.2小样本的二项样本量估计 112

6.5.3与基准比例相比较的样本量 115

6.6卡方检验的样本量预估(独立比例) 117

6.7 MCNEMAR精确检验的样本预估(配对比例) 120

6.8本章要点 123

6.9本章思考题 124

6.10参考资料 130

第7章 我们需要多大的样本量第二部分:形成性研究 131

7.1简介 131

7.2使用发现问题的概率模型来估计形成性用户研究的样本量 131

7.2.1著名方程:P(x≥1) =1-(1 -P)n 131

7.2.2从1-(1 -P)n中推导出样本量估计方程 133

7.2.3使用表格计划形成性用户研究样本量 135

7.3二项概率模型的假设 136

7.4模型的附加应用 137

7.4.1估计多重问题或其他事件的复合P值 137

7.4.2校正小样本P的复合估计值 138

7.4.3估计可发现的问题数和未被发现的问题数 143

7.5影响P值的是什么 144

7.6什么是合理的目标问题发现率 145

7.7调解“神奇的数字5”和“8还不够” 147

7.7.1一段历史:20世纪80年代 147

7.7.2又一段历史:20世纪90年代 148

7.7.3“神奇的数字5”的起源 149

7.7.4 “8还不够”:一个调解方法 151

7.8更多关于二项概率公式和其小样本校正 155

7.8.1二项概率公式的起源 155

7.8.2紧缩校正是如何起作用的 156

7.9针对问题发现的其他统计模型 159

7.9.1对问题发现使用二项式模型的批评 159

7.9.2扩展的二项式模型 160

7.9.3 Capture-recapture模型 161

7.9.4在计划形成性用户研究时为什么不用其他模型 161

7.10本章要点 165

7.11本章思考题 166

7.12参考资料 168

第8章 标准化的可用性问卷 171

8.1简介 171

8.1.1什么是标准化的问卷 171

8.1.2标准化可用性问卷的优点 171

8.1.3什么样的标准化可用性问卷是有用的 172

8.1.4标准化问卷的质量评估:信度、效度和灵敏度 173

8.1.5问卷的步距数 174

8.2整体评估问卷 174

8.2.1 QUIS(用户交互满意度问卷) 175

8.2.2 SUMI(软件可用性测试问卷) 176

8.2.3 PSSUQ 178

8.2.4 SUS(软件可用性问卷) 182

8.2.5可用性整体评估问卷的实验比较 194

8.3任务评估问卷 197

8.3.1场景后问卷 197

8.3.2单项难易度问卷 198

8.3.3主观脑力负荷问题 198

8.3.4期望评级 199

8.3.5可用性等级评估 201

8.3.6任务评估问卷的实验比较 203

8.4网站感知可用性的评估问卷 205

8.4.1网站分析和测量问卷 206

8.4.2标准通用的百分等级问卷 207

8.4.3其他评估网站的问卷 209

8.5其他有趣的问卷 210

8.5.1计算机系统可用性问卷 210

8.5.2有用性、满意度、易用性 211

8.5.3用户经验的可用性度量 211

8.5.4享受性质量 212

8.5.5美国消费者满意度指标 213

8.5.6净推荐值 213

8.5.7福雷斯特客户体验指数 215

8.5.8技术接受模型 215

8.6本章要点 216

8.7本章思考题 217

8.8参考资料 220

第9章 测量和统计的六大持久论战 224

9.1介绍 224

9.2对多点量表数据进行平均合理吗 225

9.2.1一方观点 225

9.2.2另一方观点 226

9.2.3我们的推荐 228

9.3需要测试至少30名用户吗 229

9.3.1一方观点 229

9.3.2另一方观点 230

9.3.3我们的推荐 231

9.4所有的实验都要进行双侧检验吗 231

9.4.1一方观点 231

9.4.2另一方观点 232

9.4.3我们的推荐 233

9.5当P>0.05时,我们能拒绝原假设吗 233

9.5.1一方观点 233

9.5.2另一方观点 234

9.5.3我们的推荐 235

9.6能将各种可用性度量指标合并到一个分数中吗 236

9.6.1一方观点 236

9.6.2另一方观点 238

9.6.3我们的推荐 239

9.7假使你需要进行多次检验该怎么办 239

9.7.1一方观点 239

9.7.2另一方观点 241

9.7.3我们的推荐 241

9.8本章要点 245

9.9本章思考题 246

9.10参考资料 249

第10章 总结 251

10.1简介 251

10.2更多信息 251

10.3好运 254

10.4本章要点 254

10.5参考资料 254

附录A 基础统计概念速成 255