数据天才 数据科学家修炼之道PDF电子书下载
- 电子书积分:12 积分如何计算积分?
- 作 者:(美)文森特·格兰维尔(Vincent Granville)著;吴博,张晓峰,季春霖译
- 出 版 社:北京:电子工业出版社
- 出版年份:2017
- ISBN:7121308833
- 页数:331 页
第1章 数据科学是什么 1
真伪数据科学对比 2
伪数据科学的两个例子 5
新大学的面貌 7
数据科学家 10
数据科学家与数据工程师 10
数据科学家与统计学家 12
数据科学家与业务分析师 13
13个真实世界情景中的数据科学应用 14
情景1:国家对烈性酒销售的垄断结束后,DUI(酒后驾驶)逮捕量减少 15
情景2:数据科学与直觉 17
情景3:数据故障将数据变成乱码 19
情景4:异常空间的回归 21
情景5:分析与诱导在提升销量上有何不同价值 22
情景6:关于隐藏数据 24
情景7:汽油中的铅会导致高犯罪率。真的吗 25
情景8:波音787(梦幻客机)问题 26
情景9:NLP的7个棘手句子 27
情景10:数据科学家决定着我们所吃的食品 28
情景11:用较好的相关性增加亚马逊的销售量 30
情景12:检测Facebook上的假档案或假“喜欢”数 32
情景13:餐厅的分析 33
数据科学的历史、开拓者和现代趋势 33
统计学将会复兴 34
历史与开拓者 36
现代的趋势 38
最近的问答讨论 40
总结 44
第2章 大数据的独特性 45
两个大数据的问题 45
大数据“诅咒” 45
数据快速流动问题 50
大数据技术示例 56
大数据问题是数据科学所面临挑战的缩影 56
大规模数据集的聚类和分类 58
1亿行的Excel 63
MapReduce不能做什么 67
问题 67
3种解决方案 68
结论:何时使用MapReduce 69
沟通问题 70
数据科学:统计学的终结 72
8种最差的预测建模技术 72
把计算机科学、统计学和行业专业知识结合在一起 74
大数据生态系统 78
总结 79
第3章 成为一名数据科学家 80
数据科学家的主要特征 80
数据科学家的职能 80
横向与纵向数据科学家 83
数据科学家的类型 86
伪数据科学家 86
自学成才的数据科学家 86
业余数据科学家 87
极限数据科学家 89
数据科学家人群特征 90
数据科学方面的培训 91
大学课程 91
公司和协会培训项目 95
免费培训项目 96
数据科学家职业道路 98
独立顾问 98
创业者 105
总结 118
第4章 数据科学的技术(Ⅰ) 119
新型指标 120
优化数字营销活动的指标 121
欺诈检测的指标 122
选择合适的分析工具 124
分析软件 124
可视化工具 125
实时产品 126
编程语言 128
可视化 128
用R生成数据视频 129
更复杂的视频 133
无模型的统计建模 134
无模型的统计建模是什么 135
该算法是如何工作的 135
源代码生成数据集 137
三类指标:中心性、波动性、颠簸性 137
中心性、波动性和颠簸性之间的关系 138
定义颠簸性 138
在Excel中计算颠簸性 139
使用颠簸系数 141
大数据的统计聚类 141
大数据的相关性和拟合度 143
一系列新的秩相关性 146
渐近分布与归一化 148
计算复杂度 152
计算q(n) 152
理论上的解决方案 155
结构系数 156
确定簇的数量 157
方法 157
例子 158
网络拓扑映射 159
安全通信:数据加密 163
总结 166
第5章 数据科学的技术(Ⅱ) 167
数据字典 168
什么是数据字典 168
建立数据字典 169
隐性决策树 169
实现方法 171
示例:互联网流量打分 173
结论 175
与模型无关的置信区间 175
方法 175
分析桥第一定理 176
应用 177
源代码 178
随机数 179
解决问题的4个办法 181
拥有超强直觉能力的业务分析师的直观法 182
软件工程师的蒙特卡洛模拟法 182
统计学家的统计建模方法 183
计算机科学家的大数据方法 183
因果关系和相关性 183
怎样检测因果关系 184
数据科学项目的生命周期 186
预测模型的错误 189
逻辑相关回归 191
变量之间的相互作用 191
一阶近似 191
二阶近似 193
用Excel进行回归分析 195
实验设计 196
有趣的指标 196
把患者分成不同的人群进行治疗 196
私人定制的治疗 197
分析即服务和应用程序接口 198
工作原理 199
实施案例 199
关键词相关的API的源代码 200
其他主题 204
当数据库改变时,保存好数值 204
优化网络爬虫 205
哈希连接 206
用于模拟簇的简单源代码 207
Hadoop和大数据的新型合成方差 208
Hadoop和MapReduce的介绍 208
综合指标 209
Hadoop、数值的和统计的稳定性 210
方差的抽象概念 211
一个新的大数据定理 213
平移不变性的度量标准 214
实现:通信和计算成本 214
最终意见 215
总结 215
第6章 数据科学应用案例研究 217
股票市场 217
使回报率提高500%的模式 217
优化统计交易策略 220
股票交易的API:统计模型 222
股票交易的API:具体实现 225
股票市场模拟 226
些许数学知识 229
新趋势 231
加密 232
数据科学应用:隐写术 232
好的电子邮件加密 236
验证码破解 239
欺诈检测 240
点击欺诈 241
连续点击评分与二进制欺诈/非欺诈 242
数学模型与基准 244
虚假转化产生的偏差 245
一些误解 246
统计面临的挑战 246
点击评分优化关键词出价 247
组合优化自动快速的特征选择 249
特征的预测能力:交叉验证 250
勾连检测和僵尸网络的关联规则检测 254
模式检测的极值理论 255
数字分析 256
在线广告:到达率和频率的计算公式 256
电子邮件营销:提高300%的性能 257
在7天内优化关键词广告宣传活动 258
自动新闻提要优化 260
用bit.ly进行竞争情报分析 261
测量Twitter哈希标签(hashtag)的收益 263
用3个修补方法提升谷歌搜索 267
改进相关性的算法 270
广告循环问题 272
杂项 273
简单模型会获得更好的销售预测 273
更好的医疗欺诈检测 275
归因模型 276
预测陨石撞击 277
在路口停车场收集数据 281
数据科学的其他应用 282
总结 282
第7章 踏上你的数据科学职业之路 283
面试问题 283
关于工作经验的问题 283
技术问题 285
一般性问题 286
关于数据科学项目的问题 288
测试你自己的视觉和分析思维 291
通过肉眼的检测模式 292
识别偏差 294
误导性的时间序列和随机游走 295
从统计学家到数据科学家 296
数据科学家也是统计从业人员 297
谁应该给数据科学家教统计学 298
雇佣问题 298
数据科学家与数据架构师密切合作 299
谁应该参与战略思考 299
两种类型的统计学家 300
大数据与取样 301
数据科学家的分类 302
数据科学最流行的技能集合 302
LinkedIn上的顶级数据科学家 306
400个数据科学家职位头衔 309
薪酬调查 311
根据技能和位置的薪酬分类 312
创建自己的薪酬调查表 316
总结 317
第8章 数据科学资源 318
专业资源 318
数据集 318
书籍 319
会议与组织 322
网站 324
概念定义 324
职业建设资源 327
招聘数据科学家的公司 328
数据科学招聘广告的样本 329
简历样本 329
总结 331
- 《女丹仙道:道教女子内丹养生修炼秘籍 下》董沛文著 2012
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《一个数学家的辩白》(英)哈代(G.H.Hardy)著;李文林,戴宗铎,高嵘译 2019
- 《《走近科学》精选丛书 中国UFO悬案调查》郭之文 2019
- 《数据库技术与应用 Access 2010 微课版 第2版》刘卫国主编 2020
- 《大数据Hadoop 3.X分布式处理实战》吴章勇,杨强 2020
- 《中医骨伤科学》赵文海,张俐,温建民著 2017
- 《Power BI数据清洗与可视化交互式分析》陈剑 2020
- 《美国小学分级阅读 二级D 地球科学&物质科学》本书编委会 2016
- 《数据失控》(美)约翰·切尼-利波尔德(John Cheney-Lippold)著 2019
- 《SQL与关系数据库理论》(美)戴特(C.J.Date) 2019
- 《魔法销售台词》(美)埃尔默·惠勒著 2019
- 《看漫画学钢琴 技巧 3》高宁译;(日)川崎美雪 2019
- 《优势谈判 15周年经典版》(美)罗杰·道森 2018
- 《社会学与人类生活 社会问题解析 第11版》(美)James M. Henslin(詹姆斯·M. 汉斯林) 2019
- 《海明威书信集:1917-1961 下》(美)海明威(Ernest Hemingway)著;潘小松译 2019
- 《迁徙 默温自选诗集 上》(美)W.S.默温著;伽禾译 2020
- 《上帝的孤独者 下 托马斯·沃尔夫短篇小说集》(美)托马斯·沃尔夫著;刘积源译 2017
- 《巴黎永远没个完》(美)海明威著 2017
- 《剑桥国际英语写作教程 段落写作》(美)吉尔·辛格尔顿(Jill Shingleton)编著 2019
- 《电子测量与仪器》人力资源和社会保障部教材办公室组织编写 2009
- 《少儿电子琴入门教程 双色图解版》灌木文化 2019
- 《指向核心素养 北京十一学校名师教学设计 英语 七年级 上 配人教版》周志英总主编 2019
- 《北京生态环境保护》《北京环境保护丛书》编委会编著 2018
- 《指向核心素养 北京十一学校名师教学设计 英语 九年级 上 配人教版》周志英总主编 2019
- 《通信电子电路原理及仿真设计》叶建芳 2019
- 《高等院校旅游专业系列教材 旅游企业岗位培训系列教材 新编北京导游英语》杨昆,鄢莉,谭明华 2019
- 《电子应用技术项目教程 第3版》王彰云 2019
- 《中国十大出版家》王震,贺越明著 1991
- 《近代民营出版机构的英语函授教育 以“商务、中华、开明”函授学校为个案 1915年-1946年版》丁伟 2017