统计学方法是数据科学的重要组成部分,但极少有数据科学家接受过正规的统计学教育或培训,而关于统计学基础的课程和教材也很少从数据科学的角度进行讲解。本书专门从数据科学的角度阐释重要且实用的统计学概念,重点介绍如何将各种统计学方法应用于数据科学。
本书特色:
* 为什么探索性数据分析是数据科学关键的第一步
* 随机抽样如何降低偏差、生成高质量数据集
* 实验设计原则如何针对问题生成确定性答案
* 如何使用回归方法估计结果并检测异常
* 用于预测记录所属类别的主要分类方法
* 从数据中“学习”的统计机器学习方法
* 从未标记数据中提取有意义信息的无监督学习方法
作者简介:
彼得·布鲁斯(Peter Bruce),知名统计学家,Statistics.com统计学教育学院的创立者兼院长,重采样统计软件的开发者。曾在美国马里兰大学和各种短训班教授重采样统计课程。
安德鲁·布鲁斯(Andrew Bruce),华盛顿大学统计学博士,拥有30多年的统计学和数据科学经验,在多家知名学术期刊上发表过多篇论文。