本文为数盟原创译文,欢迎转载,注明出处“数盟社区”即可
对于未处在定量领域中的有志数据科学家们,学习统计学可是条令人胆寒的不归路。不论你是个计算机工程专业的大学生,寻找事业新出路的开发人员还是个MBA研究生,似乎在数据科学中最让大家觉得害怕的部分总是统计学。至少对从商学院毕业的我来说,它确实是。
统计学是门严肃的学科,很多人穷尽一生来学习研究它。作为一个上进的数据科学家,要如何在统计学的学习中百尺竿头更近一筹呢?需要学习了解一些什么呢?什么是学习统计学最好的方法呢?接下来让我一一揭晓。
理解掌握简单的数据学原理能够为你带来巨大的价值。在很多数据科学项目中,你根本不需要高等的统计学知识来获取重要的结论。正因如此,刻苦学习基本功才是正道,在你的工作中应用基础知识,举一反三,由简化繁。
统计学中两个最重要的分支分别是:描述统计学和推断统计学。如果能理解吃透这两项,你将会受益终身。
描述性统计学定量描述一系列的信息。它们总结测量数据。与推测性统计学相反,它们并不对更大的统计总体的结果进行推测。它们仅仅是在描述这些所收集的数据集。
你过去肯定与那些数据学打过交道,一些描述性统计学中常用的测量值确定了其集中趋势(平均值,中位数,众数)以及其他的,例如数据集中的变量(标准差…)。
推测性统计学让我们能够通过样本数据集来推测统计总体的性质。它们利用样本在所收集的数据上得出结果。
在实用数据科学中,当需要进行转化率的对比,或是进行类似A/B测试的试验时,推测性统计学会被大量的使用。
对我来说,网络课程在学习技术方面效验如神:
这些课程是交互式的,课程包括随堂练习和课程视频。我发现网络课程是初涉该领域时的一个很好的学习方式。你能够从中学到足够的知识,让你学习统计学时更加自如。
总的来说,我会推荐 Naked Statistics: Stripping the Dread from the Data 这本书,作者是Charles Wheelan。这本书涵盖了描述性和推测性统计学,并且对每个领域做出了很准确的概述。它通过一些有趣的实例让统计学更加生动。
请牢记,学习那些统计学原理的最好的方法就是由理论结合实际。一旦你开始能够将理论运用到自己的分析中来,我建议你能够拿起一本统计学手册,例如 All of Statistics ,来深化你的所学的知识。