转载

给机器学习初学者的建议

本文译自康奈尔大学信息科学系助理教授David Mimno写的《Advice for students of machine learning》，Mimno先生总结了一些对于机器学习学生/初学者的建议，强调理论与实践相结合，要有耐心和毅力，并提出了深入研究一篇论文的方法。希望对读者有所帮助。
原文地址： http://www.mimno.org/articles/ml-learn/
Mimno先生主页： http://mimno.infosci.cornell.edu/
下面是译文正文：

=============================================================
题名：给机器学习初学者的建议
作者：David Mimno
译者：whatbeg

最近我的一个学生问我学习机器学习的建议，于是我写下了这篇文章，此文偏向于我个人的经验，但我还是要概括一下。

我现在最爱推荐的入门书籍是Kevin Murphy的书《机器学习》( Machine Learning )
你可能也想读

Chris Bishop的《模式识别和机器学习》(译者注： Pattern Recognition and Machine Learning , PRML，经典书籍，豆瓣评分9.6)
Daphne Koller的《概率图模型》( Probabilistic Graphical Models : Principles and Techniques )
以及David Mackay的《信息理论：推理与学习算法》( Information Theory, Inference and Learning Algorithms )

任何你学习的关于线性代数和概率论/统计学的知识都会有所帮助。

Strang的《线性代数概论》( Introduction To Linear Algebra )
Gelman,Carlin,Stern和Rubin的《贝叶斯数据分析》( Bayesian Data Analysis, Second Edition )
Gelman和Hill的《用回归和多级/分层模型进行数据分析》( Data Analysis Using Regression and Multilevel/Hierarchical Models )
等，这些都是我喜欢的书籍。

不要想着一开始就获得某个知识的所有方面，尽量从多个不同的资源去阅读同一件事的描述。

没有什么比你自己亲自尝试更重要。选择一个模型，然后实现它，将它与其它开源实现进行比较，想一想，是不是有什么使程序工作的计算或者数学上的技巧呢？

读一些论文。我在读研究生的时候，早上和晚上都有20分钟在公交车上，我包里总是带着一篇有趣的论文，公交不是重点–真正起作用的是我每天能花大约半小时在阅读（这些论文）上。

选择一篇你喜欢的论文，然后花一个星期深入研究它，无时无刻不想着它，回忆每个公式的形式，花点时间散步并琢磨每个变量是如何影响结果的，不同的变量是怎样相互影响的。想一想公式6是如何得到公式7的–作者常常省略中间步骤和代数细节，将步骤补充完整。

要有耐心和坚持。记住冯·诺伊曼所说的，“in mathematics you don’t understand things, you just get used to them.”。

原文 http://whatbeg.com/2016/05/17/adviceforMLfish.html

正文到此结束