转载

给机器学习初学者的建议

本文译自康奈尔大学信息科学系助理教授David Mimno写的《Advice for students of machine learning》,Mimno先生总结了一些对于机器学习学生/初学者的建议,强调理论与实践相结合,要有耐心和毅力,并提出了深入研究一篇论文的方法。希望对读者有所帮助。
原文地址: http://www.mimno.org/articles/ml-learn/
Mimno先生主页: http://mimno.infosci.cornell.edu/
下面是译文正文:

=============================================================
题名:给机器学习初学者的建议
作者:David Mimno
译者:whatbeg

最近我的一个学生问我学习机器学习的建议,于是我写下了这篇文章,此文偏向于我个人的经验,但我还是要概括一下。

我现在最爱推荐的入门书籍是Kevin Murphy的书《机器学习》( Machine Learning )
你可能也想读

  • Chris Bishop的《模式识别和机器学习》(译者注: Pattern Recognition and Machine Learning , PRML,经典书籍,豆瓣评分9.6)
  • Daphne Koller的《概率图模型》( Probabilistic Graphical Models : Principles and Techniques )
  • 以及David Mackay的《信息理论:推理与学习算法》( Information Theory, Inference and Learning Algorithms )

任何你学习的关于线性代数和概率论/统计学的知识都会有所帮助。

  • Strang的《线性代数概论》( Introduction To Linear Algebra )
  • Gelman,Carlin,Stern和Rubin的《贝叶斯数据分析》( Bayesian Data Analysis, Second Edition )
  • Gelman和Hill的《用回归和多级/分层模型进行数据分析》( Data Analysis Using Regression and Multilevel/Hierarchical Models )
    等,这些都是我喜欢的书籍。

不要想着一开始就获得某个知识的所有方面,尽量从多个不同的资源去阅读同一件事的描述。

没有什么比你自己亲自尝试更重要。选择一个模型,然后实现它,将它与其它开源实现进行比较,想一想,是不是有什么使程序工作的计算或者数学上的技巧呢?

读一些论文。我在读研究生的时候,早上和晚上都有20分钟在公交车上,我包里总是带着一篇有趣的论文,公交不是重点–真正起作用的是我每天能花大约半小时在阅读(这些论文)上。

选择一篇你喜欢的论文,然后花一个星期深入研究它,无时无刻不想着它,回忆每个公式的形式,花点时间散步并琢磨每个变量是如何影响结果的,不同的变量是怎样相互影响的。想一想公式6是如何得到公式7的–作者常常省略中间步骤和代数细节,将步骤补充完整。

要有耐心和坚持。记住冯·诺伊曼所说的,“in mathematics you don’t understand things, you just get used to them.”。

原文  http://whatbeg.com/2016/05/17/adviceforMLfish.html
正文到此结束
Loading...