阅读大概需要10分钟
之前虽然学过 逻辑回归LR , 支持向量机SVM 等机器学习的零星小片段,还有 深度学习 也做过很多事情。但是总觉得该抽点时间系统的学习下机器学习了,要不总觉得缺点啥。刚好,自己有视频资料,其实b站上也有,如果你们想学 可以给我要视频资料 ,也可以去b站上看。
咱们先说下 深度学习和机器学习的关系 ,深度学习属于机器学习,但是深度学习自己都快成了一个独立的分支了,因为对于它的研究已经基本超过其他机器学习了,比如现在的计算机视觉或者自然原因处理的论文,如果你没有用到深度学习,那基本都把你pass掉了。
话又话又说回来, 有人说深度学习这么火了, 为什么还要学机器学习呢? 我觉得 原因有三点:
深度学习虽然火,但是现在也只能算是 刚兴起 ,工业界用的最多的目前还是机器学习和以前传统的方法。
如果想用到深度学习,那基本是你的数据量特别庞大的时候。但是现在很多公司数据量 没有那么庞大 ,只用普通的方法就行。
机器学习理论还是很值得我们探索的,即使有些方法我们或许用不上,但是它的 推导 和 核心的思维方式 或许能帮我们打开很多视野,也能帮助我们迅速理解以后突然出现的新的方法。说实话,每天都会有上百种新的机器学习方法的提出,只要掌握了机器学习的基础,那就。。嘿嘿 一句话, 万变不离其宗 O.O
---仅属于个人理解
好啦,我们开始啦。
为了详细学习机器学习的基石,我们 总体大纲 会从 四个大方面 讲解(这次和以后):
1. 在什么情况下我们可以用 机器来学习?
2.为什么机器可以学习?
3.机器怎么学习?
4.机器怎么能学习的更好?
即:
本章我们会围绕着第一个讲解:
在什么情况下我们可以用机器来学习?
那么在这节中,我们将会会以下面 四个小方向 来讨论:
什么是 机器学习?
机器学习的 应用 有哪些?
机器学习的 要素 有哪些?
机器学习和其他的 相关领域
即:
What is Machines Learning
我们先说 learning :
在我们很小的时候从叽叽呀呀到在一岁左右开始学喊爸爸妈妈,再到后来的吞吞吐吐说话,最后到都nb的开始学习人家的国外的语言了。我们的这个过程就是一个最最简单的learning的过程,是在不断学习别人的过程。
大概概括就是,人通过观察,不断地学习不断地累计经验的过程。
那么Machines Learning是怎么回事呢?
机器不是生物,没有意识,那么怎么能学习呢?对,那就是 data ,我们通过喂给机器数据,让机器来学习其中的 规则 ,获取相应的技能的过程。
那么什么是技能skill呢?
提高某种表现形式(比如准确率呀等)
而Machines Learning也是这么个过程:
比如一些实例应用:
炒股票 ,有个任务让你根据最近几年的股票来预测这个时刻,我是该买呢?还是该卖?那你可肯定得需要很长时间来考虑和计算了。但是如果把
data给了机器,让data预测,那都是分分秒的事。
比如我们要弄个 机器人去火星 ,因为我们人类没去过,所以,我们不能给机器传输一些我们知道的规则,那就需要机器自己到火星上去学习。
比如有一个应用, 识别树 ,你通常会先想你是怎么定义树的,但是这个是比较难的,我们当时刚出生的时候,难道爸妈告诉我们那个绿的,高的,长得那个样子等等的是树吗?显然不是。那么我们是这么学的呢?对了,我们是通过观察,累计经验的,所以,我们需要用机器学习,让机器自己学习特征来判别。
当这几种情况的时候,我们可以使用机器学习:
当人类不能人工的编写这个系统的时候
当人类不能很容易的定义这个问题的时候
当需要快速做出决定而人不能的时候
当需要为客户做定向服务的时候
etc.
授之以渔,而非授之以鱼。
那么到底问题应该具备哪些特定的元素才能用机器学习呢?
有潜藏的 规律 的
不能 简单的用程序定义的
有 data ,也就是有input
那咱们做几道题把,看看哪些可以用到机器学习?
回答:
孩子哭泣 无规律 呀,所以pass
圆的规律 太明显 ,直接编程即可,pass
这个可以:a.有pattern即客户的行为,b.很难用程序来定义,c.他的历史银行运作信息
这个。。 没有足够的数据 啊。(庆幸没有足够数据O.O)
Applications of Machines Learning
这里就很多啦,比如我们的 衣食住行 中的例子:
食 :根据Twitter上的数据来预测饭店的好坏
衣 :根据销售数字和顾客调查来给顾客推荐衣服
住 :根据建筑的特征和他们建筑时的消耗预测其他建筑得消耗
行 :根据一些交通信号的图片和它的意义来准确预测在行进时对交通信号的判定,比如现在火的智能驾驶
其他的比如在学生 教育 上面:
对学生历年来答题的数据进行学习,来预测学生在某道题上是否能答对。
在娱乐方面:
从用户评价过的电影中学习,可以给用户推荐电影。
针对这些还有很多比赛:
那么比如 电影推荐系统 怎么做呢?
如图所示(简化描述,现实肯定没这么简单):
我们用一个 数组 表示 客户的喜好 ,比如第一个表示喜欢喜剧?第二个表示喜欢动作片?等
另一个 数组 表示 电影的特征 ,比如第一个喜剧的内容,第二个表示动作片的内容等
这两个数组的数据要对应,一个是喜欢喜剧?那么另一个就是喜剧内容。最后都以 分值 得形式呈现, 对应位相乘 在一起,最终得分高的就是推荐的。
Components of Machines Learning
那么具体的机器学习什么元素呢?现在就来讲讲
比如我们为一个 客户判定该不该给客户申请信用卡 ?
我们有的信息只有他们填表的时候的 信息
那么我们来说下机器学习到底 具体需要什么 以及怎么个 流程 :
input x:用户信息
output y:预测申请卡的好坏
目标函数f:f(x)=y
而data就是每个用户y的信息x的集合
假设函数g:机器学习的目标就是缩短和理想的函数f的差距。
公式简化为:
而这是这个 流程 就为:
H 是猜测的所有可能集合,比如:
h1:年收入大于80W(这个可能性最大)
h2:负债大于10W(这个可能性最下)
h3:每年内有小于等于2个工作(不确定)
etc.
g从这个里面选取(也或许是选几个),最终选取正确率最高的当做最终的g函数 尽肯能的接近target 函数f :
Machines Learning and Other Fields
机器学习与数据挖掘:
数据挖掘就是通过大量的数据发现有趣的属性,如果这个属性和求得接近于真实函数f的假设g过程一样,那么机器学习和数据挖掘就是 一样的 ;如果 这个属性和求得接近于真实函数f的假设g过程 相似则数据挖掘可以 帮助 机器学习;但是在数据方面,它俩是 一样的 。
机器学习与人工智能
在追求g趋近于f上这俩是相似的,而对于比如下棋来说,就有两种方法,一种是传统的,一种是机器学习。总的来说, 机器学习是实现人工智能的一种方法 。
机器学习与统计
统计可以实现机器学习;传统而统计可以用来数学预测,但是在计算上就 欠佳 了。总之, 统计中的很多方法适用于是机器学习的实现 。
Summary
一图胜千言:
每日托福单词
vague adj. 含糊的,不明确的
immune adj. 免疫的
resemble v. 相似,类似
spin v.旋转 n. 旋转
resolve v. 解决 n. 坚决,决心