案例银行办信用卡--获得感知机
我们到银行办信用卡时,银行并不是直接就给你办卡的,而是会根据你的一些个人信息、消费信息、个人信誉等指标综合考虑后,才会决定是否给你办卡(不像现在银行办信用卡有点随意)。
银行要考虑的指标比如age,salary,year in job,current debt等我们称为特征,假设银行要考虑的特征有n个:
感知机
感知机(有些地方叫感知器)是二分类模型,属于线性分类。中g作为分类器,如果在是二维平面中,该分类器是一条直线,
由于在更高维中分析方法是和二维类似,所以这里以二维空间来分析。
根据前面文章提到过,我们可以认为现在手上有的数据是通过真实的f得到的,但我们是不知道f到底是什么,我们的目标是通过已有的数据尽量去找到一个g,
使得g越来越接近 f。而在hypothesis中有很多g,我们如何找到我们的g呢?
我们的思路是假设我们已经有了一条线(称它为g0),我们从这条先出发,如果这条线分类效果不太好,则表示有错误,我们根据错误慢慢修正它,
让它变得更好一点,直到好的不能再好为止。
思想如下:
现在有个问题没有考虑,上面的过程什么时候才会停止。会不会根本就不可能停止?
这里做一个假设:假设数据集是线性可分的。如果不是线性可分的,我们也就不采用感知机模型了。
如果数据集是线性可分的话,则必定存在一条完美的直线(这里讨论的是二维空间)能够将数据集分类。
感谢台大林老师的课。