为了账号安全,请及时绑定邮箱和手机立即绑定

机器学习算法(二)逻辑回归的原理和实现

 
首先明确是分类而不是回归 
逻辑回归的名字中虽然带有回归两个字,不过这是一个并不是一个回归算法,而是一个分类算法,他是在线性回归的基础上加入了sigmoid函数,将线性回归的结果输入至sigmoid函数中,并且设定一个阈值,如果大于阈值为1,小于阈值为0


sigmoid 函数: 
https://img1.sycdn.imooc.com//5b796e8b000159bc05200349.jpg

在图中我们可以看到 x -> -∞ 时 y 趋向与0,反之趋向于 1

def sigmoid (x):
    return (1 / (1 + np.exp (-x)))12

逻辑回归的推导过程

准备公式: 
sigmoid函数 : 这里写图片描述 
预测函数 : 这里写图片描述 
用概率的形式表示时间是否发生: 
在样本 x 的条件下 y = 1 的概率 : 这里写图片描述 
在样本 x 的条件下 y = 0 的概率 : 这里写图片描述 
上面两个公式合并: 这里写图片描述

通过最大似然函数求损失函数 
这里写图片描述 
这里写图片描述 
这里在x 和 y 上的上标标忘了打了,用来表示第i个数据

损失函数 : 这里写图片描述


在这里我们发现损失函数是一个恒正的函数,所以我们使用梯度上升算法,这个和梯度下降算法并没有什么区别 
梯度上升迭代函数 : 这里写图片描述 
偏导函数,为了推导方便,暂时省略求和计算 
偏导公式进行链式分解: 这里写图片描述 
这里写图片描述 
这里写图片描述 
这里写图片描述 
上面三式综上:这里写图片描述


综上可以得 
这里写图片描述


程序实现:

def gradAscent(dataMatIn, classLabels):
    dataMatrix = np.mat(dataMatIn)                                        #转换成numpy的mat
    labelMat = np.mat(classLabels).transpose()                            #转换成numpy的mat,并进行转置
    m, n = np.shape(dataMatrix)                                            #返回dataMatrix的大小。m为行数,n为列数。
    alpha = 0.001                                                        #移动步长,也就是学习速率,控制更新的幅度。
    maxCycles = 500                                                        #最大迭代次数
    weights = np.ones((n,1))    for k in range(maxCycles):
        h = sigmoid(dataMatrix * weights)                                #梯度上升矢量化公式
        error = labelMat - h
        weights = weights + alpha * dataMatrix.transpose() * error    return weights.getA()                                                #将矩阵转换

原文出处:https://blog.csdn.net/NaLaEur/article/details/81806621

点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消