什么是逻辑回归算法

逻辑回归是统计领域机器学习所借用的另一种技术。它是二进制分类问题的首选方法(具有两个类值的问题)。

逻辑回归就像线性回归一样,目标是找到加权每个输入变量的系数的值。与线性回归不同,使用称为逻辑函数的非线性函数来转换输出的预测。

逻辑函数看起来像一个大S,并将任何值转换为0到1的范围。这很有用,因为我们可以将一个规则应用于逻辑函数的输出,以将值捕捉到0和1(例如IF小于0.5然后输出1)并预测一个类值。

逻辑回归算法
逻辑回归算法

 

百度百科版本

逻辑回归是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。

以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此因变量就为是否胃癌,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是分类的。然后通过logistic回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是胃癌的危险因素。同时根据该权值可以根据危险因素预测一个人患癌症的可能性。

查看详情

由于学习模型的方式,逻辑回归所做的预测也可以用作给定数据实例属于0级或1级的概率。这对于需要给出更多基本原理的问题非常有用。一个预测。

与线性回归一样,当您删除与输出变量无关的属性以及彼此非常相似(相关)的属性时,逻辑回归确实更有效。这是一个学习二元分类问题的快速模型。

 

维基百科版本

在统计学中,逻辑模型是一种广泛使用的统计模型,在其基本形式中,使用逻辑函数来模拟二进制 因变量 ; 存在更复杂的扩展。在回归分析中,逻辑回归是估计逻辑模型的参数; 它是二项式回归的一种形式。

在数学上,二元逻辑模型具有一个具有两个可能值的因变量,例如通过/失败,赢/输,活/死或健康/生病; 这些由指示符变量表示,其中两个值标记为“0”和“1”。在逻辑模型中,对数比值(在对数的的可能性),用于标记为“1”的值是一个线性组合的一个或多个自变量(“预测”); 自变量可以是二进制变量(两个类,由指示符变量编码)或连续变量(任何实际值)。

查看详情