站长网 大数据 怎么用逻辑回归做数据分析?

怎么用逻辑回归做数据分析?

鸢尾花下有三个亚属,分别是山鸢尾(setosa),变色鸢尾(versicolor)和维吉尼亚鸢尾(virginica),据此可将鸢尾属花分为以上三类。 本案例根据花萼的长度和宽度,花瓣的长度和宽度,采用逻辑回归建立分类模型,对鸢尾属花进行分类。 1)导入包及训练数据

鸢尾花下有三个亚属,分别是山鸢尾(setosa),变色鸢尾(versicolor)和维吉尼亚鸢尾(virginica),据此可将鸢尾属花分为以上三类。
 
本案例根据花萼的长度和宽度,花瓣的长度和宽度,采用逻辑回归建立分类模型,对鸢尾属花进行分类。
 
1)导入包及训练数据集
 
如何用逻辑回归做数据分析?
 
2)观测多特征数据点分布
 
通过观察特征分布,发现山鸢尾(蓝色)与其他两类花能够较好区分,但是变色鸢尾(绿色)和维吉尼亚鸢尾(红色)相对难以区分。
 
如何用逻辑回归做数据分析?
 
3)数据清洗、划分训练集
 
将分类变量赋于0/1/2数值,观测结果标签分布,发现各种类型鸢尾分布均匀。将特征变量和结果变量进行划分,并划分训练集与测试集。
 
如何用逻辑回归做数据分析?
 
4)训练分类模型、并进行分类性能评估
 
如何用逻辑回归做数据分析?
 
5)构建混淆矩阵
 
观察混淆矩阵,发现我们的分类器只在两个样本上预测失误;这两个样本真实类别是2(virginica,维吉尼亚鸢尾),而我们的分类器将其分类成1(versicolor,变色鸢尾)。
 
如何用逻辑回归做数据分析?
 
6)获取模型系数与截距(模型系数即为影响事件发生的驱动力)
 
如何用逻辑回归做数据分析?
 
以上逻辑回归就讲完了,逻辑回归是数据分析面试的高频考点,一定要熟练掌握喔~
本文来自网络,不代表站长网立场,转载请注明出处:https://www.tzzz.com.cn/html/shuju/2021/1026/16021.html

作者: dawei

【声明】:站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。
联系我们

联系我们

0577-28828765

在线咨询: QQ交谈

邮箱: xwei067@foxmail.com

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部