分类模型——Logistics Regression

kumfo 发布于2019-07-31 11:03 / 2746人阅读

摘要：和准确率不同，曲线对分类比例不平衡的数据集不敏感，曲线显示的是对超过限定阈值的所有预测结果的分类器效果。曲线画的是分类器的召回率与误警率的曲线。

Logistics regression

</>复制代码 
from sklearn.linear_model import LogisticRegression
clf = LogisticRegression()
clf.fit(x_train, y_train)

准确率与召回率

准确率：scikit-learn提供了accuracy_score来计算：LogisticRegression.score()
准确率是分类器预测正确性的比例，但是并不能分辨出假阳性错误和假阴性错误
精确率是指分类器预测出的垃圾短信中真的是垃圾短信的比例，P=TP/(TP+FP)
召回率在医学上也叫做灵敏度，在本例中知所有真的垃圾短信被分类器正确找出来的比例，R=TP/(TP+FN)

</>复制代码 
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score  
predictions = clf.predict(x_test)  
print("准确率：", accuracy_score(y_test, predictions))  
print("精确率：", precision_score(y_test, predictions))  
print("召回率：", recall_score(y_test, predictions))  
print("F1-Score：", f1_score(y_test, predictions))  
from sklearn.metrics import classification_report, accuracy_score, confusion_matrix  
predictions = clf.predict(x_test)  
print("准确率：", accuracy_score(y_test, predictions))  
print("混淆矩阵：", confusion_matrix(y_test, predictions))  
print("分类报告：", classification_report(y_test, predictions))

ROC AUC

ROC曲线（Receiver Operating Characteristic，ROC curve）可以用来可视化分类器的效果。和准确率不同，ROC曲线对分类比例不平衡的数据集不敏感，ROC曲线显示的是对超过限定阈值的所有预测结果的分类器效果。ROC曲线画的是分类器的召回率与误警率（fall-out）的曲线。误警率也称假阳性率，是所有阴性样本中分类器识别为阳性的样本所占比例：
F=FP/(TN+FP) AUC是ROC曲线下方的面积，它把ROC曲线变成一个值，表示分类器随机预测的效果.

</>复制代码 
from sklearn.metrics import roc_curve, auc  
predictions = clf.predict_proba(x_test)  
false_positive_rate, recall, thresholds = roc_curve(y_test, predictions[:, 1])  
roc_auc = auc(false_positive_rate, recall)  
plt.title("Receiver Operating Characteristic")  
plt.plot(false_positive_rate, recall, "b", label="AUC = %0.2f" % roc_auc)  
plt.legend(loc="lower right")  
plt.plot([0, 1], [0, 1], "r--")  
plt.xlim([0.0, 1.0])  
plt.ylim([0.0, 1.0])  
plt.ylabel("Recall")  
plt.xlabel("Fall-out")  
plt.show()

模型原理

http://blog.csdn.net/sergeyca...
http://blog.csdn.net/zjuPeco/...

GPU云服务器云服务器 Logistics regression logistic-regression 对象模型与数据模型

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/44571.html

TensorFlow学习笔记（3）：逻辑回归

摘要：前言本文使用训练逻辑回归模型，并将其与做比较。对数极大似然估计方法的目标函数是最大化所有样本的发生概率机器学习习惯将目标函数称为损失，所以将损失定义为对数似然的相反数，以转化为极小值问题。前言本文使用tensorflow训练逻辑回归模型，并将其与scikit-learn做比较。数据集来自Andrew Ng的网上公开课程Deep Learning 代码 #!/usr/bin/env ...

wendux 2019-07-25 11:19 评论0 收藏0
机器学习面试常见问题&答案 ②

摘要：出现方差是正常的，但方差过高表明模型无法将其预测结果泛化到从中抽取训练样本的较大母体。机器学习中的学习曲线是一种可视化图形，能根据一系列训练实例中的训练和测试数据比较模型的指标性能。欠拟合（通常代表高偏差）精度如前所述如果模型具有足够的数据，但因不够复杂而无法捕捉基本关系，则会出现偏差。这样一来，模型一直会系统地错误表示数据，从而导致预测精度低。这种现象叫做欠拟合（und...

gself 2019-06-26 18:44 评论0 收藏0

发表评论

登陆后可评论

0条评论

kumfo

男|高级讲师

我要关注我要私信

TA的文章

搬瓦工，CN2 GIA-E 限量版套餐补货，$84/年，可随意切换为美国cn2 gia、日本软银、荷

阅读 3812·2021-10-18 13:34
raksmart：I3-2120物理机$30/月甩卖，爆款VPS仅月付$1.99，此外洛杉矶/韩国/

阅读 2560·2021-08-11 11:15
关于vertical-align

阅读 1322·2019-08-30 15:44
微前端 —— project2项目（VUE）

阅读 799·2019-08-26 10:32
React 328道最全面试题(持续更新)

阅读 1128·2019-08-26 10:13
事件订阅广播组件

阅读 2148·2019-08-23 18:36
【Vue原理】Event - 白话版

阅读 1857·2019-08-23 18:35
Git Bash常见命令

阅读 610·2019-08-23 17:10

资讯专栏INFORMATION COLUMN

上云采购季！| 2核2G4M爆款云服务器低至59元/年，更有多台、长期优惠，快来选购！

分类模型——Logistics Regression

</>复制代码

</>复制代码

</>复制代码

相关文章

TensorFlow学习笔记（3）：逻辑回归

机器学习面试常见问题&答案 ②

发表评论

0条评论

kumfo

男|高级讲师

TA的文章

搬瓦工，CN2 GIA-E 限量版套餐补货，$84/年，可随意切换为美国cn2 gia、日本软银、荷

raksmart：I3-2120物理机$30/月甩卖，爆款VPS仅月付$1.99，此外洛杉矶/韩国/

关于vertical-align

微前端 —— project2项目（VUE）

React 328道最全面试题(持续更新)

事件订阅广播组件

【Vue原理】Event - 白话版

Git Bash常见命令

最新活动