在Python中实现逻辑回归通常涉及以下步骤:
导入必要的库
import numpy as np
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import roc_auc_score
import matplotlib.pyplot as plt
准备数据
你可以使用现有的数据集,或者创建自定义的数据集。例如,使用`pandas`创建一个简单的数据框:
df = pd.DataFrame({'math': [98,78,54,89,24,60,98,44,96,90],
'english': [92,56,90,57,46,75,76,87,91,88],
'is_good': [1,0,0,0,0,0,1,0,1,1]})
特征和标签分离
将数据集分为特征(X)和标签(y):
X = df.iloc[:, [0, 1]] 特征
y = df['is_good'] 标签
创建逻辑回归模型
使用`sklearn`中的`LogisticRegression`类创建模型实例:
clf_lg = LogisticRegression()
拟合模型
使用训练数据拟合模型:
clf_lg.fit(X, y)
获取模型参数
拟合完成后,可以获取模型的参数,即斜率和截距:
print(clf_lg.coef_) 斜率
print(clf_lg.intercept_) 截距
模型预测
使用模型进行预测,并计算准确率:
y_pred = clf_lg.predict(X)
print("预测结果:", y_pred)
print("准确率:", sum(y == y_pred) / len(y))
计算AUC值
评估模型性能,计算AUC值:
AUC = roc_auc_score(y, y_pred)
print("AUC值:", AUC)
可视化结果
绘制拟合曲线和原始数据点:
plt.scatter(X, y, color='blue')
plt.plot(X, clf_lg.predict_proba(X)[:,1], color='red')
plt.show()
以上步骤展示了如何在Python中使用`sklearn`库实现逻辑回归。逻辑回归是一种强大的分类算法,适用于二分类问题,通过将线性回归的结果通过Sigmoid函数映射到(0,1)之间,从而进行概率估计。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://sigusoft.com/bj/141462.html