python用于做回归的数据集_Python回归分析与预测

激活谷笔记 • 2026-04-22 19:42 • 阅读 2

在Python中进行回归分析，你可以使用`statsmodels`或`scikit-learn`这两个库。下面我将分别介绍如何使用这两个库进行回归分析。

使用`statsmodels`进行回归分析

python

import numpy as np

import statsmodels.api as sm

import pandas as pd

创建一些样本数据

np.random.seed（10）

X = np.random.rand（100, 1） 100个样本的特征数据

y = 2 + 3 * X + np.random.randn（100, 1）真实的响应变量，其中包含了一些噪声

在X中添加一列常数项，以便我们的模型包含截距

X = sm.add_constant（X）

创建模型

model = sm.OLS（y, X）

拟合模型

results = model.fit（）

输出回归分析的结果

print（results.summary（））

使用`scikit-learn`进行回归分析

python

from sklearn.linear_model import LinearRegression

from sklearn.metrics import mean_squared_error, r2_score

from sklearn.model_selection import train_test_split

导入数据集

dataset = pd.read_csv（'data.csv'）

探索数据

print（dataset.head（））

print（dataset.describe（））

plt.scatter（dataset['x'], dataset['y']）

plt.xlabel（'x'）

plt.ylabel（'y'）

plt.show（）

准备数据

X = dataset[['x']]

y = dataset['y']

划分训练集和测试集

X_train, X_test, y_train, y_test = train_test_split（X, y, test_size=0.2, random_state=0）

创建模型

model = LinearRegression（）

拟合模型

model.fit（X_train, y_train）

预测

y_pred = model.predict（X_test）

评估模型

mse = mean_squared_error（y_test, y_pred）

r2 = r2_score（y_test, y_pred）

print（f"Mean Squared Error: {mse}"）

print（f"R^2 Score: {r2}"）

多重线性回归示例

python

from sklearn.linear_model import LinearRegression

from sklearn.metrics import mean_squared_error, r2_score

from sklearn.model_selection import train_test_split

假设我们有一个包含多个特征的数据集

dataset = pd.read_csv（'data.csv'）

准备数据

X = dataset.drop（'target', axis=1）特征数据

y = dataset['target'] 目标变量

划分训练集和测试集

X_train, X_test, y_train, y_test = train_test_split（X, y, test_size=0.2, random_state=0）

创建模型

model = LinearRegression（）

拟合模型

model.fit（X_train, y_train）

预测

y_pred = model.predict（X_test）

评估模型

mse = mean_squared_error（y_test, y_pred）

r2 = r2_score（y_test, y_pred）

print（f"Mean Squared Error: {mse}"）

print（f"R^2 Score: {r2}"）

注意事项

在进行回归分析之前，通常需要对数据进行探索，比如查看数据的基本信息和分布情况。

数据预处理很重要，比如归一化或标准化，以确保模型能够更好地学习。

回归分析后，通常需要进行模型检验，包括F检验、t检验和拟合优度（R^2）检验。

以上示例展示了如何使用`statsmodels`和`scikit-learn`进行回归分析，并包括了一些基本的数据预处理和模型评估步骤。请根据你的具体数据集调整代码。

python用于做回归的数据集_Python回归分析与预测

相关推荐