机器学习-MLP预测

2024-05-15 14:52

文章标签 学习机器预测 mlp

本文主要是介绍机器学习-MLP预测，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

本文使用机器学习MLP对数据进行预测。

1、数据

1.1 训练数据集：

medol.xlsx文件示例

o	t	v
30	15	-1.915362209
30	18	-1.963409776
30	21	-1.762028408
30	24	-1.789477583

1.2 预测数据集

test.xlsx文件示例

o	t
35	16
35	19

2、模型训练

train.py

import pandas as pd
from sklearn.neural_network import MLPRegressor
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
from sklearn.preprocessing import StandardScaler
import joblib
import numpy as np
import matplotlib.pyplot as plt# 加载数据
df = pd.read_excel("model.xlsx")# 定义 o 和 t 列的名称
feature_columns = ['o', 't']# 初始化 StandardScaler
scaler = StandardScaler()# 在规范化数据集
X_scaled = scaler.fit_transform(df[feature_columns])target_column = 'v'# 将数据拆分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X_scaled, df[target_column], test_size=0.1)# 初始化 MLP 回归模型
mlp = MLPRegressor(solver='adam', max_iter=10000)  # 你可以根据需要修改 max_iter 的值和添加 random_state# 定义参数网格
param_grid = {'hidden_layer_sizes': [(200, 200, 200), (250, 250, 250),  (300, 300, 300)],'activation': ['relu', 'logistic', 'tanh', 'identity'],'alpha': [0.01, 0.02, 0.05],
}# 使用 GridSearchCV 进行网格搜索
grid_search = GridSearchCV(mlp, param_grid, cv=5, scoring='neg_mean_squared_error', verbose=1)
grid_search.fit(X_train, y_train)# 获取最佳模型
best_model = grid_search.best_estimator_# 输出最佳超参数
print("Best Hyperparameters:", grid_search.best_params_)# 计算训练集和测试集的指标
train_predictions = best_model.predict(X_train)
test_predictions = best_model.predict(X_test)# 训练集指标
print("\n[训练集指标]")
print("平均绝对误差: {}".format(mean_absolute_error(y_train, train_predictions)))
print("均方误差: {}".format(mean_squared_error(y_train, train_predictions)))
print("均方根误差: {}".format(np.sqrt(mean_squared_error(y_train, train_predictions))))
print("R2: {}".format(r2_score(y_train, train_predictions)))# 测试集指标
print("\n[测试集指标]")
print("平均绝对误差: {}".format(mean_absolute_error(y_test, test_predictions)))
print("均方误差: {}".format(mean_squared_error(y_test, test_predictions)))
print("均方根误差: {}".format(np.sqrt(mean_squared_error(y_test, test_predictions))))
print("R2: {}".format(r2_score(y_test, test_predictions)))# 绘制训练集误差随循环次数的变化图
plt.plot(range(1, best_model.n_iter_ + 1), best_model.loss_curve_, label='Train MSE')
plt.xlabel('Epoch')
plt.ylabel('Mean Squared Error')
plt.title('Training Set Error Over Epochs')
plt.legend()
plt.show()# 绘制测试集的实际值和预测值的对比图
plt.scatter(y_test, test_predictions, alpha=0.5)
plt.plot([min(y_test), max(y_test)], [min(y_test), max(y_test)], '--', color='red', label='Identity Line')
plt.xlabel('Actual Values')
plt.ylabel('Predicted Values')
plt.title('Actual vs Predicted Values on Test Set')
plt.legend()
plt.show()# 保存训练好的模型
model_filename = f'mlp_model'
joblib.dump(best_model, model_filename)# 保存训练好的标准化器
joblib.dump(scaler, 'scaler_model')

3、预测模型

test.py

import pandas as pd
import joblib
from sklearn.preprocessing import StandardScaler# 加载训练好的模型和标准化器
test_df = pd.read_excel("test.xlsx")  # 读取测试数据
scaler = joblib.load('scaler_model')  # 加载标准化器
loaded_model = joblib.load('mlp_model')  # 加载训练好的模型# 对测试数据进行标准化并进行预测
predictions = loaded_model.predict(scaler.transform(test_df[['o', 't']]))# 创建包含 'o'、't' 和 'v' 列的新 DataFrame
predicted_df = pd.DataFrame({'o': test_df['o'], 't': test_df['t'], 'v': predictions})# 将预测结果保存到 Excel 文件
predicted_df.to_excel("predicted.xlsx", index=False)

若有问题，欢迎讨论

这篇关于机器学习-MLP预测的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！