本文主要是介绍MATLAB中ANFIS的使用教程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
ANFIS是MATALB中关于模糊神经网络的一个接口模块,有对于此模块了解需求的同学可以查看此模块的使用教程
1、下载数据集
数据集我们选择UCI数据仓库的Energy efficiency data_set
下载之后我们发现是一个excel表格。数据如下图所示。里面包含了X1~X8共8个输入量,Y1和Y2两个输出变量。由于MATLAB中ANFIS只能针对单个输出变量进行建模。此处只考虑X1~X8和Y1之间的关系。
2、特征选择
由于8个输入变量(也就是输入特征),建立出来的模型计算速度太慢,所以需要对输入变量进行特征选择,这里采用相关系数对参数进行筛选。
在excel中采用correl函数计算X1与Y1,....,X8与Y1之间的相关系数。得到的结果如下:
可以看出X6, X7, X8与Y1是弱相关性(此处选择相关系数0.3作为界限),所以此处只选择X1~X5作为输入量(作为情况1)
更进一步,我们可以看一下X1~X5当中是否存在冗余的情况,如果存在冗余则需要把冗余特征剔除掉。我们计算与Y1关联度最高的X5与每个特征的关联系数,得到结果如下:
X5与X4 | -0.97251 |
X5与X2 | -0.85815 |
X5与X1 | 0.827747 |
X5与X3 | 0.280976 |
可以看出X5与X1,X2,X4都是强相关的,X5与X3是弱相关的。所以我们最终选择X5与X3作为输入变量(作为情况2)
为了简单起见,此处以情况2作为例子进行后续说明,情况1在最终作为对比。
在MATLAB中输入代码,进行数据加载和数据删除。
clc
clear
%% 读取excel数据
num = xlsread('E:\dataset\Energy efficiency data set_data.xlsx'); %此处为Excel存放的地址和文件名
training = num(1:460,[3,5,9]); %训练数据选择第1~460行,第3列、第5列作为输入变量,第9列作为输出变量
testing = num(461:614,[3,5,9]); %测试数据选择第461~614行,第3列、第5列作为输入变量,第9列作为输出变量
checking = num(615:768,[3,5,9]);%检查数据选择第615~768行,第3列、第5列作为输入变量,第9列作为输出变量
执行之后可以在workspace看到数据
当然你也可以选择在matlab的workspace中新建变量,然后把相应的数据在excel中复制过来,这里不做演示。
3、Neuro-Fuzzy Designer设置
3.1 在matlab命令行中输入命令
anfisedit;
会弹出Neuro-Fuzzy Designer对话框:
3.2 加载数据
在Load data的对话框内,Type选择Training,From选择worsp, 然后点Load Data,在弹出的对话框中输入变量名training
依次加载testing数据和checking数据。
3.3 生成FIS
此处在Generate FIS对话框内,选择Grid partition,点击Generate FIS。
在弹出的对话框内,在Number of MFs中保留3 3 不变,此处的意思是将输入数据分成“小、中、大”三个模糊化,如果想做模糊成“NB NM NS PS PM PB”进行5个区域的模糊化,则输入5 5。如果输入变量有5个,则需要输入3 3 3 3 3。
在MF Type中选择隶属度函数的形式,此处保持原始状态不变。
3.4 训练FIS
在TrainFIS对话框内,停止误差Error Tolerance输入0.005,训练次数Epochs输入10,然后点训练,此时开始对数据进行训练。
注意在Load data那里要把Type改成Training。
此时我们可以查看模糊系统的结构。
3.5 查看各数据集的误差
在Test FIS对话框内,选择Training data,然后点Test Now,可以看到测试误差为3.5452
同理,测试Testing data和Checkin data的误差分别是4.754和5.2645
3.6 导出模型
训练好的模型,我们可以对输入数据进行预测了。保存的名字是MFModel
4、数据预测
4.1 输入数据做预测输出
此处选择Checking数据作为需要预测的数据。在matlab命令行窗口内输入:
output = evalfis(checking(:,[1 2]),NFModel); % 选择checking的输入第一和第二列,模型选择刚刚生成的模型NFModel,输出的结果存储到output内
得到的output数据如下:
4.1 模型数据与实际数据进行对比
将得到的数据复制出来,粘贴到excel的第616~769行。然后做出Y1与预测结果之间的散点曲线
可以看出预测结果基本符合实际数据。但是还是存在比较大的误差的,有兴趣的同学可以尝试着修改下参数,来减小这个误差值。
5、不剔除冗余参数对比
不剔除冗余参数,则选择X1~X5全部作为输入变量,按照之前的设置进行训练。
注意:由于选择3个模糊规则时耗时太长,此处选择2个模糊区域。
可以得到:
训练数据的误差为:2.6315
测试数据的误差为:4.1675
这篇关于MATLAB中ANFIS的使用教程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!