本文主要是介绍二、数学建模优劣分析法(TOPSIS法)【清风数学建模个人笔记】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
目录
层次分析法的局限
TOPSIS法主要思想
引入
统一指标类型
标准化处理
如何计算得分
只有一个指标
多个指标
计算得分
TOPSIS法步骤
第一步:将原是矩阵正向化
极小型->极大型
中间型->极大型
区间型->极大型
第二步:正向化矩阵标准化
第三步:计算得分并归一化
带权重的TOPSIS法
Topsis代码详解
主函数
自定义函数Positivization
自定义函数Min2Max
自定义函数Mid2Max
自定义函数Inter2Max
基于熵权法对Topsis模型的修正
信息熵的定义
熵权法计算步骤
层次分析法的局限
(1)评价的决策层不能太多,太多的话n会很大,判断矩阵和一致矩阵差异
可能会很大。平均随机一致性指标RI的表格中n最多是15。
(2)如果决策层中指标的数据是已知的,那么我们如何利用这些数据来使得
评价的更加准确呢?
TOPSIS法主要思想
引入
已知四位同学的成绩,请给出一个评分,该评分能合理的描述其成绩的高低。(这里要求的评分可以类比之前学过的层次分析法中的那个权重)
我们首先想到下面一种做法:
但是这种做法可以随意修改成绩,只要排名不变,那么评分就不会改变。
所以这里我们提出一种更好的做法
最高成绩MAX:99,最低成绩MIN:60
构造计算评分的公式:
缺点是最低分和最高分为固定值0和1。但是如果我们比较的人数较多,这两个人的评分就不会影响大局。
现在我们再来拓展一下,再增加一个指标,如下:
成绩是越高(大)越好,这样的指标称为极大型指标(效益型指标)。
与他人争吵的次数越少(越小)越好,这样的指标称为极小型指标(成本型指标)。
统一指标类型
为了能统一的分析,我们需要将所有的指标转化为极大型称为指标正向化(最常用)
#如果用到该方法要写到论文里
极小型指标转换为极大型指标的公式:
标准化处理
成绩的单位为分,争吵次数的单位为次,为了消去不同指标量纲的影响, 需要对已经正向化的矩阵进行标准化处理。(成绩的单位为分,争吵次数的单位为次,为了消去不同指标量纲的影响, 需要对已经正向化的矩阵进行标准化处理。)
上图所示,四个评价对象,两个评价指标
标准化处理的计算公式:
如何计算得分
只有一个指标
因为只有一个指标,所以矩阵为n行一列。
构造计算评分的公式
这个公式可以看做
多个指标
有多个指标时,我们可以类比只有一个指标计算得分
有n个要评价的对象,m个评价指标时,Z为n行m列
最小值(最大值)为分别把每一列的最小值(最大值)拿出来构成一个向量
距离为欧氏距离,用最大值减去它里面的每一个元素的平方后按行求和开根号
当 = 0时,得分为0,即第i个对象为最小值时,当 = 0时,得分为0,即第i个评价对象为最大值时
计算得分
TOPSIS法步骤
第一步:将原是矩阵正向化
#注意:正向化的公式不唯一,大家可以结合自己的数据进行适当地修改
常见的四种指标
极小型->极大型
如果所有的元素均为正数,那么也可以使用
中间型->极大型
{}是一组中间型指标序列,且最佳的数值为,那么正向化的公式如下
例:
区间型->极大型
{}是一组区间型指标序列,且最佳的区间为[a,b],那么正向化公式如下
第二步:正向化矩阵标准化
第三步:计算得分并归一化
带权重的TOPSIS法
上文所讲的例子均默认了指标的权重相同,权重不同时,我们应该加上权重,对上文方法稍作更改
各个指标的权重如何判断呢?这时就用到我们之前学过的层次分析法
但是层次分析法主观性太强
Topsis代码详解
主函数
%% 第一步:把数据复制到工作区,并将这个矩阵命名为Xclear;clc
load data_water_quality.mat
%% 注意:如果提示: 错误使用 load,无法读取文件 'data_water_quality.mat'。没有此类文件或目录。
% 那么原因是因为你的Matlab的当前文件夹中不存在这个文件
% 可以使用cd函数修改Matlab的当前文件夹%% 第二步:判断是否需要正向化
[n,m] = size(X);
disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标']) %字符串拼接
Judge = input(['这' num2str(m) '个指标是否需要经过正向化处理,需要请输入1 ,不需要输入0: ']);if Judge == 1Position = input('请输入需要正向化处理的指标所在的列,例如第2、3、6三列需要处理,那么你需要输入[2,3,6]: '); %[2,3,4]disp('请输入需要处理的这些列的指标类型(1:极小型, 2:中间型, 3:区间型) ')Type = input('例如:第2列是极小型,第3列是区间型,第6列是中间型,就输入[1,3,2]: '); %[2,1,3]% 注意,Position和Type是两个同维度的行向量for i = 1 : size(Position,2) %这里需要对这些列分别处理,因此我们需要知道一共要处理的次数,即循环的次数X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));% Positivization是我们自己定义的函数,其作用是进行正向化,其一共接收三个参数% 第一个参数是要正向化处理的那一列向量 X(:,Position(i)) 回顾上一讲的知识,X(:,n)表示取第n列的全部元素% 第二个参数是对应的这一列的指标类型(1:极小型, 2:中间型, 3:区间型)% 第三个参数是告诉函数我们正在处理的是原始矩阵中的哪一列% 该函数有一个返回值,它返回正向化之后的指标,我们可以将其直接赋值给我们原始要处理的那一列向量enddisp('正向化后的矩阵 X = ')disp(X)%正向化后的矩阵后可以放在论文附录中
end%% 第三步:对正向化后的矩阵进行标准化
Z = X ./ repmat(sum(X.*X) .^ 0.5, n, 1);%每个元素都除以其根下所在列元素平方和
disp('标准化矩阵 Z = ')
disp(Z)%% 第四步:计算与最大值的距离和最小值的距离,并算出得分
D_P = sum([(repmat(max(Z),n,1)) .^ 2 - Z],2) .^ 0.5; % D+ 与最大值的距离向量
D_N = sum([(repmat(min(Z),n,1)) .^ 2 - Z],2) .^ 0.5; % D- 与最小值的距离向量
S = D_N ./ (D_P+D_N); % 未归一化的得分
disp('最后的得分为:')
stand_S = S / sum(S) %归一化后的得分
[sorted_S,index] = sort(stand_S ,'descend')%返回排序后的得分和索引
自定义函数Positivization
function [posit_x] = Positivization(x,type,i)
% 输入变量有三个:
% x:需要正向化处理的指标对应的原始列向量
% type: 指标的类型(1:极小型, 2:中间型, 3:区间型)
% i: 正在处理的是原始矩阵中的哪一列
% 输出变量posit_x表示:正向化后的列向量if type == 1 %极小型disp(['第' num2str(i) '列是极小型,正在正向化'] )posit_x = Min2Max(x); %调用Min2Max函数来正向化disp(['第' num2str(i) '列极小型正向化处理完成'] )disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')elseif type == 2 %中间型disp(['第' num2str(i) '列是中间型'] )best = input('请输入最佳的那一个值: ');posit_x = Mid2Max(x,best);disp(['第' num2str(i) '列中间型正向化处理完成'] )disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')elseif type == 3 %区间型disp(['第' num2str(i) '列是区间型'] )a = input('请输入区间的下界: ');b = input('请输入区间的上界: '); posit_x = Inter2Max(x,a,b);disp(['第' num2str(i) '列区间型正向化处理完成'] )disp('~~~~~~~~~~~~~~~~~~~~分界线~~~~~~~~~~~~~~~~~~~~')elsedisp('没有这种类型的指标,请检查Type向量中是否有除了1、2、3之外的其他值')end
end
自定义函数Min2Max
function [posit_x] = Min2Max(x)posit_x = max(x) - x; %向量与常数做加减乘除相当于每一个元素对这个常数做加减乘除%posit_x = 1 ./ x; %如果x全部都大于0,也可以这样正向化
end
自定义函数Mid2Max
function [posit_x] = Mid2Max(x,best)M = max(abs(x-best)); %abs()求绝对值posit_x = 1 - abs(x-best) / M;
end
自定义函数Inter2Max
function [posit_x] = Inter2Max(x,a,b) %a,b为 上下界r_x = size(x,1); % row of x M = max([a-min(x),max(x)-b]);posit_x = zeros(r_x,1); %zeros函数用法: zeros(3) zeros(3,1) ones(3)% 初始化posit_x全为0 初始化的目的是节省处理时间for i = 1: r_xif x(i) < aposit_x(i) = 1-(a-x(i))/M;elseif x(i) > bposit_x(i) = 1-(x(i)-b)/M;elseposit_x(i) = 1;endend
end
基于熵权法对Topsis模型的修正
那么如何度量信息量的大小呢?越有可能发生的事情,信息量越少, 越不可能发生的事情,信息量就越多。
又怎样衡量事情发生的可能性大小呢?概率
如果把信息量用字母 I 表示,概率用p表示,那么我们可以将它们建立一个函数关系:
信息熵的定义
#对于熵权法而言,信息熵越大,信息量越小。
熵权法计算步骤
(2)计算第j项指标下第i个样本所占的比重,并将其看作相对熵计算中用到的概率
%% 第一步:把数据复制到工作区,并将这个矩阵命名为X
% (1)在工作区右键,点击新建(Ctrl+N),输入变量名称为X
% (2)在Excel中复制数据,再回到Excel中右键,点击粘贴Excel数据(Ctrl+Shift+V)
% (3)关掉这个窗口,点击X变量,右键另存为,保存为mat文件(下次就不用复制粘贴了,只需使用load命令即可加载数据)
% (4)注意,代码和数据要放在同一个目录下哦。
clear;clc
load data_water_quality.mat%% 第二步:判断是否需要正向化
[n,m] = size(X);
disp(['共有' num2str(n) '个评价对象, ' num2str(m) '个评价指标'])
Judge = input(['这' num2str(m) '个指标是否需要经过正向化处理,需要请输入1 ,不需要输入0: ']);if Judge == 1Position = input('请输入需要正向化处理的指标所在的列,例如第2、3、6三列需要处理,那么你需要输入[2,3,6]: '); %[2,3,4]disp('请输入需要处理的这些列的指标类型(1:极小型, 2:中间型, 3:区间型) ')Type = input('例如:第2列是极小型,第3列是区间型,第6列是中间型,就输入[1,3,2]: '); %[2,1,3]% 注意,Position和Type是两个同维度的行向量for i = 1 : size(Position,2) %这里需要对这些列分别处理,因此我们需要知道一共要处理的次数,即循环的次数X(:,Position(i)) = Positivization(X(:,Position(i)),Type(i),Position(i));% Positivization是我们自己定义的函数,其作用是进行正向化,其一共接收三个参数% 第一个参数是要正向化处理的那一列向量 X(:,Position(i)) 回顾上一讲的知识,X(:,n)表示取第n列的全部元素% 第二个参数是对应的这一列的指标类型(1:极小型, 2:中间型, 3:区间型)% 第三个参数是告诉函数我们正在处理的是原始矩阵中的哪一列% 该函数有一个返回值,它返回正向化之后的指标,我们可以将其直接赋值给我们原始要处理的那一列向量enddisp('正向化后的矩阵 X = ')disp(X)
end
%% 作业:在这里增加是否需要算加权
% 补充一个基础知识:m*n维的矩阵A 点乘 n维行向量B,等于这个A的每一行都点乘B
% (注意:2017以及之后版本的Matlab才支持,老版本Matlab会报错)
% % 假如原始数据为:
% A=[1, 2, 3;
% 2, 4, 6]
% % 权重矩阵为:
% B=[ 0.2, 0.5 ,0.3 ]
% % 加权后为:
% C=A .* B
% 0.2000 1.0000 0.9000
% 0.4000 2.0000 1.8000
% 类似的,还有矩阵和向量的点除, 大家可以自己试试计算A ./ B
% 注意,矩阵和向量没有 .- 和 .+ 哦 ,大家可以试试,如果计算A.+B 和 A.-B会报什么错误。%% 这里补充一个小插曲
% % 在上一讲层次分析法的代码中,我们可以优化以下的语句:
% % Sum_A = sum(A);
% % SUM_A = repmat(Sum_A,n,1);
% % Stand_A = A ./ SUM_A;
% % 事实上,我们把第三行换成:Stand_A = A ./ Sum_A; 也是可以的哦
% % (再次强调,新版本的Matlab才能运行哦)%% 第三步:对正向化后的矩阵进行标准化
Z = X ./ repmat(sum(X.*X) .^ 0.5, n, 1);
disp('标准化矩阵 Z = ')
disp(Z)%% 让用户判断是否需要增加权重
disp("请输入是否需要增加权重向量,需要输入1,不需要输入0")
Judge = input('请输入是否需要增加权重: ');
if Judge == 1Judge = input('使用熵权法确定权重请输入1,否则输入0: ');if Judge == 1if sum(sum(Z<0)) >0 % 如果之前标准化后的Z矩阵中存在负数,则重新对X进行标准化disp('原来标准化得到的Z矩阵中存在负数,所以需要对X重新标准化')for i = 1:nfor j = 1:mZ(i,j) = [X(i,j) - min(X(:,j))] / [max(X(:,j)) - min(X(:,j))];endenddisp('X重新进行标准化得到的标准化矩阵Z为: ')disp(Z)endweight = Entropy_Method(Z);disp('熵权法确定的权重为:')disp(weight)elsedisp(['如果你有3个指标,你就需要输入3个权重,例如它们分别为0.25,0.25,0.5, 则你需要输入[0.25,0.25,0.5]']);weight = input(['你需要输入' num2str(m) '个权数。' '请以行向量的形式输入这' num2str(m) '个权重: ']);OK = 0; % 用来判断用户的输入格式是否正确while OK == 0 if abs(sum(weight) -1)<0.000001 && size(weight,1) == 1 && size(weight,2) == m % 注意,Matlab中浮点数的比较要小心OK =1;elseweight = input('你输入的有误,请重新输入权重行向量: ');endendend
elseweight = ones(1,m) ./ m ; %如果不需要加权重就默认权重都相同,即都为1/m
end%% 第四步:计算与最大值的距离和最小值的距离,并算出得分
D_P = sum([(Z - repmat(max(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5; % D+ 与最大值的距离向量
D_N = sum([(Z - repmat(min(Z),n,1)) .^ 2 ] .* repmat(weight,n,1) ,2) .^ 0.5; % D- 与最小值的距离向量
S = D_N ./ (D_P+D_N); % 未归一化的得分
disp('最后的得分为:')
stand_S = S / sum(S)
[sorted_S,index] = sort(stand_S ,'descend')% A = magic(5) % 幻方矩阵
% M = magic(n)返回由1到n^2的整数构成并且总行数和总列数相等的n×n矩阵。阶次n必须为大于或等于3的标量。
% sort(A)若A是向量不管是列还是行向量,默认都是对A进行升序排列。sort(A)是默认的升序,而sort(A,'descend')是降序排序。
% sort(A)若A是矩阵,默认对A的各列进行升序排列
% sort(A,dim)
% dim=1时等效sort(A)
% dim=2时表示对A中的各行元素升序排列
% A = [2,1,3,8]
% Matlab中给一维向量排序是使用sort函数:sort(A),排序是按升序进行的,其中A为待排序的向量;
% 若欲保留排列前的索引,则可用 [sA,index] = sort(A,'descend') ,排序后,sA是排序好的向量,index是向量sA中对A的索引。
% sA = 8 3 2 1
% index = 4 3 1 2
function [W] = Entropy_Method(Z)
% 计算有n个样本,m个指标的样本所对应的的熵权
% 输入
% Z : n*m的矩阵(要经过正向化和标准化处理,且元素中不存在负数)
% 输出
% W:熵权,m*1的行向量%% 计算熵权[n,m] = size(Z);D = zeros(1,m); % 初始化保存信息效用值的行向量for i = 1:mx = Z(:,i); % 取出第i列的指标p = x / sum(x);% 注意,p有可能为0,此时计算ln(p)*p时,Matlab会返回NaN,所以这里我们自己定义一个函数e = -sum(p .* mylog(p)) / log(n); % 计算信息熵D(i) = 1- e; % 计算信息效用值endW = D ./ sum(D); % 将信息效用值归一化,得到权重
end
% 重新定义一个mylog函数,当输入的p中元素为0时,返回0
function [lnp] = mylog(p)
n = length(p); % 向量的长度
lnp = zeros(n,1); % 初始化最后的结果for i = 1:n % 开始循环if p(i) == 0 % 如果第i个元素为0lnp(i) = 0; % 那么返回的第i个结果也为0elselnp(i) = log(p(i)); endend
end
这篇关于二、数学建模优劣分析法(TOPSIS法)【清风数学建模个人笔记】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!