如何评价2023年亚太杯数学建模竞赛?

2024-06-18 18:12

本文主要是介绍如何评价2023年亚太杯数学建模竞赛?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

APMCM亚太数学建模大赛的含金量在数学建模比赛中虽然不是最高水平,但是也属于比较高的水平了,值得参加试一试。

比如本次C题,

问题一:研究分析影响中国新能源汽车发展的主要因素,建立数学模型,描述这些因素对中国新能源汽车发展的影响。一般在建立模型前需要进行数据搜集与处理。

一般在数据分析或者建模前均需要进行数据预处理,比如对数据进行清洗,转换等等,数据预处理一般是减少数据分析和建模过程中的错误和偏差,所以进行数据预处理是十分有必要的,常见的数据预处理方式有异常值处理、缺失值处理、量纲化处理以及数据标签和数据编码。

异常值处理:

异常值也称离群值,也就是一组数据中,具有显著不同的特征或者数值的数据点,比如身高的数据中有一人身高为10m等等。常见的鉴别异常值标准由数字超过某个标准值,或者超过3倍标准差之外等。检验异常值的方法常见的有描述分析法、聚类、KNN以及图示法等,其中描述分析法和图示法比较简便,,如果数据中有异常值一般会设置null值(不参与分析)或者使用平均值、中位数、众数、随机数等进行填补。

4d09d4b9616c4f1cb64efe8765845153.jpg

缺失值处理

缺失值即在搜集数据或者进行实验等等,缺失的数据,对于缺失值处理常见的方法有将记录删除、直接分析(不进行处理)、线性插值以及该点线性趋势插值。

线性插值:在插值节点上的插值误差为0,只能用于一维数据。

线性趋势插值:在线性插值的基础上,对每个节点进行一次线性回归,得到该点的线性趋势,可以用于多维数据。

量纲化处理:

除了对异常值和缺失值处理外,一般数据还需要处理量纲问题,常见的量纲处理有标准化、归一化、中心化、正向化、逆向化、适度化、区间化等等。 

19a7b1e082934bf5898422014a8a1f0e.jpg

标准化:适用于数据分布不平衡情况,可以使得不同特征之间的数值范围不同的情况下,进行特征之间的比较,一般应用于聚类分析、主成分分析、探索性因子分析等较多。

归一化:适用于数据分布平衡的情况,使得不同特征之间的数值范围相同的情况下,进行特征之间的比较,但是如果数据中有异常值对归一化后的数据影响较大。

中心化:使不同特征之间的数据范围相同,中心化处理一般适用于数据分布不平衡且不需要进行特征之间的比较的情况。

正向化:一般多应用于评价模型中,正向的指标正向化,这种方法适用于指标值越大越好的情况,比如在分析中产品合格率等。

逆向化:一般多应用于评价模型中,逆向的指标逆向化,这种方法适用于指标值越小越好的情况,比如工厂的污染情况等。

适度化:这种方法适用于指标值差异较大的情况,比如消费者对某产品的满意度等。

区间化:这种方法适用于将数据固定压缩到某个范围内,区间化应该比较广,比如产品的质量控制等等。

数据编码及标签:

有的数据比如涉及赋值,1代表高中,2代表大专,3代表本科等等需要数据编码处理,其它如果数据组合形式或者反向题处理,也需要使用数据编码进行处理。数据标签一般用于标识数字的意义,比如某组数据中1代表不满足,2代表一般等等。

关系模型常见包括相关分析、差异分析、回归分析,在数学建模中关系模型可以解决很多问题。

相关分析

相关分析是解决数据之间相关性的一大类问题,不仅有常用的pearson相关,还有Spearman相关、kendall相关、偏相关分析。典型相关分析以及散点图等。 

a179d796bae24bf7bee072ee264a869d.jpg

差异分析

差异分析一般用于检测数据之间是否有差异以及差异是否显著,常见的差异分析有方差分析、t检验、卡方检验以及非参数检验,一般方差分析和t检验需要数据服从正态分布,如果不服从正态分布可以考虑使用非参数检验。

3029b8a37a094e45aa0cb4a35e8fb1a1.jpg

回归分析

回归分析一般研究变量间的影响关系,自变量对因变量的影响,常见的回归模型有线性回、logistic回归、生存分析等。如果因变量为定量数据则使用线性回归更合适,如果因变量为定类变量则使用logistic回归更合适。 

fae9d374b79b45b39a1f6d873415ae73.jpg

问题2 涉及预测模型

数学建模中的预测模型一般利用数据进行建立模型预测未来的趋势或者结果的方法,从而达到解决问题的目的,常见的方法有时间序列、回归分析、机器学习、马尔科夫预测或者其它方法组合预测等等。

d091aae9487341f5b127e49c3a7254cb.jpg

 

其中时间序列模型包括,ARIMA预测、指数平滑法、灰色预测模型、VAR模型以及季节Sarima模型。具体说明如下:

0098533e581847efa7adb06144164f0d.jpg 

 回归分析包括多元线性回归、logistic回归以及非线性回归等,机器学习包括决策树、随机森林、支持向量机、KNN、神经网络以及朴素贝叶斯等,具体可以参考以上描述的。

问题3分析对全球传统能源汽车行业的影响

可以使用回归模型或者权重评价分析等,具体的已经为大家整理好可以收藏此篇回答以备不时之需。

无论选择哪一个题型都需要使用数学模型进行解决模型,那么常见的数学模型有哪些呢?总结如下:

388c5e4cf14645a39396a6609f315802.jpg

01数据预处理

一般在数据分析或者建模前均需要进行数据预处理,比如对数据进行清洗,转换等等,数据预处理一般是减少数据分析和建模过程中的错误和偏差,所以进行数据预处理是十分有必要的,常见的数据预处理方式有异常值处理、缺失值处理、量纲化处理以及数据标签和数据编码。

异常值处理:

异常值也称离群值,也就是一组数据中,具有显著不同的特征或者数值的数据点,比如身高的数据中有一人身高为10m等等。常见的鉴别异常值标准由数字超过某个标准值,或者超过3倍标准差之外等。检验异常值的方法常见的有描述分析法、聚类、KNN以及图示法等,其中描述分析法和图示法比较简便,,如果数据中有异常值一般会设置null值(不参与分析)或者使用平均值、中位数、众数、随机数等进行填补。 

fded083d44dc4b1cbb539118c95327fd.jpg

 缺失值处理

缺失值即在搜集数据或者进行实验等等,缺失的数据,对于缺失值处理常见的方法有将记录删除、直接分析(不进行处理)、线性插值以及该点线性趋势插值。

线性插值:在插值节点上的插值误差为0,只能用于一维数据。

线性趋势插值:在线性插值的基础上,对每个节点进行一次线性回归,得到该点的线性趋势,可以用于多维数据。

量纲化处理:

除了对异常值和缺失值处理外,一般数据还需要处理量纲问题,常见的量纲处理有标准化、归一化、中心化、正向化、逆向化、适度化、区间化等等。

277f44e0da94426fbb3f5fa3809a0170.jpg

标准化:适用于数据分布不平衡情况,可以使得不同特征之间的数值范围不同的情况下,进行特征之间的比较,一般应用于聚类分析、主成分分析、探索性因子分析等较多。

归一化:适用于数据分布平衡的情况,使得不同特征之间的数值范围相同的情况下,进行特征之间的比较,但是如果数据中有异常值对归一化后的数据影响较大。

中心化:使不同特征之间的数据范围相同,中心化处理一般适用于数据分布不平衡且不需要进行特征之间的比较的情况。

正向化:一般多应用于评价模型中,正向的指标正向化,这种方法适用于指标值越大越好的情况,比如在分析中产品合格率等。

逆向化:一般多应用于评价模型中,逆向的指标逆向化,这种方法适用于指标值越小越好的情况,比如工厂的污染情况等。

适度化:这种方法适用于指标值差异较大的情况,比如消费者对某产品的满意度等。

区间化:这种方法适用于将数据固定压缩到某个范围内,区间化应该比较广,比如产品的质量控制等等。

数据编码及标签:

有的数据比如涉及赋值,1代表高中,2代表大专,3代表本科等等需要数据编码处理,其它如果数据组合形式或者反向题处理,也需要使用数据编码进行处理。数据标签一般用于标识数字的意义,比如某组数据中1代表不满足,2代表一般等等。

02基本描述

在正式分析前,还需要对数据的基本情况进行了解,比如数据最大值。最小值等等。常见查看数据基本特征的方法有统计分析法和图示法,统计分析法包括描述分析、频数分析以及分类汇总,图示法包括散点图、箱线图、直方图、簇状图、组合图以及帕累托图等。其中统计分析法是根据数据分析结果进行分析数据的特征,图示法主要是根据图形结合统计知识进行分析,图示法相对直观,统计分析法相对客观。

统计分析法: 

2f860e3c85474a349ba67c3d613d845a.jpg

03关系模型

关系模型常见包括相关分析、差异分析、回归分析,在数学建模中关系模型可以解决很多问题。

相关分析

相关分析是解决数据之间相关性的一大类问题,不仅有常用的pearson相关,还有Spearman相关、kendall相关、偏相关分析。典型相关分析以及散点图等。 

3726731e347c4bc1a70417b0249fd0b8.jpg

差异分析

差异分析一般用于检测数据之间是否有差异以及差异是否显著,常见的差异分析有方差分析、t检验、卡方检验以及非参数检验,一般方差分析和t检验需要数据服从正态分布,如果不服从正态分布可以考虑使用非参数检验。 

dd5c386c49df411abff14fafb09df8d9.jpg

920fcf7ef6164d318f4c07d01a037f10.jpg 

 

这篇关于如何评价2023年亚太杯数学建模竞赛?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1072739

相关文章

使用C#代码计算数学表达式实例

《使用C#代码计算数学表达式实例》这段文字主要讲述了如何使用C#语言来计算数学表达式,该程序通过使用Dictionary保存变量,定义了运算符优先级,并实现了EvaluateExpression方法来... 目录C#代码计算数学表达式该方法很长,因此我将分段描述下面的代码片段显示了下一步以下代码显示该方法如

如何评价Ubuntu 24.04 LTS? Ubuntu 24.04 LTS新功能亮点和重要变化

《如何评价Ubuntu24.04LTS?Ubuntu24.04LTS新功能亮点和重要变化》Ubuntu24.04LTS即将发布,带来一系列提升用户体验的显著功能,本文深入探讨了该版本的亮... Ubuntu 24.04 LTS,代号 Noble NumBAT,正式发布下载!如果你在使用 Ubuntu 23.

uva 10014 Simple calculations(数学推导)

直接按照题意来推导最后的结果就行了。 开始的时候只做到了第一个推导,第二次没有继续下去。 代码: #include<stdio.h>int main(){int T, n, i;double a, aa, sum, temp, ans;scanf("%d", &T);while(T--){scanf("%d", &n);scanf("%lf", &first);scanf

uva 10025 The ? 1 ? 2 ? ... ? n = k problem(数学)

题意是    ?  1  ?  2  ?  ...  ?  n = k 式子中给k,? 处可以填 + 也可以填 - ,问最小满足条件的n。 e.g k = 12  - 1 + 2 + 3 + 4 + 5 + 6 - 7 = 12 with n = 7。 先给证明,令 S(n) = 1 + 2 + 3 + 4 + 5 + .... + n 暴搜n,搜出当 S(n) >=

uva 11044 Searching for Nessy(小学数学)

题意是给出一个n*m的格子,求出里面有多少个不重合的九宫格。 (rows / 3) * (columns / 3) K.o 代码: #include <stdio.h>int main(){int ncase;scanf("%d", &ncase);while (ncase--){int rows, columns;scanf("%d%d", &rows, &col

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

基于UE5和ROS2的激光雷达+深度RGBD相机小车的仿真指南(五):Blender锥桶建模

前言 本系列教程旨在使用UE5配置一个具备激光雷达+深度摄像机的仿真小车,并使用通过跨平台的方式进行ROS2和UE5仿真的通讯,达到小车自主导航的目的。本教程默认有ROS2导航及其gazebo仿真相关方面基础,Nav2相关的学习教程可以参考本人的其他博客Nav2代价地图实现和原理–Nav2源码解读之CostMap2D(上)-CSDN博客往期教程: 第一期:基于UE5和ROS2的激光雷达+深度RG

CSP 2023 提高级第一轮 CSP-S 2023初试题 完善程序第二题解析 未完

一、题目阅读 (最大值之和)给定整数序列 a0,⋯,an−1,求该序列所有非空连续子序列的最大值之和。上述参数满足 1≤n≤105 和 1≤ai≤108。 一个序列的非空连续子序列可以用两个下标 ll 和 rr(其中0≤l≤r<n0≤l≤r<n)表示,对应的序列为 al,al+1,⋯,ar​。两个非空连续子序列不同,当且仅当下标不同。 例如,当原序列为 [1,2,1,2] 时,要计算子序列 [

数学建模笔记—— 非线性规划

数学建模笔记—— 非线性规划 非线性规划1. 模型原理1.1 非线性规划的标准型1.2 非线性规划求解的Matlab函数 2. 典型例题3. matlab代码求解3.1 例1 一个简单示例3.2 例2 选址问题1. 第一问 线性规划2. 第二问 非线性规划 非线性规划 非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。2

每日一题|牛客竞赛|四舍五入|字符串+贪心+模拟

每日一题|四舍五入 四舍五入 心有猛虎,细嗅蔷薇。你好朋友,这里是锅巴的C\C++学习笔记,常言道,不积跬步无以至千里,希望有朝一日我们积累的滴水可以击穿顽石。 四舍五入 题目: 牛牛发明了一种新的四舍五入应用于整数,对个位四舍五入,规则如下 12345->12350 12399->12400 输入描述: 输入一个整数n(0<=n<=109 ) 输出描述: 输出一个整数