本文主要是介绍(助力国赛)美赛O奖数学建模可视化!!!含代码2(箱型图、旭日图、直方图、三元图、平行坐标图、密度图、局部放大图),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
众所周知,数学建模的过程中,将复杂的数据和模型结果通过可视化图形呈现出来,不仅能够帮助我们更深入地理解问题,还能够有效地向评委展示我们的研究成果。
今天,承接《可视化代码1》,作者将与大家分享《可视化代码2》,内含9种强大的数学建模可视化图形及其在实际问题中的应用,包含如下图形:“箱型图”、“旭日图”、“直方图”、“三元图”、“平行坐标图”、“密度图”、“局部放大图”。
如果阅者喜欢此篇分享,认为内容精要、有用、好懂的话,请点赞收藏再走!!!(此为第二部分更新,~~~后续发布第三部分更新)
1. 箱型图:揭示数据分散情况,一目了然的异常检测值检测!
箱型图用于显示一组数据分布情况的标准化方式。它可以展示数据的最小值、第一四分位数(Q1)、中位数、第三四分位数(Q3)以及最大值。箱型图特别适合于比较不同变量的中心位置和分散程度,并且可以用于识别数据中的离群点。
1.1不带有数据点的箱型图
#绘制不带有数据点的箱型图代码如下:
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd# can be `plotly`, `plotly_white`, `plotly_dark`, `ggplot2`, `seaborn`, `simple_white`, `none`
pio.templates.default = 'plotly_white'x = ['day 1', 'day 1', 'day 1', 'day 1', 'day 1', 'day 1','day 2', 'day 2', 'day 2', 'day 2', 'day 2', 'day 2']fig = go.Figure()fig.add_trace(go.Box(y=[0.2, 0.2, 0.6, 1.0, 0.5, 0.4, 0.2, 0.7, 0.9, 0.1, 0.5, 0.3],x=x,name='kale',marker_color='#3D9970'
))
fig.add_trace(go.Box(y=[0.6, 0.7, 0.3, 0.6, 0.0, 0.5, 0.7, 0.9, 0.5, 0.8, 0.7, 0.2],x=x,name='radishes',marker_color='#FF4136'
))
fig.add_trace(go.Box(y=[0.1, 0.3, 0.1, 0.9, 0.6, 0.6, 0.9, 1.0, 0.3, 0.6, 0.8, 0.5],x=x,name='carrots',marker_color='#FF851B'
))fig.update_layout(yaxis_title='normalized moisture',boxmode='group' # group together boxes of the different traces for each value of x
)fig.write_html('test.html')
绘制不带有数据点的箱型图如下图1所示:
1.2带有数据点的箱型图
#绘制带有数据点的箱型图的代码如下:
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np# can be `plotly`, `plotly_white`, `plotly_dark`, `ggplot2`, `seaborn`, `simple_white`, `none`
pio.templates.default = 'plotly_white'fig = go.Figure()
fig.add_trace(go.Box(y=np.random.rand(100), name='trace1'))
fig.add_trace(go.Box(y=np.random.rand(100), name='trace2'))
fig.add_trace(go.Box(y=np.random.rand(100), name='trace3'))# boxpoints 可以为 `all`, `outliers`, `suspectedoutliers`, False
# 使用jitter参数随机对点进行抖动,防止重叠
fig.update_traces(boxpoints='all', jitter=0.2)fig.write_html('test.html')
绘制带有数据点的箱型图如下图2所示:
2 旭日图 :层层深入,洞察数据的层级结构与比例关系!
旭日图是多层次的饼状图,用于显示层级结构中每个级别的大小。从中心向外,每一层代表数据结构的一级。旭日图适用于表现比例关系以及如何将整体分解为不同的部分。
#旭日图的代码
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np# can be `plotly`, `plotly_white`, `plotly_dark`, `ggplot2`, `seaborn`, `simple_white`, `none`
pio.templates.default = 'plotly_white'# 加载数据
df = px.data.gapminder().query("year == 2007")
print(df)fig = px.sunburst(df, path=['continent', 'country'], values='pop',color='lifeExp', hover_data=['iso_alpha'],color_continuous_scale=px.colors.diverging.Tealrose,color_continuous_midpoint=np.average(df['lifeExp'], weights=df['pop']))fig.write_html('test.html')
绘制地图(点)如下图3所示:
3.直方图: 分布一览无余,直观展示数据的频率分布!
直方图是显示数据频率分布的图表。通过将数据分组到连续的、通常是等宽的区间,然后计算每个区间中数据点的数量或比例,以柱状图的形式展示。直方图能够展现数据集中的模式,例如正态分布、偏态分布或者双峰分布等。
#直方图的代码
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pdpio.templates.default = 'ggplot2'# 加载数据
df = px.data.tips()
print(df)fig = px.histogram(df, x="total_bill", color="sex",marginal="rug", # can be `box`, `violin`hover_data=df.columns)fig.write_html('test.html')
绘制地图(线)如下图3所示:
4. 三元图: 三组分的平衡艺术,探索组成成分的相对比例!
三元图是一种三变量图形,常用于展示三个组成部分的比例,它们的总和恒等于一个定值,通常为100%。三元图通常用于地质学和化学,以显示不同成分的相对比例。
#绘制三元图的代码
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np# pandas打印时显示所有列
pd.set_option('display.max_columns', None)# can be `plotly`, `plotly_white`, `plotly_dark`, `ggplot2`, `seaborn`, `simple_white`, `none`
pio.templates.default = 'plotly_white'# 加载数据
df = px.data.election()
print(df.head())fig = px.scatter_ternary(df, a="Joly", b="Coderre", c="Bergeron", hover_name="district",color="winner", size="total", size_max=15,color_discrete_map={"Joly": "blue", "Bergeron": "green", "Coderre": "red"})fig.write_html('test.html')
绘制三元图如下图5所示:
5.平行坐标图: 多维度数据的交错舞蹈,寻找变量间的关联!
平行坐标图用于可视化高维数据的图形。它将每个数据点在每个变量上的值用折线连接起来。所有的变量都被放在平行的直线上,这些直线之间的距离是均等的。这种图可以帮助识别变量之间的相似性和差异性。
5.1 特征全为连续型变量
# 特征为连续型变量的平行坐标图的代码
import plotly.express as px
import pandas as pd# 加载鸢尾花数据集
df = px.data.iris()
print(df.head())# 参数见文档:https://plotly.com/python-api-reference/generated/plotly.express.parallel_coordinates
fig = px.parallel_coordinates(df,# dimensions=['sepal_width', 'sepal_length', 'species_id'],color='species_id',labels={"species_id": "Species", "sepal_width": "Sepal Width", "sepal_length": "Sepal Length","petal_width": "Petal Width", "petal_length": "Petal Length"},color_continuous_scale=px.colors.diverging.Tealrose,color_continuous_midpoint=2
)# 隐藏色柱,色柱对于分类型数据无用处
fig.update_layout(coloraxis_showscale=False)fig.write_html('test.html')
绘制连续型变量的平行坐标图如图6所示:
5.2 特征为离散型变量
# 特征为离散型变量的平行坐标图的代码
import plotly.express as px
import pandas as pddf = px.data.tips()
print(df)fig = px.parallel_categories(df,color="size",color_continuous_scale=px.colors.diverging.Tealrose,color_continuous_midpoint=4
)fig.update_layout(coloraxis_showscale=False)fig.write_html('test.html')
绘制特征为离散型变量的平行坐标图,如图7所示:
6. 密度图: 从数据的密集云雾中,勾勒出概率的轮廓!
密度图也称为核密度估计图,它是直方图的连绑版本,用于显示连续变量的概率密度函数的估计。这种图形可以帮助我们理解数据的分布,特别是当需要比较两个或更多分布时。
#绘制密度图的代码
import plotly.io as pio
import plotly.graph_objs as go
import plotly.express as px
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np# can be `plotly`, `plotly_white`, `plotly_dark`, `ggplot2`, `seaborn`, `simple_white`, `none`
pio.templates.default = 'plotly_white'x = np.random.uniform(-1, 1, size=500)
y = np.random.uniform(-1, 1, size=500)fig = go.Figure(go.Histogram2dContour(x=x,y=y,colorscale='Jet',contours=dict( # 轮廓showlabels=True,labelfont=dict(family='Raleway',color='white'))
))fig.write_html('test.html')
绘制密度图如下图8所示:
7. 局部放大图: 细节观察
局部放大图可以帮助我们放大观察图表中的特定区域,以便更清晰地查看细节。在这里作者分享两种局部放大图。
#第二种局部放大图的代码
import matplotlib.pyplot as plt
from matplotlib.patches import ConnectionPatch
import numpy as npdef zone_and_linked(ax,axins,zone_left,zone_right,x,y,linked='bottom',x_ratio=0.05,y_ratio=0.05):"""缩放内嵌图形,并且进行连线ax: 调用plt.subplots返回的画布。例如: fig,ax = plt.subplots(1,1)axins: 内嵌图的画布。 例如 axins = ax.inset_axes((0.4,0.1,0.4,0.3))zone_left: 要放大区域的横坐标左端点zone_right: 要放大区域的横坐标右端点x: X轴标签y: 列表,所有y值linked: 进行连线的位置,{'bottom','top','left','right'}x_ratio: X轴缩放比例y_ratio: Y轴缩放比例"""xlim_left = x[zone_left]-(x[zone_right]-x[zone_left])*x_ratioxlim_right = x[zone_right]+(x[zone_right]-x[zone_left])*x_ratioy_data = np.hstack([yi[zone_left:zone_right] for yi in y])ylim_bottom = np.min(y_data)-(np.max(y_data)-np.min(y_data))*y_ratioylim_top = np.max(y_data)+(np.max(y_data)-np.min(y_data))*y_ratioaxins.set_xlim(xlim_left, xlim_right)axins.set_ylim(ylim_bottom, ylim_top)ax.plot([xlim_left,xlim_right,xlim_right,xlim_left,xlim_left],[ylim_bottom,ylim_bottom,ylim_top,ylim_top,ylim_bottom],"black")if linked == 'bottom':xyA_1, xyB_1 = (xlim_left,ylim_top), (xlim_left,ylim_bottom)xyA_2, xyB_2 = (xlim_right,ylim_top), (xlim_right,ylim_bottom)elif linked == 'top':xyA_1, xyB_1 = (xlim_left,ylim_bottom), (xlim_left,ylim_top)xyA_2, xyB_2 = (xlim_right,ylim_bottom), (xlim_right,ylim_top)elif linked == 'left':xyA_1, xyB_1 = (xlim_right,ylim_top), (xlim_left,ylim_top)xyA_2, xyB_2 = (xlim_right,ylim_bottom), (xlim_left,ylim_bottom)elif linked == 'right':xyA_1, xyB_1 = (xlim_left,ylim_top), (xlim_right,ylim_top)xyA_2, xyB_2 = (xlim_left,ylim_bottom), (xlim_right,ylim_bottom)con = ConnectionPatch(xyA=xyA_1,xyB=xyB_1,coordsA="data",coordsB="data",axesA=axins,axesB=ax)axins.add_artist(con)con = ConnectionPatch(xyA=xyA_2,xyB=xyB_2,coordsA="data",coordsB="data",axesA=axins,axesB=ax)axins.add_artist(con)# 示例:
if __name__ == '__main__':# x坐标x = np.arange(1, 1001)# 生成y轴数据,并添加随机波动y1 = np.log(x)indexs = np.random.randint(0, 1000, 800)for index in indexs:y1[index] += np.random.rand() - 0.5y2 = np.log(x)indexs = np.random.randint(0, 1000, 800)for index in indexs:y2[index] += np.random.rand() - 0.5y3 = np.log(x)indexs = np.random.randint(0, 1000, 800)for index in indexs:y3[index] += np.random.rand() - 0.5# 绘制主图fig, ax = plt.subplots(1, 1, figsize=(12, 7))ax.plot(x, y1, color='#f0bc94', label='trick-1', alpha=0.7)ax.plot(x, y2, color='#7fe2b3', label='trick-2', alpha=0.7)ax.plot(x, y3, color='#cba0e6', label='trick-3', alpha=0.7)ax.legend(loc='right')# plt.show()# 绘制缩放图axins = ax.inset_axes((0.4, 0.1, 0.4, 0.3))# 在缩放图中也绘制主图所有内容,然后根据限制横纵坐标来达成局部显示的目的axins.plot(x, y1, color='#f0bc94', label='trick-1', alpha=0.7)axins.plot(x, y2, color='#7fe2b3', label='trick-2', alpha=0.7)axins.plot(x, y3, color='#cba0e6', label='trick-3', alpha=0.7)# 局部显示并且进行连线zone_and_linked(ax, axins, 100, 150, x, [y1, y2, y3], 'right')plt.show()
绘制第2种局部放大图如下图9所示:
结语
通过上述9种可视化图形,我们可以更加生动地展示数学建模的结果。你最喜欢哪一种图形?或者你有其他独特的可视化技巧吗?欢迎在评论区分享你的想法和代码,让我们一起探索数学建模的无限魅力! 喜欢请多多关注!!!(后续会发布第三部分的更新)
这篇关于(助力国赛)美赛O奖数学建模可视化!!!含代码2(箱型图、旭日图、直方图、三元图、平行坐标图、密度图、局部放大图)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!