本文主要是介绍数据分析(R语言)——ggplot绘制多线图结果图颜色不匹配,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
问题描述:
MelbCV.csv是墨尔本人行道监控数据的一个子集如下图,依据统计数据回答各个监控点一天的哪些时段是行人通过的高峰?所有监控点是否有一致的人流高峰时段?若有,是哪个(些)时段?哪个路口人流量最大?哪个路口人流量最小?依据什么得出的结论?人流量的最大值出现在哪个监控点的哪天的哪个时段?
下面是数据集:
下面是数据集的说明
colname | 含义 | 类型 | 唯一值个数 | 众数 |
---|---|---|---|---|
Date | 日期 | character | 30 | 所有值出现频次相同 |
Year | 年份 | double | 1 | 所有值出现频次相同,2012 |
Month | 月份 | double | 1 | 所有值出现频次相同,9 |
Mdate | 日 | double | 30 | 所有值出现频次相同 |
Weekday_End | 表示周末或工作日,10代表工作日,20代表周末 | double | 2 | 所有值出现频次相同,10,20 |
Day | 表示一周里的第几天,周日是第一天 | double | 7 | 1,7 |
Hour | 表示一天中的第几个小时 | double | 24 | 所有值出现频次相同 |
Town_Hall-West | 在Town_Hall-West的人行道通过人数 | double | 613 | 35 |
Collins Place-South | 在Collins Place-South的人行道通过人数 | double | 485 | 10 |
Australia on Collins | 在Australia on Collins的人行道通过人数 | double | 498 | 16 |
Bourke Street Mall-South | 在Bourke Street Mall-South的人行道通过人数 | double | 552 | 12 |
Bourke Street Mall-North | 在Bourke Street Mall-North的人行道通过人数 | double | 548 | 4 |
Melbourne Central | 在Melbourne Central的人行道通过人数 | double | 598 | 32 |
Flagstaff Station | 在Flagstaff Station的人行道通过人数 | double | 392 | 10 |
State Library | 在State Library的人行道通过人数 | double | 308 | 24 |
下面是相关的部分代码:
alter<-MelbCV
alter[is.na(alter)]<-mean(MelbCV$`State Library`,na.rm=TRUE)#应用平均值
t_peak<-group_by(alter,Hour)%>%summarise(count=n(),mean1=mean(`Town_Hall-West`),mean2=mean(`Collins Place-South`),mean3=mean(`Australia on Collins`),mean4=mean(`Bourke Street Mall-South`),mean5=mean(`Bourke Street Mall-North`),mean6=mean(`Melbourne Central`),mean7=mean(`Flagstaff Station`),mean8=mean(`State Library`))
#col_fill<-factor(colnames(MelbCV[,8:15]))
ggplot(t_peak)+ylab("人数")+geom_line(aes(Hour,mean1,color="tomato"))+geom_line(aes(Hour,mean2,color="orange"))+geom_line(aes(Hour,mean3,color="mediumblue"))+geom_line(aes(Hour,mean4,color="purple"))+geom_line(aes(Hour,mean5,color="gold"))+geom_line(aes(Hour,mean6,color="hotpink"))+geom_line(aes(Hour,mean7,color="green"))+geom_line(aes(Hour,mean8,color="black"))+scale_x_continuous(breaks=seq(0:22))#scale_color_manual(values = c("tomato","orange","mediumblue","purple","gold","hotpink","green","black"),labels=as.vector(col_fill))
做出的图和我设定的颜色没有一毛钱关系
原因分析:
解决方案:
转载自知乎@陆壹肆
根据上面的文章,将上面的代码做了一些修改
alter<-MelbCV
alter[is.na(alter)]<-mean(MelbCV$`State Library`,na.rm=TRUE)#应用平均值
#t_peak里将count列删除了
t_peak<-group_by(alter,Hour)%>%summarise(mean1=mean(`Town_Hall-West`),mean2=mean(`Collins Place-South`),mean3=mean(`Australia on Collins`),mean4=mean(`Bourke Street Mall-South`),mean5=mean(`Bourke Street Mall-North`),mean6=mean(`Melbourne Central`),mean7=mean(`Flagstaff Station`),mean8=mean(`State Library`))
col_fill<-colnames(MelbCV[,8:15])
max_num<-apply(t_peak,2,FUN = function(x) {max(x)
})
max_hour<-apply(t_peak,2,FUN = function(x) {which.max(x)-1
})
#这里增加了将表格融合
library(reshape2)
long_peak <- melt(t_peak, id="Hour")#融合效果如下图一
ggplot(data=long_peak,aes(x=Hour, y=value, group=variable, color=variable))+geom_line()#输出效果如下
这篇关于数据分析(R语言)——ggplot绘制多线图结果图颜色不匹配的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!