Spark项目智慧城市车流量分析项目之固定卡口下车辆的行车轨迹

本文主要是介绍Spark项目智慧城市车流量分析项目之固定卡口下车辆的行车轨迹,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据集

  • 日期 卡口ID 摄像头编号 车牌号 拍摄时间
  • date monitor_id camera_id car action_time
    车速 道路ID 区域ID
    speed road_id area_id

数据集

模拟数据

2018-06-27 0007 00536 京R66884 2018-06-27 11:30:25 30 41 08
2018-06-27 0005 01726 闵P89564 2018-06-27 09:34:03 19 7 03
2018-06-27 0005 01272 闵P89564 2018-06-27 09:50:39 187 19 05
2018-06-27 0002 00082 闵P89564 2018-06-27 09:34:47 1 28 05
2018-06-27 0003 08417 闵P89564 2018-06-27 09:23:05 171 42 02
2018-06-27 0003 02757 闵P89564 2018-06-27 09:52:35 32 50 04
2018-06-27 0000 03759 沪W87972 2018-06-27 20:02:43 243 25 05
2018-06-27 0002 08652 沪W87972 2018-06-27 20:05:10 51 11 05

代码逻辑
在这里插入图片描述

本地模拟代码

package test;import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;
import org.apache.spark.api.java.function.PairFunction;
import org.apache.spark.api.java.function.VoidFunction;
import org.apache.spark.broadcast.Broadcast;
import scala.Tuple2;import java.util.*;public class Carlearn {public static void main(String[] args) {SparkConf conf = new SparkConf();conf.setMaster("local").setAppName("Carlearn");JavaSparkContext sc = new JavaSparkContext(conf);JavaRDD<String> lineRDD = sc.textFile("monitor_flow_action");//mapToPair 形成一个tuple<卡扣id,车牌号>JavaPairRDD<String, String> rdd2 = lineRDD.mapToPair(new PairFunction<String, String, String>() {@Overridepublic Tuple2<String, String> call(String s) throws Exception {String[] split = s.split("\t");return new Tuple2<>(split[1], split[3]);}});//过滤只留下一个卡扣id为001的信息JavaPairRDD<String, String> rdd3 = rdd2.filter(new Function<Tuple2<String, String>, Boolean>() {@Overridepublic Boolean call(Tuple2<String, String> tuple2) throws Exception {return tuple2._1.equals("0001");}});//map 形成一个个的carJavaRDD<String> rdd4 = rdd3.map(new Function<Tuple2<String, String>, String>() {@Overridepublic String call(Tuple2<String, String> tuple2) throws Exception {return tuple2._2;}});//去重JavaRDD<String> rdd5 = rdd4.distinct();//转换成集合List<String> result = rdd5.collect();//广播变量final Broadcast<List<String>> broadcast = sc.broadcast(result);/*** mapToPair转换成Tuple<车牌号,一行的值>*/JavaPairRDD<String, String> rddA = lineRDD.mapToPair(new PairFunction<String, String, String>() {@Overridepublic Tuple2<String, String> call(String s) throws Exception {String[] split = s.split("\t");return new Tuple2<>(split[3], s);}});//过滤掉只留下卡扣id为001信息的车,JavaPairRDD<String, Iterable<String>> rddC = rddA.filter(new Function<Tuple2<String, String>, Boolean>() {@Overridepublic Boolean call(Tuple2<String, String> tuple2) throws Exception {List<String> carList = broadcast.value();String carId = tuple2._2.split("\t")[3];return carList.contains(carId);}}).groupByKey();rddC.foreach(new VoidFunction<Tuple2<String, Iterable<String>>>() {@Overridepublic void call(Tuple2<String, Iterable<String>> tuple2) throws Exception {Iterator<String> iterator = tuple2._2.iterator();List<Tuple2<String, String>> map = new ArrayList<>();//将时间和卡扣号封装成一个listwhile (iterator.hasNext()) {String next = iterator.next();String time = next.split("\t")[4];String kakouId = next.split("\t")[1];Tuple2<String, String> time_kakou = new Tuple2<>(time, kakouId);map.add(time_kakou);}//通过时间排序,整理出汽车的行车轨迹Collections.sort(map, new Comparator<Tuple2<String, String>>() {@Overridepublic int compare(Tuple2<String, String> o1, Tuple2<String, String> o2) {return o1._1.compareTo(o2._1);}});//打印下行车轨迹String chepai = tuple2._1;System.out.println("汽车号:"+chepai);for (Tuple2<String, String> s : map) {System.out.print("时间:"+s._1+"卡扣:"+s._2+"===>");}System.out.println();}});}
}

结果

06-27 22:39:26卡扣:0005===>时间:2018-06-27 22:40:31卡扣:0008===>时间:2018-06-27 22:41:37卡扣:0005===>时间:2018-06-27 22:42:02卡扣:0000===>时间:2018-06-27 22:43:07卡扣:0002===>时间:2018-06-27 22:44:28卡扣:0004===>时间:2018-06-27 22:45:49卡扣:0001===>时间:2018-06-27 22:51:40卡扣:0005===>时间:2018-06-27 22:53:26卡扣:0008===>时间:2018-06-27 22:54:06卡扣:0007===>时间:2018-06-27 22:57:26卡扣:0004===>时间:2018-06-27 22:57:56卡扣:0005===>时间:2018-06-27 22:58:07卡扣:0006===>时间:2018-06-27 23:00:40卡扣:0006===>时间:2018-06-27 23:01:56卡扣:0008===>时间:2018-06-27 23:04:27卡扣:0004===>时间:2018-06-27 23:04:43卡扣:0003===>时间:2018-06-27 23:05:38卡扣:0001===>时间:2018-06-27 23:09:03卡扣:0007===>时间:2018-06-27 23:09:06卡扣:0005===>时间:2018-06-27 23:09:37卡扣:0004===>时间:2018-06-27 23:11:11卡扣:0007===>时间:2018-06-27 23:12:06卡扣:0001===>时间:2018-06-27 23:12:12卡扣:0008===>时间:2018-06-27 23:14:31卡扣:0002===>时间:2018-06-27 23:16:25卡扣:0007===>时间:2018-06-27 23:23:47卡扣:0000===>时间:2018-06-27 23:24:03卡扣:0008===>时间:2018-06-27 23:26:27卡扣:0003===>时间:2018-06-27 23:29:44卡扣:0001===>时间:2018-06-27 23:30:23卡扣:0003===>时间:2018-06-27 23:33:27卡扣:0007===>时间:2018-06-27 23:34:18卡扣:0002===>时间:2018-06-27 23:34:28卡扣:0002===>时间:2018-06-27 23:34:39卡扣:0001===>时间:2018-06-27 23:39:59卡扣:0005===>时间:2018-06-27 23:45:13卡扣:0001===>时间:2018-06-27 23:48:47卡扣:0004===>
汽车号:京D44143
时间:2018-06-27 02:00:01卡扣:0007===>时间:2018-06-27 02:00:59卡扣:0001===>时间:2018-06-27 02:02:11卡扣:0008===>时间:2018-06-27 02:02:29卡扣:0001===>时间:2018-06-27 02:02:31卡扣:0001===>时间:2018-06-27 02:04:11卡扣:0005===>时间:2018-06-27 02:06:20卡扣:0000===>时间:2018-06-27 02:07:36卡扣:0007===>时间:2018-06-27 02:14:36卡扣:0004===>时间:2018-06-27 02:14:58卡扣:0005===>时间:2018-06-27 02:15:01卡扣:0007===>时间:2018-06-27 02:15:14卡扣:0003===>时间:2018-06-27 02:17:16卡扣:0005===>时间:2018-06-27 02:20:59卡扣:0001===>时间:2018-06-27 02:21:26卡扣:0008===>时间:2018-06-27 02:21:27卡扣:0000===>时间:2018-06-27 02:22:19卡扣:0004===>时间:2018-06-27 02:26:20卡扣:0007===>时间:2018-06-27 02:35:02卡扣:0002===>时间:2018-06-27 02:35:28卡扣:0006===>时间:2018-06-27 02:37:23卡扣:0001===>时间:2018-06-27 02:38:13卡扣:0005===>时间:2018-06-27 02:38:33卡扣:0002===>时间:2018-06-27 02:39:15卡扣:0000===>时间:2018-06-27 02:39:42卡扣:0008===>时间:2018-06-27 02:41:53卡扣:0001===>时间:2018-06-27 02:46:54卡扣:0007===>时间:2018-06-27 02:47:23卡扣:0008===>时间:2018-06-27 02:52:27卡扣:0001===>时间:2018-06-27 02:53:31卡扣:0006===>时间:2018-06-27 03:08:55卡扣:0007===>
汽车号:京R34631
时间:2018-06-27 14:01:24卡扣:0004===>时间:2018-06-27 14:03:36卡扣:0005===>时间:2018-06-27 14:05:04卡扣:0006===>时间:2018-06-27 14:08:40卡扣:0007===>时间:2018-06-27 14:09:29卡扣:0002===>时间:2018-06-27 14:09:51卡扣:0008===>时间:2018-06-27 14:13:40卡扣:0008===>时间:2018-06-27 14:18:55卡扣:0005===>时间:2018-06-27 14:26:54卡扣:0001===>时间:2018-06-27 14:27:20卡扣:0000===>时间:2018-06-27 14:34:02卡扣:0001===>时间:2018-06-27 14:34:39卡扣:0006===>时间:2018-06-27 14:36:10卡扣:0003===>时间:2018-06-27 14:37:08卡扣:0006===>时间:2018-06-27 14:37:30卡扣:0003===>时间:2018-06-27 14:39:25卡扣:0005===>时间:2018-06-27 14:41:00卡扣:0007===>时间:2018-06-27 14:42:03卡扣:0001===>时间:2018-06-27 14:47:36卡扣:0001===>时间:2018-06-27 14:48:16卡扣:0003===>时间:2018-06-27 14:53:22卡扣:0001===>时间:2018-06-27 14:53:34卡扣:0005===>时间:2018-06-27 14:53:54卡扣:0001===>时间:2018-06-27 14:53:56卡扣:0002===>时间:2018-06-27 14:54:14卡扣:0003===>时间:2018-06-27 14:55:44卡扣:0003===>时间:2018-06-27 14:57:27卡扣:0006===>时间:2018-06-27 14:57:53卡扣:0000===>时间:2018-06-27 14:58:12卡扣:0008===>时间:2018-06-27 14:59:11卡扣:0008===>
汽车号:沪V82625

这篇关于Spark项目智慧城市车流量分析项目之固定卡口下车辆的行车轨迹的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/241786

相关文章

IDEA运行spring项目时,控制台未出现的解决方案

《IDEA运行spring项目时,控制台未出现的解决方案》文章总结了在使用IDEA运行代码时,控制台未出现的问题和解决方案,问题可能是由于点击图标或重启IDEA后控制台仍未显示,解决方案提供了解决方法... 目录问题分析解决方案总结问题js使用IDEA,点击运行按钮,运行结束,但控制台未出现http://

解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题

《解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题》文章详细描述了在使用lombok的@Data注解标注实体类时遇到编译无误但运行时报错的问题,分析... 目录问题分析问题解决方案步骤一步骤二步骤三总结问题使用lombok注解@Data标注实体类,编译时

C语言小项目实战之通讯录功能

《C语言小项目实战之通讯录功能》:本文主要介绍如何设计和实现一个简单的通讯录管理系统,包括联系人信息的存储、增加、删除、查找、修改和排序等功能,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录功能介绍:添加联系人模块显示联系人模块删除联系人模块查找联系人模块修改联系人模块排序联系人模块源代码如下

SpringBoot项目中Maven剔除无用Jar引用的最佳实践

《SpringBoot项目中Maven剔除无用Jar引用的最佳实践》在SpringBoot项目开发中,Maven是最常用的构建工具之一,通过Maven,我们可以轻松地管理项目所需的依赖,而,... 目录1、引言2、Maven 依赖管理的基础概念2.1 什么是 Maven 依赖2.2 Maven 的依赖传递机

Vue项目中Element UI组件未注册的问题原因及解决方法

《Vue项目中ElementUI组件未注册的问题原因及解决方法》在Vue项目中使用ElementUI组件库时,开发者可能会遇到一些常见问题,例如组件未正确注册导致的警告或错误,本文将详细探讨这些问题... 目录引言一、问题背景1.1 错误信息分析1.2 问题原因二、解决方法2.1 全局引入 Element

Redis主从/哨兵机制原理分析

《Redis主从/哨兵机制原理分析》本文介绍了Redis的主从复制和哨兵机制,主从复制实现了数据的热备份和负载均衡,而哨兵机制可以监控Redis集群,实现自动故障转移,哨兵机制通过监控、下线、选举和故... 目录一、主从复制1.1 什么是主从复制1.2 主从复制的作用1.3 主从复制原理1.3.1 全量复制

Python 中 requests 与 aiohttp 在实际项目中的选择策略详解

《Python中requests与aiohttp在实际项目中的选择策略详解》本文主要介绍了Python爬虫开发中常用的两个库requests和aiohttp的使用方法及其区别,通过实际项目案... 目录一、requests 库二、aiohttp 库三、requests 和 aiohttp 的比较四、requ

SpringBoot项目启动后自动加载系统配置的多种实现方式

《SpringBoot项目启动后自动加载系统配置的多种实现方式》:本文主要介绍SpringBoot项目启动后自动加载系统配置的多种实现方式,并通过代码示例讲解的非常详细,对大家的学习或工作有一定的... 目录1. 使用 CommandLineRunner实现方式:2. 使用 ApplicationRunne

Redis主从复制的原理分析

《Redis主从复制的原理分析》Redis主从复制通过将数据镜像到多个从节点,实现高可用性和扩展性,主从复制包括初次全量同步和增量同步两个阶段,为优化复制性能,可以采用AOF持久化、调整复制超时时间、... 目录Redis主从复制的原理主从复制概述配置主从复制数据同步过程复制一致性与延迟故障转移机制监控与维

Python在固定文件夹批量创建固定后缀的文件(方法详解)

《Python在固定文件夹批量创建固定后缀的文件(方法详解)》文章讲述了如何使用Python批量创建后缀为.md的文件夹,生成100个,代码中需要修改的路径、前缀和后缀名,并提供了注意事项和代码示例,... 目录1. python需求的任务2. Python代码的实现3. 代码修改的位置4. 运行结果5.