首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
班次专题
hadoop入门--使用Apache Pig统计每个航班班次
案例基于hadoop 2.73,伪分布式集群 1,数据包导入hadoop集群hdfs的/user/root目录下 hdfs dfs -copyFromLocal 2008.csv /user/root 2,编写totalmiles.pig脚本 records = LOAD '2008.csv' USING PigStorage(',') AS(Year,Month,DayofMont
阅读更多...
hadoop入门--使用MapReduce统计每个航班班次
案例基于hadoop 2.73,伪分布式集群 一,创建一个MapReduce应用 MapReduce应用结构如图: 1、引入maven依赖 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation="
阅读更多...