首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
hive3专题
hive3从入门到精通(一)
Hive3入门至精通(基础、部署、理论、SQL、函数、运算以及性能优化)1-14章 第1章:数据仓库基础理论 1-1.数据仓库概念 数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。 数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持(Decision Support)。 数据仓库本身并不“生产”任何数据,其数据来源
阅读更多...
HiveQL练习(hive3.x)
零、准备工作 1. Hive环境安装 参见搭建Hive 3.x环境(CentOS 9 + Hadoop3.x) 2. 准备数据 在虚拟机HOME目录创建如下文件内容: cd /rootvi emp.csv 内容如下: 7369,SMITH,CLERK,7902,1980/12/17,800,,207499,ALLEN,SALESMAN,7698,1981/2/20,1600,3
阅读更多...
使用hive3.x 问题记录
使用 hive3.1.2 问题记录 搭建步骤省略 ... 一、HIVE ON MR 1、第二次以上插入值 insert into table tablename values("xx"); 出现错误: 1)、metastore.RetryingMetaStoreClient: MetaStoreClient lost connection. Attempting to reconnect (1
阅读更多...
Hive3 on Spark3配置
1、软件环境 1.1 大数据组件环境 大数据组件版本Hive3.1.2Sparkspark-3.0.0-bin-hadoop3.2 1.2 操作系统环境 OS版本MacOSMonterey 12.1Linux - CentOS7.6 2、大数据组件搭建 2.1 Hive环境搭建 1)Hive on Spark说明 Hive引擎包括:默认 mr、spark、Tez。 Hive on
阅读更多...
Hive3 on Spark3配置
1、软件环境 1.1 大数据组件环境 大数据组件版本Hive3.1.2Sparkspark-3.0.0-bin-hadoop3.2 1.2 操作系统环境 OS版本MacOSMonterey 12.1Linux - CentOS7.6 2、大数据组件搭建 2.1 Hive环境搭建 1)Hive on Spark说明 Hive引擎包括:默认 mr、spark、Tez。 Hive on
阅读更多...
Hive3 on Spark3配置
1、软件环境 1.1 大数据组件环境 大数据组件版本Hive3.1.2Sparkspark-3.0.0-bin-hadoop3.2 1.2 操作系统环境 OS版本MacOSMonterey 12.1Linux - CentOS7.6 2、大数据组件搭建 2.1 Hive环境搭建 1)Hive on Spark说明 Hive引擎包括:默认 mr、spark、Tez。 Hive on
阅读更多...