在Linux中搭建Pentaho Server集群,并使用MySQL作为存储库、Nginx做反向代理与负载均衡

本文主要是介绍在Linux中搭建Pentaho Server集群,并使用MySQL作为存储库、Nginx做反向代理与负载均衡,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、准备工作

1、本文环境

名称CentOSJDKMySQLPentaho ServerNginx
版本7.91.85.79.11.20.1

2、集群规划

主机名IP应用
pentaho-server1192.168.198.31Pentaho Server
pentaho-server2192.168.198.32Pentaho Server
pentaho-server3192.168.198.33Pentaho Server
nginx-mysql192.168.198.34Nginx、MySQL

二、部署Pentaho Server集群

注意:本文所搭建的Pentaho Server集群是基于之前安装的Pentaho Server单机版对配置文件的进一步修改,若未搭建过单机版请参考《Pentaho Server单机版部署文档》进行基础的配置

1、将单机版的Pentaho Server拷贝至pentaho-server1节点中

[root@pentaho-server ~]# scp -r /opt/module/pentaho-server root@pentaho-server1:/opt/module/

2、在pentaho-server1节点中修改MySQL脚本文件

修改MySQL脚本中默认的密码、字符集编码以及赋予用户远程连接的权限

[root@pentaho-server1 ~]# cd /opt/module/pentaho-server/
[root@pentaho-server1 pentaho-server]# vim data/mysql/create_jcr_mysql.sql

在这里插入图片描述

[root@pentaho-server1 pentaho-server]# vim data/mysql/create_quartz_mysql.sql

在这里插入图片描述

[root@pentaho-server1 pentaho-server]# vim data/mysql/create_repository_mysql.sql

在这里插入图片描述

3、在nginx-mysql节点中执行MySQL脚本

3.1、拷贝脚本至MySQL所在服务器中
[root@pentaho-server1 pentaho-server]# scp -r data/mysql/* root@nginx-mysql:/root/software

在这里插入图片描述

3.2、执行脚本

在安装MySQL的服务器(本文MySQL安装在nginx-mysql主机中)上登录MySQL,执行以上脚本创建Pentaho Server所需的用户以及数据库

# 查看脚本是否拷贝成功
[root@nginx-mysql ~]# cd /root/software/
[root@nginx-mysql software]# ll

在这里插入图片描述

# 登录MySQL
[root@nginx-mysql ~]# mysql -uroot -p
# 执行脚本文件
mysql> source /root/software/create_jcr_mysql.sql;
mysql> source /root/software/create_quartz_mysql.sql;
mysql> source /root/software/create_repository_mysql.sql;

4、在pentaho-server1节点中清理单机版运行后产生的一些文件

[root@pentaho-server1 ~]# cd /opt/module/pentaho-server/
[root@pentaho-server1 pentaho-server]# rm -rf tomcat/temp/*
[root@pentaho-server1 pentaho-server]# rm -rf tomcat/work/*
[root@pentaho-server1 pentaho-server]# rm -rf pentaho-solutions/system/jackrabbit/repository/*

5、在pentaho-server1节点中修改配置文件

5.1、配置 Jackrabbit 日志(修改repository.xml配置文件)
[root@pentaho-server1 pentaho-server]# vim pentaho-solutions/system/jackrabbit/repository.xml

注意:修改集群id时,请确保集群每个节点的id是唯一
在这里插入图片描述

5.2、配置 Quartz 调度(修改quartz.properties配置文件)
[root@pentaho-server1 pentaho-server]# vim pentaho-solutions/system/quartz/quartz.properties
5.2.1、找到org.quartz.scheduler.instanceId = 1配置项,并将 1 改为 AUTO

在这里插入图片描述

5.2.2、找到#_replace_jobstore_properties部分的org.quartz.jobStore.isClustered配置项,将其值设置为true,并在其下面添加org.quartz.jobStore.clusterCheckinInterval = 20000配置内容

在这里插入图片描述

6、将pentaho-server1节点上修改好配置的Pentaho Server拷贝至集群的其他节点

# 将Pentaho Server拷贝至pentaho-server2中
[root@pentaho-server1 ~]# scp -r /opt/module/pentaho-server root@pentaho-server2:/opt/module/
# 将Pentaho Server拷贝至pentaho-server3中
[root@pentaho-server1 ~]# scp -r /opt/module/pentaho-server root@pentaho-server3:/opt/module/

7、修改集群其他节点repository.xml配置文件中的集群id

7.1、修改pentaho-server2中的配置文件
[root@pentaho-server2 ~]# cd /opt/module/pentaho-server/
[root@pentaho-server2 pentaho-server]# vim pentaho-solutions/system/jackrabbit/repository.xml

在这里插入图片描述

7.1、修改pentaho-server3中的配置文件
[root@pentaho-server3 ~]# cd /opt/module/pentaho-server/
[root@pentaho-server3 pentaho-server]# vim pentaho-solutions/system/jackrabbit/repository.xml

在这里插入图片描述

8、分别在集群的各个节点启动Pentaho Server并监听日志

8.1、在pentaho-server1中启动并监听日志信息是否有报错
[root@pentaho-server1 ~]# cd /opt/module/pentaho-server/
[root@pentaho-server1 pentaho-server]# ./start-pentaho.sh
[root@pentaho-server1 pentaho-server]# tail -f tomcat/logs/pentaho.log

在这里插入图片描述
在这里插入图片描述

8.2、在pentaho-server2中启动并监听日志信息是否有报错
[root@pentaho-server2 ~]# cd /opt/module/pentaho-server/
[root@pentaho-server2 pentaho-server]# ./start-pentaho.sh
[root@pentaho-server2 pentaho-server]# tail -f tomcat/logs/pentaho.log
8.3、在pentaho-server3中启动并监听日志信息是否有报错
[root@pentaho-server3 ~]# cd /opt/module/pentaho-server/
[root@pentaho-server3 pentaho-server]# ./start-pentaho.sh
[root@pentaho-server3 pentaho-server]# tail -f tomcat/logs/pentaho.log

9、在浏览器中测试各服务节点是否能正常访问,用户名:admin、默认密码:password

在这里插入图片描述

三、配置Nginx反向代理与负载均衡(nginx-mysql节点

1、添加pentaho.conf的Nginx配置文件

1.1、通过查看Nginx的主配置文件可知,Nginx会将/etc/nginx/conf.d/目录下的所有.conf结尾的配置文件导入主配置文件中
[root@nginx-mysql ~]# cd /etc/nginx/
[root@nginx-mysql nginx]# vim nginx.conf

在这里插入图片描述

1.2、在/etc/nginx/conf.d/目录下新建pentaho.conf配置文件,并加入如下配置内容
[root@nginx-mysql nginx]# cd conf.d/
[root@nginx-mysql conf.d]# vim pentaho.conf
upstream pentaho {server pentaho-server1:8080;server pentaho-server2:8080;server pentaho-server3:8080;ip_hash;
}server {listen    8080;server_name localhost;access_log /tmp/logs/nginx/pentaho-access.log;error_log /tmp/logs/nginx/pentaho-error.log;location / {proxy_pass  http://pentaho;proxy_set_header  Host    $host:8080;proxy_set_header  X-Real-IP    $remote_addr;proxy_set_header  X-Forwarded-For $proxy_add_x_forwarded_for;}          
}

2、检查配置文件是否有误并重启nginx

[root@nginx-mysql ~]# nginx -t
[root@nginx-mysql ~]# nginx -s reload

在这里插入图片描述

3、配置好并重启nginx后,测试是否能正常访问

在这里插入图片描述
在这里插入图片描述

四、客户端连接测试

1、打开客户端工具,点击右上角的Connect、接着点击Repository Manager

在这里插入图片描述

2、根据下图步骤,填写连接信息

在这里插入图片描述
在这里插入图片描述

3、输入用户名和密码后点击Connect即可连接到Pentaho Server

在这里插入图片描述

4、测试创建一个 作业或者转换 并将其保存到合适的位置

在这里插入图片描述
在这里插入图片描述

5、访问WEB端浏览文件存储的对应位置即可查看到上一步保存的 作业

在这里插入图片描述
以上为Pentaho Server集群部署教程!

这篇关于在Linux中搭建Pentaho Server集群,并使用MySQL作为存储库、Nginx做反向代理与负载均衡的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/706399

相关文章

SQL中的外键约束

外键约束用于表示两张表中的指标连接关系。外键约束的作用主要有以下三点: 1.确保子表中的某个字段(外键)只能引用父表中的有效记录2.主表中的列被删除时,子表中的关联列也会被删除3.主表中的列更新时,子表中的关联元素也会被更新 子表中的元素指向主表 以下是一个外键约束的实例展示

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

服务器集群同步时间手记

1.时间服务器配置(必须root用户) (1)检查ntp是否安装 [root@node1 桌面]# rpm -qa|grep ntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-10.el6.centos.x86_64 (2)修改ntp配置文件 [r

如何去写一手好SQL

MySQL性能 最大数据量 抛开数据量和并发数,谈性能都是耍流氓。MySQL没有限制单表最大记录数,它取决于操作系统对文件大小的限制。 《阿里巴巴Java开发手册》提出单表行数超过500万行或者单表容量超过2GB,才推荐分库分表。性能由综合因素决定,抛开业务复杂度,影响程度依次是硬件配置、MySQL配置、数据表设计、索引优化。500万这个值仅供参考,并非铁律。 博主曾经操作过超过4亿行数据

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

HDFS—存储优化(纠删码)

纠删码原理 HDFS 默认情况下,一个文件有3个副本,这样提高了数据的可靠性,但也带来了2倍的冗余开销。 Hadoop3.x 引入了纠删码,采用计算的方式,可以节省约50%左右的存储空间。 此种方式节约了空间,但是会增加 cpu 的计算。 纠删码策略是给具体一个路径设置。所有往此路径下存储的文件,都会执行此策略。 默认只开启对 RS-6-3-1024k

HDFS—集群扩容及缩容

白名单:表示在白名单的主机IP地址可以,用来存储数据。 配置白名单步骤如下: 1)在NameNode节点的/opt/module/hadoop-3.1.4/etc/hadoop目录下分别创建whitelist 和blacklist文件 (1)创建白名单 [lytfly@hadoop102 hadoop]$ vim whitelist 在whitelist中添加如下主机名称,假如集群正常工作的节