Cloud Foundry中syslog_aggregator的实现分析

2023-12-08 00:32

本文主要是介绍Cloud Foundry中syslog_aggregator的实现分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

        在Cloud Foundry中,用来收集Cloud Foundry各组件日志信息的组件,名为syslog_aggregator。

        syslog_aggregator可以做到方便的收集Cloud Foundry中所有组件的日志信息,并将这些信息进行初步处理,比如说:将不同月份产生的日志,进行分类存储;另外还对同一月份内产生的日志,将其通过不同的日期进行分类。这样的话,当Cloud Foundry平台的开发者,在运营该平台时需要查看Cloud Foundry中某一个组件产生的日志时,可以方便的查找到对应日期的日志。syslog_aggregator除了可以对日志进行分组件,分月份,分日期进行存储外,还提供一些对日志进行打包或剪枝的功能,比如:syslog_aggregator会将一定期限内的日志,进行压缩,以达到节省存储空间的功能;另外syslog_aggregator还会定期对日志进行清除,比如只保存一定期限时间长度的日志,当日志超过该时限,syslog_aggregator会将其清除。

        以下是对syslog_aggregator实现的简单分析:

        syslog_aggregator组件主要包括monit模块,日志管理模块。


monit模块

       monit模块主要是实现:监控syslog_aggregator组件的运行状态,一旦监控过syslog_aggregator组件中该进程不存活时,即刻重启该进程;另外,syslog_aggregator组件还将自身的信息通过cloud_agent传送给NATS,这里的信息包括syslog_aggregator组件所在的宿主机的存活状态以及资源使用情况。

       以下通过monit监控进程的代码:

check process syslog_aggregatorwith pidfile /var/vcap/sys/run/syslog_aggregator/syslog_aggregator.pidstart program "/var/vcap/jobs/syslog_aggregator/bin/syslog_aggregator_ctl start"stop program "/var/vcap/jobs/syslog_aggregator/bin/syslog_aggregator_ctl stop"group vcap
       该段代码中清晰的标明了进程的pid,进程的start命令以及stop命令。

       cloud_agent作为BOSH监控Cloud Foundry组件级信息的辅助工具,负责收集syslog_aggregator组件所在宿主机的运行状态以及资源使用情况,并发送给health_monitor,由health_monitor统一管理。由于cloud_agent不是本文的重点,所以本文不再赘述。


日志管理模块

       实现日志管理,syslog_aggregator是通过启动syslog_aggregator_ctl脚本来实现的。上文中提到的monit模块中,也正是监控这个脚本命令启动的进程。以下来分析一下该脚本的代码实现:

#!/bin/bashRUN_DIR=/var/vcap/sys/run/syslog_aggregator
LOG_DIR=/var/vcap/store/log
JOB_DIR=/var/vcap/jobs/syslog_aggregator
PACKAGE_DIR=/var/vcap/packages/syslog_aggregatorBIN_DIR=$JOB_DIR/bin
PIDFILE=$RUN_DIR/syslog_aggregator.pidsource /var/vcap/packages/common/utils.shcase $1 instart)apt-get -y install rsyslog-relppid_guard $PIDFILE "Syslog aggregator"mkdir -p $RUN_DIRmkdir -p $LOG_DIRchown -R vcap:vcap $LOG_DIRrm -f /etc/cron.daily/bzip_old_logscp -a $BIN_DIR/gzip_old_logs /etc/cron.dailycp -a $BIN_DIR/reap_old_logs /etc/cron.hourlycp -a $BIN_DIR/symlink_logs /etc/cron.hourlycp -a $PACKAGE_DIR/send_error_mail /etc/cron.dailyexec /usr/sbin/rsyslogd -f $JOB_DIR/config/rsyslogd.conf -i $PIDFILE -c 4 \>>$LOG_DIR/rsyslogd.stdout.log \2>>$LOG_DIR/rsyslogd.stderr.log;;stop)kill_and_wait $PIDFILErm /etc/cron.daily/gzip_old_logsrm /etc/cron.hourly/reap_old_logs;;*)echo "Usage: syslog_aggregator_ctl {start|stop}";;esac
       在通过该脚本来实现启动syslog_aggregator进程的时候,使用的是start命令。进入start命令,可以看到,安装了rsyslog-relp;然后通过/var/vcap/packages/common/utils.sh中定义的pid_guard()方法来实现对该进程pid的保护,当系统中已经由相应的进程以该pid在运行时,删除该进程,以保证syslog_aggregator可以按预先设置的pid进行运行;随后创建几个定义好的目录,RUN_DIR,LOG_DIR,还对LOG_DIR进行拥有用户修改。

       脚本中随后的5行代码,涉及到的是Linux操作系统中cron 定期任务删除与添加的实现:

    rm -f /etc/cron.daily/bzip_old_logscp -a $BIN_DIR/gzip_old_logs /etc/cron.dailycp -a $BIN_DIR/reap_old_logs /etc/cron.hourlycp -a $BIN_DIR/symlink_logs /etc/cron.hourlycp -a $PACKAGE_DIR/send_error_mail /etc/cron.daily
        首先在每日的执行任务中删除掉bzip_old_logs任务,如果该任务存在的话;随后将4个任务分别加入到了指定的目录位置,分别是:gzip_old_logs, reap_old_logs, symlink_logs, send_error_mail。也就是让Linux操作系统每天一次执行gzip_old_logs脚本,每小时执行一次reap_old_logs脚本,每小时执行一次symlink_logs脚本,每周一次执行一次send_error_mail脚本。

        添加完这些定义任务之后,syslog_aggregator随后启动了rsyslog server,实现日志服务器的启动:

exec /usr/sbin/rsyslogd -f $JOB_DIR/config/rsyslogd.conf -i $PIDFILE -c 4 \>>$LOG_DIR/rsyslogd.stdout.log \2>>$LOG_DIR/rsyslogd.stderr.log
        启动rsyslog server的具体配置可以参看rsyslogd.conf的各参数:

$MaxMessageSize 4k# Caveat - This always binds to all interfaces (cannot specify otherwise).
$ModLoad imtcp
$InputTCPMaxSessions 1024
$InputTCPServerRun 54321
$PrivDropToUser vcap
$PrivDropToGroup vcap# Write each component's messages to a separate log
# programname is assumed to be 'vcap.<component>'
# Directory is created automatically
$template VcapComponentLogFile, "/var/vcap/store/log/%programname:6:$%/%$year%/%$month%/%$day%/%programname:6:$%.log"
$template VcapComponentLogFormat, "%fromhost-ip% -- %msg%\n"# The initial '-' tells rsyslogd to not sync the file after each write
:programname, startswith, "vcap." -?VcapComponentLogFile;VcapComponentLogFormat# Prevent them from reaching anywhere else
:programname, startswith, "vcap." ~

        当然有server的话,自然会accept来自client的请求,所以在Cloud Foundry中每个组件都会安装一个resyslog的client端,然后启动该client,连接rsyslog server,并发送日志请求,以此来实现日志的传输,又通过刚才涉及到的那些脚本实现对日志的管理。

        以下分析添加到周期性任务中的脚本功能。


        1.gzip_old_logs

        该脚本的实现很简单,如下:

#!/bin/bash
# Compress log files that haven't changed in the last day
find /var/vcap/store/log -type f -mmin +1440 -name '*.log' -exec gzip '{}' \;
         功能为找到/var/vcap/store/log目录下,1440分钟(24小时)内没有被修改的文件,然后进行压缩操作。


        2.symlink_logs

        该脚本实现的是:为每一个当天的创建出来的文件创建符号链接,`date + %Y`执行结果为执行时的年份,依此类推。代码如下:

#!/bin/bash
# create symlinks to today's logs in /var/vcap/store/log
for x in /var/vcap/store/log/*/`date +%Y`/`date +%m`/`date +%d`/* ; do if [ -f "$x" ]; then ln -sf "$x" /var/vcap/store/log; fi; done
     

        3.reap_old_logs

        该脚本实现的是:清除保存已超过7天的日志。代码如下:

#!/bin/bashset -uLOG_DIR=/var/vcap/store/log
# Reap logs that are older than 7 days
DAYS_TO_KEEP=7
let "MIN_TO_KEEP=${DAYS_TO_KEEP}*24*60"# get the last $DAYS_TO_KEEP date to exclude from the rmdirDAYS_TO_EXCLUDE=$(
for i in $(seq 0 ${DAYS_TO_KEEP}); do
date -d "now - $i days" +%Y/%m/%d
done
)
# example output: "2012/09/21|2012/09/20|.....|2012/09/15|2012/09/14"
EGREP_FORMAT_DAYS_TO_EXCLUDE=$(echo $DAYS_TO_EXCLUDE | tr ' ' '|')find ${LOG_DIR} -mmin +${MIN_TO_KEEP} -name '*.log.gz' -exec rm -f '{}' \;# Reap empty dirs in 3 passes, clear empty 'day' dirs, then 'month'
# and lastly 'year'
for i in '/[0-9]{4}/[0-1][0-9]/[0-9]{2}$' \'/[0-9]{4}/[0-1][0-9]$' \'/[0-9]{4}$'; do/usr/bin/find ${LOG_DIR} -type d -empty |egrep -v "${EGREP_FORMAT_DAYS_TO_EXCLUDE}" |egrep ${i} |xargs -r -n 200 rmdir
done
        其中,EGREP_FORMAT_DAYS_TO_EXCLUDE是为了获取一个通过‘|’字符串联起来的字符串,随后实现对指定路径进行清除。

        以上便是对Cloud Foundry中syslog_aggregator的简单分析。


关于作者:

孙宏亮,DAOCLOUD软件工程师。两年来在云计算方面主要研究PaaS领域的相关知识与技术。坚信轻量级虚拟化容器的技术,会给PaaS领域带来深度影响,甚至决定未来PaaS技术的走向。

 


转载请注明出处。

这篇文档更多出于我本人的理解,肯定在一些地方存在不足和错误。希望本文能够对接触Cloud Foundry中syslog_aggregator的人有些帮助,如果你对这方面感兴趣,并有更好的想法和建议,也请联系我。

我的邮箱:allen.sun@daocloud.io

新浪微博:@莲子弗如清 






这篇关于Cloud Foundry中syslog_aggregator的实现分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/467872

相关文章

Spring Boot 3 整合 Spring Cloud Gateway实践过程

《SpringBoot3整合SpringCloudGateway实践过程》本文介绍了如何使用SpringCloudAlibaba2023.0.0.0版本构建一个微服务网关,包括统一路由、限... 目录引子为什么需要微服务网关实践1.统一路由2.限流防刷3.登录鉴权小结引子当前微服务架构已成为中大型系统的标

C# string转unicode字符的实现

《C#string转unicode字符的实现》本文主要介绍了C#string转unicode字符的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随... 目录1. 获取字符串中每个字符的 Unicode 值示例代码:输出:2. 将 Unicode 值格式化

python安装whl包并解决依赖关系的实现

《python安装whl包并解决依赖关系的实现》本文主要介绍了python安装whl包并解决依赖关系的实现,文中通过图文示例介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录一、什么是whl文件?二、我们为什么需要使用whl文件来安装python库?三、我们应该去哪儿下

Python脚本实现图片文件批量命名

《Python脚本实现图片文件批量命名》这篇文章主要为大家详细介绍了一个用python第三方库pillow写的批量处理图片命名的脚本,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录前言源码批量处理图片尺寸脚本源码GUI界面源码打包成.exe可执行文件前言本文介绍一个用python第三方库pi

Java中将异步调用转为同步的五种实现方法

《Java中将异步调用转为同步的五种实现方法》本文介绍了将异步调用转为同步阻塞模式的五种方法:wait/notify、ReentrantLock+Condition、Future、CountDownL... 目录异步与同步的核心区别方法一:使用wait/notify + synchronized代码示例关键

Nginx实现动态封禁IP的步骤指南

《Nginx实现动态封禁IP的步骤指南》在日常的生产环境中,网站可能会遭遇恶意请求、DDoS攻击或其他有害的访问行为,为了应对这些情况,动态封禁IP是一项十分重要的安全策略,本篇博客将介绍如何通过NG... 目录1、简述2、实现方式3、使用 fail2ban 动态封禁3.1 安装 fail2ban3.2 配

Java中实现订单超时自动取消功能(最新推荐)

《Java中实现订单超时自动取消功能(最新推荐)》本文介绍了Java中实现订单超时自动取消功能的几种方法,包括定时任务、JDK延迟队列、Redis过期监听、Redisson分布式延迟队列、Rocket... 目录1、定时任务2、JDK延迟队列 DelayQueue(1)定义实现Delayed接口的实体类 (

将java程序打包成可执行文件的实现方式

《将java程序打包成可执行文件的实现方式》本文介绍了将Java程序打包成可执行文件的三种方法:手动打包(将编译后的代码及JRE运行环境一起打包),使用第三方打包工具(如Launch4j)和JDK自带... 目录1.问题提出2.如何将Java程序打包成可执行文件2.1将编译后的代码及jre运行环境一起打包2

通俗易懂的Java常见限流算法具体实现

《通俗易懂的Java常见限流算法具体实现》:本文主要介绍Java常见限流算法具体实现的相关资料,包括漏桶算法、令牌桶算法、Nginx限流和Redis+Lua限流的实现原理和具体步骤,并比较了它们的... 目录一、漏桶算法1.漏桶算法的思想和原理2.具体实现二、令牌桶算法1.令牌桶算法流程:2.具体实现2.1

MySQL8.0设置redo缓存大小的实现

《MySQL8.0设置redo缓存大小的实现》本文主要在MySQL8.0.30及之后版本中使用innodb_redo_log_capacity参数在线更改redo缓存文件大小,下面就来介绍一下,具有一... mysql 8.0.30及之后版本可以使用innodb_redo_log_capacity参数来更改