OCF资源脚本书写方法

2024-04-22 23:58
文章标签 方法 资源 脚本 书写 ocf

本文主要是介绍OCF资源脚本书写方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文为转载,原文地址:http://www.cnblogs.com/haohao-jishuzhilu/archive/2012/12/18/2823271.html

Open Cluster Framework (OCF) 资源代理

OCF RA 代理最适合用于 High Availability,特别是在您需要主资源或特殊监视功能时。这些代理通常位于 /usr/lib/ocf/resource.d/heartbeat/。其功能与 LSB 脚本的功能相似。但是,它们始终使用环境变量来执行配置,这使它们可以轻松地接受和处理参数。OCF 规范(由于它与资源代理相关)可在http://www.opencf.org/cgi-bin/viewcvs.cgi/specs/ra/resource-agent-api.txt?rev=HEAD 4 中找到。OCF 规范包含以下严格定义:操作必须返回退出代码。群集会严格遵守这些规范。有关详细信息,请参见 http://wiki.linux-ha.orgOCFResourceAgent。

OCF 返回代码

根据 OCF 规范,有一些关于操作必须返回的退出代码的严格定义。群集会始终

检查返回代码与预期结果是否相符。如果结果与预期值不匹配,则将操作视为

失败,并将启动恢复操作。

在实际应用中,如果要对某一个资源是否正常进行监控,可以根据ocf提供的一个虚设资源代理Dummy进行修改即可。

ocf:Dummy — 虚设资源代理

OCF_RESKEY_state=string Dummy [start | stop | monitor | reload | migrate_to |migrate_from | meta-data | validate-all]

这是虚设资源代理。它只跟踪是否在运行,不执行其他任何操作。它在运行中的作用是测试并用作 RA 编写程序的模板。

支持的参数:OCF_RESKEY_state=状态文件,即储存资源状态的位置。

"${HA_VARRUN}/Dummy-${OCF_RESOURCE_INSTANCE}.state"  , 一般在/usr/var/run/下

Eg: /usr/var/run/Dummy-example-check.state,example-check是ocf资源实例的名字,在heartbeat中进行设置即可。

ResourceManager 可以根据这个资源状态文件,来判断被监控的资源状态,从而做出各种判断。

Ocf:Dummy的位置一般在 /usr/lib/ocf/resource.d/pacemaker/Dummy

OCF格式的脚本的写法

这里只提供一种比较简单的方式。

HealthCPU是以Dummy为模板的监控cpu状态的ocf资源监控脚本,也是pacemaker提供的,位置一般在

/usr/lib/ocf/resource.d/pacemaker/HealthCPU

通过分析这个脚本,我们就可以触类旁通的了解ocf格式的脚本

#!/bin/sh  

#   HealthCPU OCF RA. Measures CPUs ideling and writes

#   #health-cpu status into the CIB

#...

# Inc., 59 Temple Place - Suite 330, Boston MA 02111-1307, USA.

#######################################################################

# Initialization://初始化一些ocf资源通用的一些函数资源等

. ${OCF_ROOT}/resource.d/heartbeat/.ocf-shellfuncs

#######################################################################

//metadata 转储resource agent 的元数据到标准输出,这个输出必须遵循一定的格式,//具体的格式参见:http://www.linux-ha.org/doc/dev-guides/_metadata.html

//所有的resource agent 都必须通过一特定的XML格式的元数据描述自己的目标,//以及所支持的参数等,集群管理应用需要这些元数据来提供on-line help,而且//resource agent的操作说明(man pages)也是根据这个元数据来生成的。

meta_data() {

    cat <<END

<?xml version="1.0"?>

<!DOCTYPE resource-agent SYSTEM "ra-api-1.dtd">

<resource-agent name="HealthCPU" version="0.1">//HealthCPU是资源名称

<version>0.1</version>

 

<longdesc lang="en">

Systhem health agent that measures the CPU ideling and updates the #health-cpu attribute.//监控资源说明

</longdesc>

<shortdesc lang="en">System health CPU usage</shortdesc>

 

<parameters>

<parameter name="state" unique="1">// unique (可选的值: 0 或者 1) 表明对于一个特定的资源类型,一个特殊的值必须在集群中唯一. 例如, 一个高可用性的浮动IP地址 需要声明unique — 因为一个IP地址应该在集群中应该唯一

<longdesc lang="en">

Location to store the resource state in.

</longdesc>

<shortdesc lang="en">State file</shortdesc>

<content type="string" default="${HA_VARRUN}/health-cpu-{OCF_RESOURCE_INSTANCE}.state" />//这里是监控资源状态文件的地址和名称,可以直接只将health-cpu改为要监控的资源名

</parameter>

//下面的参数是表示判断资源状态阈值,yellow-limit,red-limit,可以根据资源状态来划分资源运行中出错的等级,还可以再设定其他的资源状态阈值来标识资源的状态,如果资源的状态不是一个数值,可以对资源状态进行评分,然后根据这些阈值来判断状态。当然也可以不设置这些阈值,在监控的时候,当资源正常时直接将状态标记为green,当资源出错时直接标记为yellow 或者red或者failed等。

<parameter name="yellow_limit" unique="1">

<longdesc lang="en">

Lower (!) limit of idle percentage to switch the health attribute to yellow. I.e.

the #health-cpu will go yellow if the %idle of the CPU falls below 50%.

</longdesc>

<shortdesc lang="en">Lower limit for yellow health attribute</shortdesc>

<content type="string" default="50"/>//yellow-limit的类型是string,默认值是50

</parameter>

 

<parameter name="red_limit" unique="1">

<longdesc lang="en">

Lower (!) limit of idle percentage to switch the health attribute to red. I.e.

the #health-cpu will go red if the %idle of the CPU falls below 10%.

</longdesc>

<shortdesc lang="en">Lower limit for red health attribute</shortdesc>

<content type="string" default="10"/>

</parameter>

</parameters>

//监控脚本所支持的参数,是资源监控代理所支持的动作参数,必须支持的有start、stop、monitor、meta-data、validate-all,可选的有promote、demote、migrate_to、 migrate_from 、notify。这里给出建议的timeout等的值

<actions>

<action name="start"        timeout="10" /> //starts the resource,timeout单位是秒

<action name="stop"         timeout="10" />// shuts down the resource.

<action name="monitor"      timeout="10" interval="10" start-delay="0" />//查询资源运行的状态

<action name="meta-data"    timeout="5" />// dumps the resource agent metadata.

<action name="validate-all"   timeout="10" />//确认资源的配置

</actions>

</resource-agent>

END

}

#######################################################################

dummy_usage() {

    cat <<END

usage: $0 {start|stop|monitor|validate-all|meta-data}

Expects to have a fully populated OCF RA-compliant environment set.

END

}

//开启资源监控

dummy_start() {

//这里的cpu资源不需要启动,但是如果是一个应用资源,那么就需要在这里启动这个应用资源,使应用跑起来,然后再监控应用的状态

 dummy_monitor

    if [ $? =  $OCF_SUCCESS ]; then

    return $OCF_SUCCESS

    fi

    touch ${OCF_RESKEY_state}//创建资源状态文件

}

//停止资源监控

dummy_stop() {

    dummy_monitor

    if [ $? =  $OCF_SUCCESS ]; then

    rm ${OCF_RESKEY_state}

//这里的cpu资源不需要关闭,但是如果是一个应用资源,那么就需要在这里关闭这个应用资源,使应用停止

    fi

    return $OCF_SUCCESS

}

//监控资源状态

dummy_monitor() {

    # Monitor _MUST!_ differentiate correctly between running

    # (SUCCESS), failed (ERROR) or _cleanly_ stopped (NOT RUNNING).

    # That is THREE states, not just yes/no.

   

    if [ -f ${OCF_RESKEY_state} ]; then

                    向下:

     

      IDLE=`top -b -n2 | grep Cpu | tail -1 | awk -F",|\.[0-9]%id" '{ print $4 }'`//得到系统的cpu空闲率

 

      if [ $IDLE -lt ${OCF_RESKEY_red_limit} ] ; then

        # echo "System state RED!"

        attrd_updater -n "#health-cpu" -U "red" -d "30s"//更新cpu状态,将状态写入cpu资源状态文件

        return $OCF_SUCCESS

          fi

 

      if [ $IDLE -lt ${OCF_RESKEY_yellow_limit} ] ; then

        # echo "System state yellow."

            attrd_updater -n "#health-cpu" -U "yellow" -d "30s"//持续30s都是这个情况,则将状态改变

      else

        # echo "System state green."

        attrd_updater -n "#health-cpu" -U "green" -d "30s"

          fi

      return $OCF_SUCCESS

 

    fi

      向上                                       

这一部分是监控资源状态的代码,即如果系统cpu超过预设的阈值,则将状态写入资源状态文件,是监控的主要代码。如果是一个应用的监控,则需要check它是否运行正常,然后把它的状态情况写入资源状态文件。

    if false ; then

                return $OCF_ERR_GENERIC

        fi

        return $OCF_NOT_RUNNING//资源监控已经停止了

}

dummy_validate() {

    # Is the state directory writable?

    state_dir=`dirname "$OCF_RESKEY_state"`

    touch "$state_dir/$$"

    if [ $? != 0 ]; then

    return $OCF_ERR_ARGS

    fi

    rm "$state_dir/$$"

    return $OCF_SUCCESS

}

 

: ${OCF_RESKEY_CRM_meta_interval=0}

: ${OCF_RESKEY_CRM_meta_globally_unique:="true"}

//下面设置资源状态文件

if [ "x$OCF_RESKEY_state" = "x" ]; then

    if [ ${OCF_RESKEY_CRM_meta_globally_unique} = "false" ]; then

    state="${HA_VARRUN}/Dummy-${OCF_RESOURCE_INSTANCE}.state"

   

    # Strip off the trailing clone marker

    OCF_RESKEY_state=`echo $state | sed s/:[0-9][0-9]*\.state/.state/`

    else

    OCF_RESKEY_state="${HA_VARRUN}/Dummy-${OCF_RESOURCE_INSTANCE}.state"

    fi

fi

//预设了cpu状态阈

if [ "x${OCF_RESKEY_red_limit}" = "x" ] ; then

  OCF_RESKEY_red_limit=10

fi

if [ "x${OCF_RESKEY_yellow_limit}" = "x" ] ; then

  OCF_RESKEY_yellow_limit=50

fi

 

case $__OCF_ACTION in

meta-data) meta_data

       exit $OCF_SUCCESS

       ;;

start)     dummy_start;;

stop)      dummy_stop;;

monitor)   dummy_monitor;;

validate-all) dummy_validate;;

usage|help)   dummy_usage

       exit $OCF_SUCCESS

       ;;

*)     dummy_usage

       exit $OCF_ERR_UNIMPLEMENTED

       ;;

esac

rc=$?

ocf_log debug "${OCF_RESOURCE_INSTANCE} $__OCF_ACTION : $rc"

exit $rc

 

根据这个例子,可以看出,我们监控某个程序的时候,可以检测后,将它的状态写入资源状态文件,通过这个文件将资源的状态传给资源管理器,从而得到监控资源的目的。 

这篇关于OCF资源脚本书写方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/927224

相关文章

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

浅谈主机加固,六种有效的主机加固方法

在数字化时代,数据的价值不言而喻,但随之而来的安全威胁也日益严峻。从勒索病毒到内部泄露,企业的数据安全面临着前所未有的挑战。为了应对这些挑战,一种全新的主机加固解决方案应运而生。 MCK主机加固解决方案,采用先进的安全容器中间件技术,构建起一套内核级的纵深立体防护体系。这一体系突破了传统安全防护的局限,即使在管理员权限被恶意利用的情况下,也能确保服务器的安全稳定运行。 普适主机加固措施:

webm怎么转换成mp4?这几种方法超多人在用!

webm怎么转换成mp4?WebM作为一种新兴的视频编码格式,近年来逐渐进入大众视野,其背后承载着诸多优势,但同时也伴随着不容忽视的局限性,首要挑战在于其兼容性边界,尽管WebM已广泛适应于众多网站与软件平台,但在特定应用环境或老旧设备上,其兼容难题依旧凸显,为用户体验带来不便,再者,WebM格式的非普适性也体现在编辑流程上,由于它并非行业内的通用标准,编辑过程中可能会遭遇格式不兼容的障碍,导致操

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

Linux服务器Java启动脚本

Linux服务器Java启动脚本 1、初版2、优化版本3、常用脚本仓库 本文章介绍了如何在Linux服务器上执行Java并启动jar包, 通常我们会使用nohup直接启动,但是还是需要手动停止然后再次启动, 那如何更优雅的在服务器上启动jar包呢,让我们一起探讨一下吧。 1、初版 第一个版本是常用的做法,直接使用nohup后台启动jar包, 并将日志输出到当前文件夹n

【VUE】跨域问题的概念,以及解决方法。

目录 1.跨域概念 2.解决方法 2.1 配置网络请求代理 2.2 使用@CrossOrigin 注解 2.3 通过配置文件实现跨域 2.4 添加 CorsWebFilter 来解决跨域问题 1.跨域概念 跨域问题是由于浏览器实施了同源策略,该策略要求请求的域名、协议和端口必须与提供资源的服务相同。如果不相同,则需要服务器显式地允许这种跨域请求。一般在springbo

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出

AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出 在数字化时代,文本到语音(Text-to-Speech, TTS)技术已成为人机交互的关键桥梁,无论是为视障人士提供辅助阅读,还是为智能助手注入声音的灵魂,TTS 技术都扮演着至关重要的角色。从最初的拼接式方法到参数化技术,再到现今的深度学习解决方案,TTS 技术经历了一段长足的进步。这篇文章将带您穿越时

模版方法模式template method

学习笔记,原文链接 https://refactoringguru.cn/design-patterns/template-method 超类中定义了一个算法的框架, 允许子类在不修改结构的情况下重写算法的特定步骤。 上层接口有默认实现的方法和子类需要自己实现的方法

使用JS/Jquery获得父窗口的几个方法(笔记)

<pre name="code" class="javascript">取父窗口的元素方法:$(selector, window.parent.document);那么你取父窗口的父窗口的元素就可以用:$(selector, window.parent.parent.document);如题: $(selector, window.top.document);//获得顶级窗口里面的元素 $(