下载并安装集成软件包以在 Cray Linux 系统上运行 LSF

2024-01-30 14:52

本文主要是介绍下载并安装集成软件包以在 Cray Linux 系统上运行 LSF,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

程序
1、在 Cray Linux (在 Cray XT/XE/XC 上) 集成上下载 LSF 集成的安装包和分发 tar 文件。
例如,在 LSF V 10.1.0中,需要以下文件:

  • lsf10.1.0_lnx26-lib23-x64-cray.tar.Z
  • Intstaller 软件包:

lsf10.1.0_lsfinstall.tar.Z
这是标准安装程序软件包。 在具有除 x86-64 以外的混合系统 ( zLinux除外) 的异构集群中使用此软件包。 需要大约 1 GB 可用空间。

lsf10.1.0_lsfinstall_linux_x86_64.tar.Z
在同类 x86-64 集群中使用此较小的安装程序包。 如果添加其他非 x86-64 主机,那么必须使用标准安装程序软件包。 大约需要 100 MB 可用空间。

lsf10.1.0_no_jre_lsfinstall.tar.Z 对于不需要 JRE 的所有平台。 必须已在系统上安装 JRE V 1.4 或更高版本。 大约需要 1 MB 可用空间。

2、确认 Cray Linux 系统正在工作。
a.在 CLE 4.0 或更高版本上,确认是否存在 /opt/cray/rca/default/bin/rca-helper, /etc/xthostname 和 /etc/opt/cray/sdb/node_classes。 否则,请确认 xtuname 和 xthostname 命令存在并且位于 $PATH中。

b.确认所有计算 PE 都处于批处理方式。 如果没有,请将所有计算 PE 切换到批处理方式,然后在引导节点上重新启动 ALPS 服务:

  • xtprocadmin -k m batch
  • $/etc/init.d/alps restart(可选)
  • apstat -rn(可选)

3、遵循标准 LSF 安装过程在引导节点上安装 LSF 。
a.运行 xtopview 命令以切换到共享根文件系统。
b.将 Cray Linux 机器添加到现有集群。
有关更多详细信息,请参阅升级/迁移指示信息。

c.编辑 install.config 文件并设置以下安装参数:

  • LSF_TOP=/software/lsf
  • LSF_CLUSTER_NAME=<crayxt_machine_name>
  • LSF_MASTER_LIST=<管理_host_candidates> (登录节点名或服务节点名的列表)
  • EGO_DAEMON_CONTROL=N
  • ENABLE_DYNAMIC_HOSTS=N
  • LSF_ADD_SERVERS=
  • CONFIGURATION_TEMPLATE=PARALLEL

LSF_MASTER_LIST 和 LSF_ADD_SERVERS 参数应仅包含登录节点或服务节点。

LSF 守护程序的启动和关闭脚本位于 $LSF_SERVERDIR/lsf_daemons中。

4、作为 LSF 管理员,创建并使用 LSF-HPC 服务。
a.将以下行添加到 /opt/xt-boot/default/etc/serv_cmd 文件:

  • service_cmd_info=‘LSF-HPC’,service_num=XXX,heartbeat=null
  • start_cmd=‘<$LSF_SERVERDIR>/lsf_daemons start’
  • stop_cmd=‘<$LSF_SERVERDIR>/lsf_daemons stop’
  • restart_cmd=‘<$LSF_SERVERDIR>/lsf_daemons restart’
  • fail_cmd=‘<$LSF_SERVERDIR>/lsf_daemons stop’

b.创建服务命令: xtservcmd2db -f /opt/xt-boot/default/etc/serv_cmd。
c.将 LSF-HPC 服务分配给 serv_cmd: xtservconfig -c login add LSF-HPC。
d.退出 xtopview 并访问登录节点。

  • 确保 /ufs 在所有登录/服务节点之间共享,并且 root 用户和 LSF 管理员具有写许可权。
  • 在 /ufs 下设置与 /opt/xt-lsfhpc/log 和 /opt/xt-lsfhpc/work 相同的子目录 (请参阅
    “文件结构” 部分以获取详细信息)。
  • 确保保留目录所有权和许可权方式 (可以使用 cp -r 命令) ,并且 root 用户和 LSF 管理员对
    /ufs/lsfhpc下的子目录具有写许可权。

5、使用 module 命令来设置 LSF 环境变量。
module load xt-lsfhpc

这篇关于下载并安装集成软件包以在 Cray Linux 系统上运行 LSF的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/660611

相关文章

在Linux中改变echo输出颜色的实现方法

《在Linux中改变echo输出颜色的实现方法》在Linux系统的命令行环境下,为了使输出信息更加清晰、突出,便于用户快速识别和区分不同类型的信息,常常需要改变echo命令的输出颜色,所以本文给大家介... 目python录在linux中改变echo输出颜色的方法技术背景实现步骤使用ANSI转义码使用tpu

linux hostname设置全过程

《linuxhostname设置全过程》:本文主要介绍linuxhostname设置全过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录查询hostname设置步骤其它相关点hostid/etc/hostsEDChina编程A工具license破解注意事项总结以RHE

Linux中压缩、网络传输与系统监控工具的使用完整指南

《Linux中压缩、网络传输与系统监控工具的使用完整指南》在Linux系统管理中,压缩与传输工具是数据备份和远程协作的桥梁,而系统监控工具则是保障服务器稳定运行的眼睛,下面小编就来和大家详细介绍一下它... 目录引言一、压缩与解压:数据存储与传输的优化核心1. zip/unzip:通用压缩格式的便捷操作2.

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Python中win32包的安装及常见用途介绍

《Python中win32包的安装及常见用途介绍》在Windows环境下,PythonWin32模块通常随Python安装包一起安装,:本文主要介绍Python中win32包的安装及常见用途的相关... 目录前言主要组件安装方法常见用途1. 操作Windows注册表2. 操作Windows服务3. 窗口操作

Linux中SSH服务配置的全面指南

《Linux中SSH服务配置的全面指南》作为网络安全工程师,SSH(SecureShell)服务的安全配置是我们日常工作中不可忽视的重要环节,本文将从基础配置到高级安全加固,全面解析SSH服务的各项参... 目录概述基础配置详解端口与监听设置主机密钥配置认证机制强化禁用密码认证禁止root直接登录实现双因素

在Spring Boot中集成RabbitMQ的实战记录

《在SpringBoot中集成RabbitMQ的实战记录》本文介绍SpringBoot集成RabbitMQ的步骤,涵盖配置连接、消息发送与接收,并对比两种定义Exchange与队列的方式:手动声明(... 目录前言准备工作1. 安装 RabbitMQ2. 消息发送者(Producer)配置1. 创建 Spr

如何在Spring Boot项目中集成MQTT协议

《如何在SpringBoot项目中集成MQTT协议》本文介绍在SpringBoot中集成MQTT的步骤,包括安装Broker、添加EclipsePaho依赖、配置连接参数、实现消息发布订阅、测试接口... 目录1. 准备工作2. 引入依赖3. 配置MQTT连接4. 创建MQTT配置类5. 实现消息发布与订阅

在Linux终端中统计非二进制文件行数的实现方法

《在Linux终端中统计非二进制文件行数的实现方法》在Linux系统中,有时需要统计非二进制文件(如CSV、TXT文件)的行数,而不希望手动打开文件进行查看,例如,在处理大型日志文件、数据文件时,了解... 目录在linux终端中统计非二进制文件的行数技术背景实现步骤1. 使用wc命令2. 使用grep命令

Linux如何快速检查服务器的硬件配置和性能指标

《Linux如何快速检查服务器的硬件配置和性能指标》在运维和开发工作中,我们经常需要快速检查Linux服务器的硬件配置和性能指标,本文将以CentOS为例,介绍如何通过命令行快速获取这些关键信息,... 目录引言一、查询CPU核心数编程(几C?)1. 使用 nproc(最简单)2. 使用 lscpu(详细信