R语言并行计算snow包文档(beta)

2023-10-25 01:08

本文主要是介绍R语言并行计算snow包文档(beta),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.snow-clusterCluster-Level on a snow cluster

snow-clusterCluster-Level on a snow cluster
clusterSplit(cl, seq)
clusterCall(cl, fun, …)
clusterApply(cl, x, fun, …)
clusterApplyLB(cl, x, fun, …)
clusterEvalQ(cl, expr)
clusterExport(cl, list, envir = .GlobalEnv)
clusterMap(cl, fun, …, MoreArgs = NULL, RECYCLE = TRUE)
Arguments说明
cl集群对象
fun函数
expr每个节点需执行的表达式
seq需拆分给每个节点的向量
list传递给每个节点的全局变量列表
envir变量模式(默认全局)
x矩阵
欲传递给fun的附加参数
MoreArgsfun的附加参数
RECYCLE逻辑值;如果真,短参数被回收

详细说明
这些是用于集群计算得基本函数。所有在子节点的运行的程序都在tryCatch函数下运行。即如果任何子节点有错误都会在主节点标示出。更能多细节将在以后假如考虑之中。

clusterCall(cl, fun, …)
对每个节点使用同一个函数fun,以列表形式输出每个节点的结果。

clusterEvalQ(cl, expr)
对每个节点使用fun,与clustercall不同的是没有其他参数输入。

clusterApply(cl, x, fun, …)
将矩阵x的每个参数分别分配给每个节点,若x参数超过节点数则循环分配进行计算。

clusterApplyLB(cl, x, fun, …)
clusterApply的均衡加载模式。如果x参数超过节点数剩余参数将分配给已经执行完任务的节点。使用此函数可以更好地利用集群,但是,这种方式降低了计算性能。

clusterMap(cl, fun, …, MoreArgs = NULL, RECYCLE = TRUE)
类似mapply,例子

clusterMap(cl,function(x, y) seq_len(x) + y,c(a =  1, b = 2, c = 3),c(A = 10, B = 0, C = -10))
[[1]]
[1] 11[[2]]
[1] 1 2[[3]]
[1] -9 -8 -7

clusterExport(cl, list, envir = .GlobalEnv)
将list参数作为全局变量传递给每个节点。

clusterSplit(cl, seq)
将seq序列,分配给各个节点,现版本要求序列长度与节点数相同.

> clusterSplit(cl,c(1,2))
[[1]]
[1] 1[[2]]
[1] 2

综合性例子

cl <- makeSOCKcluster(c("localhost","localhost"))#建立集群
clusterApply(cl, 1:2, get("+"), 3)#第一个节点算1+3第二个节点算2+3
clusterEvalQ(cl, library(boot))#每个节点加载lib
x<-1
clusterExport(cl, "x")#每个节点加载x作为环境变量
clusterCall(cl, function(y) x + y, 2)#每个节点计算一次1+3

2.snow-parallel———-Higher Level SNOW functions

snow-parallel———-Higher Level SNOW functions
parLapply(cl, x, fun, …)
parSapply(cl, X, FUN, …, simplify = TRUE, USE.NAMES = TRUE)
parApply(cl, X, MARGIN, FUN, …)
parRapply(cl, x, fun, …)
parCapply(cl, x, fun, …)
parMM(cl, A, B)
Arguments说明
cl集群对象
fun,FUN函数
x,X,A,B矩阵
欲传递给fun的附加参数
MoreArgsfun的附加参数
MARGIN指定要使用的向量维度
simplify逻辑值;参见sapply
USE.NAMES逻辑值;参见sapply

详细说明
1.parLapplyparSapplyparApplylapply,sapply,apply的平行计算版本。
2.parRapplyparCapplyapply的行、列计算的对应版本;比parApply更有效率。
3.parMM:is a very simple(minded) parallel matrix multiply; it is intended as an illustration(还没搞懂功能)
4.更多细节参见:Simple Network of Workstations for R
例子

## Not run:
cl <- makeSOCKcluster(c("localhost","localhost"))
parSapply(cl, 1:20, get("+"), 3)
## End(Not run)
[1]  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
snow-rand 在集群产生随机数
clusterSetupRNG (cl, type = “RNGstream”, …)
clusterSetupRNGstream (cl, seed=rep(12345,6), …)
clusterSetupSPRNG (cl, seed = round(2^32 * runif(1)), prngkind = “default”, para = 0, …)

描述
初始化集群中的随机数,使用 L’Ecuyer或SPRNG的包产生随机数(分别需要rlecuyerSPRING包)。

参数说明
cl集群
type随机数产生方式 type=”RNGstream”(default) type=”SPRNG”
seed随机种子
prngkindSPRNG的发生器形式
para发生器的附加参数

clusterSetupRNG (cl, type = “RNGstream”, …)
1.如果设置了SPRNG参数,会调用clusterSetupSPRNG函数。2.如果设置RNGstream参数,会调用clusterSetupSPRNG函数。
clusterSetupRNGstream (cl, seed=rep(12345,6), …)
加载rsprng包并分别的每个节点初始化。进一步的细节参见init.sprng文档.
clusterSetupSPRNG (cl, seed = round(2^32 * runif(1)), prngkind = “default”, para = 0, …)
加载rlecuyer包,在每个节点创建一个数据流并分配给每个节点。

## Not run:
clusterSetupSPRNG(cl)
clusterSetupSPRNG(cl, seed=1234)
clusterSetupRNG(cl, seed=rep(1,6))
## End(Not run)

3.snow-startstop

snow-startstop Starting and Stopping SNOW Clusters
makeCluster(spec,type = getClusterOption(“type”), …)
stopCluster(cl)
setDefaultClusterOptions(…)
makeSOCKcluster(names,…,options=defaultClusterOptions)
makePVMcluster(count,…,options=defaultClusterOptions)
makeMPIcluster(count,…,options=defaultClusterOptions)
makeNWScluster(names,…,options=defaultClusterOptions)
getMPIcluster()
Arguments参数
spec建立节点的节点参数
count创建节点的个数
names节点名向量
options集群参数设置
cl建立节点的参数
type节点的类型

详细介绍
makeCluster建立集群的函数,支持的集群类型有“sock”,“PVM”,“MPI”,“NWS”。
1. 对于“PVM”和“MPI”集群spec参数应设置为整数形式的节点数量。
2. 对于“SOCK”和“NWS”集群spec 参数应该设置为对应节点组成的字符型向量(ip或hosts地址名)。
3. 对于“SOCK”和“NWS”集群spec 参数在本地模式下也可以设置为数字。
4. 选项rscriptsnowlib很有用,参见下面的例子。

stopCluster在退出R之前使用关闭集群。

setDefaultClusterOptions设置集群默认参数。其中最有用的参数为typehomogeneous
如果Rmpi在搜索路径中,type参数会设置给MPI
如果安装了rpvm包,type参数会设置给PVM`
若上述两个都没找到,设置给“SOCK”。

homogeneous 如果要使用非均匀的集群设置为FLASE;这需要一些额外的设置。默认的设置是TRUE除非在master节点上设置了R_SNOW_LIB非空的数值。

optionoutfile可以用来制定slave节点输出的位置。默认是/dev/null//;这项设置有助于在安装时做故障排除。将路径设置在“”/dev/tty可以slave输出在mater节点上。

makeSOCKcluster, makePVMcluster, makeMPIcluster, and makeNWScluster用来启用相应类型的集群。

在MPI中的进程配置中像用来开启主节点和子节点的mpirun 是不能用的,因为集群在之前已经配置好,可以使用getMPIcluster来获得。

对于SOCKNWS集群选项manual=TRUE可以强制手动开启工作进程。设置outfile选项可以用来做故障排除。
更多细节参见: http://www.stat.uiowa.edu/~luke/R/cluster/cluster.html
例子

## Not run:
## Two workers run on the local machine as a SOCK cluster.
cl <- makeCluster(c("localhost","localhost"), type = "SOCK")
clusterApply(cl, 1:2, get("+"), 3)
stopCluster(cl)
## Another approach to running on the local machine as a SOCK cluster.
cl <- makeCluster(2, type = "SOCK")
clusterApply(cl, 1:2, get("+"), 3)
stopCluster(cl)
## A SOCK cluster with two workers on Mac OS X, two on Linux, and two
## on Windows:
macOptions <-
list(host = "owasso",
rscript = "/Library/Frameworks/R.framework/Resources/bin/Rscript",
snowlib = "/Library/Frameworks/R.framework/Resources/library")
lnxOptions <-
list(host = "itasca",
rscript = "/usr/lib64/R/bin/Rscript",
snowlib = "/home/luke/tmp/lib")
winOptions <-
list(host="192.168.1.168",
rscript="C:/Program Files/R/R-2.7.1/bin/Rscript.exe",
snowlib="C:/Rlibs")
cl <- makeCluster(c(rep(list(macOptions), 2), rep(list(lnxOptions), 2),
rep(list(winOptions), 2)), type = "SOCK")
clusterApply(cl, 1:6, get("+"), 3)
stopCluster(cl)
## End(Not run)

4.snow-timing

snow-timing Timing SNOW CLusters
snow.time(expr)
## S3 method for class ' snowTimingData '
print(x, ...)
## S3 method for class ' snowTimingData '
plot(x, xlab = "Elapsed Time", ylab = "Node",
title = "Cluster Usage", ...)
Arguments参数说明
expr需要计算时间的表达式
x需要画图的时间数据
xlab,ylabx,y坐标名
title图头

说明

snow.time输出 snowTimingData格式的时间数据。
snowTimingData的print方法输出了总运行时间,在主节点和自己点的通信时间和每个节点的计算时间。
plot展示了计算时间的线条图,绿色计算矩形代表计算时间,蓝色横线代表一个子节点的等待时间,红线代表主/子节点的通信时间。
例子

## Not run:
cl <- makeCluster(2,type="SOCK")
x <- rnorm(1000000)
tm <- snow.time(clusterCall(cl, function(x) for (i in 1:100) sum(x), x))
print(tm)
plot(tm)
stopCluster(cl)
## End(Not run)

这篇关于R语言并行计算snow包文档(beta)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/278993

相关文章

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

计算机毕业设计 大学志愿填报系统 Java+SpringBoot+Vue 前后端分离 文档报告 代码讲解 安装调试

🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点赞 👍 收藏 ⭐评论 📝 🍅 文末获取源码联系 👇🏻 精彩专栏推荐订阅 👇🏻 不然下次找不到哟~Java毕业设计项目~热门选题推荐《1000套》 目录 1.技术选型 2.开发工具 3.功能

Codeforces Beta Round #47 C凸包 (最终写法)

题意慢慢看。 typedef long long LL ;int cmp(double x){if(fabs(x) < 1e-8) return 0 ;return x > 0 ? 1 : -1 ;}struct point{double x , y ;point(){}point(double _x , double _y):x(_x) , y(_y){}point op

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

如何确定 Go 语言中 HTTP 连接池的最佳参数?

确定 Go 语言中 HTTP 连接池的最佳参数可以通过以下几种方式: 一、分析应用场景和需求 并发请求量: 确定应用程序在特定时间段内可能同时发起的 HTTP 请求数量。如果并发请求量很高,需要设置较大的连接池参数以满足需求。例如,对于一个高并发的 Web 服务,可能同时有数百个请求在处理,此时需要较大的连接池大小。可以通过压力测试工具模拟高并发场景,观察系统在不同并发请求下的性能表现,从而

C语言:柔性数组

数组定义 柔性数组 err int arr[0] = {0}; // ERROR 柔性数组 // 常见struct Test{int len;char arr[1024];} // 柔性数组struct Test{int len;char arr[0];}struct Test *t;t = malloc(sizeof(Test) + 11);strcpy(t->arr,

C语言指针入门 《C语言非常道》

C语言指针入门 《C语言非常道》 作为一个程序员,我接触 C 语言有十年了。有的朋友让我推荐 C 语言的参考书,我不敢乱推荐,尤其是国内作者写的书,往往七拼八凑,漏洞百出。 但是,李忠老师的《C语言非常道》值得一读。对了,李老师有个官网,网址是: 李忠老师官网 最棒的是,有配套的教学视频,可以试看。 试看点这里 接下来言归正传,讲解指针。以下内容很多都参考了李忠老师的《C语言非