SAS︱操作语句(if、do、select、retain、array)、宏语言、统计量、运算符号

2023-12-21 03:38

本文主要是介绍SAS︱操作语句(if、do、select、retain、array)、宏语言、统计量、运算符号,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!



每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~

———————————————————————————


SAS中的一些常见的符号。运算符是一种符号
①比较算符
②算术算符
③逻辑算符
④其它算符


运算符号

比较算符含义
#NAME?等于
^= 、 NE不等于
> 、 GT大于
< 、 LT小于
>= 、 GE大于等于
<= 、 LE小于等于
IN等于列表中的一个

算术算符


比较算符含义
**乘方
*
/
+
-

逻辑运算符


运算符

含义

^、NOT

逻辑非

&、AND

逻辑与

|、OR

逻辑或


——————————————————————————————————————————————————————————


一、操作语句


1、if语句

/*if语句*/
if x then delete;
if x=1 then y=1;
else
if x=2 then y=2;else
y=3;
/*抒写结构很有趣*/if status in (1,2) then newstat="single";
else newstat="not single";
/*表达式的写法*/
if代表判断,为真则执行then后面的内容。
其中newstat代表新的变量。

用途1:筛选变量

data d1 d2;  
set sashelp.class;  
if _n_ le 10 then output d1;  
else output d2;  
run;  
其中的le 代表小于等于10,

用途2:do强化if的效率

If age>14 then hcm=30.5*height/12;if age>14 then do;hcm=30.5*height/12;end;
对比一下两个的关系,第一个是传统的if-then的组合,后面加上do-end,看上去多余,但是这样做之后,可以极大的增加运算效率。

2、select语句

select语句
select;
when (a=1) x=a*10;
when (a=2);
when (a in (3.4.5)) x=a*100;
otherwise;
end;
类似if-then代表着如果when满足a=1,则x=a*10。

不过需要注意繁杂的的otherwiese 以及end作为必要后缀。

3、do语句

DO语句必须由一个END语句来结束。DO和END语句之间的这些语句称为一个DO组。

do语句有三类样式:简单DO语句;循环DO语句;do over语句

第一类的简单do,可见if中的用途2,强化了if的效率

第二类do,实质是循环,下面有一些常用写do语句的方式:

do i=1 to n ;
do i=n to 1 by –1;
do i=1 to k-1, k+1 to n;
do i=2, 3, 5, 7, 11, 13, 17;
do i=0.1 to 0.9 by 0.1, 1 to 10 by 1, 20 to 100 by 10;
do i='saturday', 'sunday';
do i=‘A’ to ‘Z’;

一个例子:自然数求和、自然数平方和

自然数求和、自然数平方和
data a2;
t=0; s=0;do n=1 to 100;t=t + n;/*n累加*/s=s + n**2;/*n2累加*/output;end;
run;

4、array语句

ARRAY语句用于定义数组。数组通常由一组变量构成。利用数组可以简化很多复杂的数据处理过程。 SAS系统引用数组等价于引用构成数组的那一组变量。

data aa2;
array c{4} (2,4,6,8);
run;

5、retain语句——变量存储

利用retain语句可以很方便地实现观测值累加、累乘、缺失观测填充等复杂的数据处理。

(1)用于填充缺失值:

data a12;set resdat.ymret;
retain yret1;
if yret^=. then yret1=yret;
run;
在yret^=.的情况下为yret1赋值为yret,其它情况并没有为yret1赋值。由于retain语句的作用,yret1保留前面的值, 这样yret1不会有缺失值,从而起到填充的作用 。


(2)分组加上组序号:

分组,加组序号
proc sort data=a12;by stock year;run;
data a13;set a12;by stock year;
retain num 0;
if first.stock then num=num+1;
run; 


——————————————————————————————————————————————————————————


二、宏语言

SAS宏的一些特性:
1)可以降低重复性任务的工作量,便于重复调用。例如:可以将宏文件永久存储,每次只需要调用相应的宏就可以完成分析,而无需重新运行。
2)使程序模块化,同时便于修改宏参数,而无需重新运行,可以大幅提高运行效率。


1、sas宏变量——可复用的值


一个可以广泛复用,一直保存在缓存中的变量内容。  一种在程序(这里一般是指一个宏程序)外定义,则在整个SAS任何地方都可以被调用。另外一种则是在程序内部,则作用在该程序出现宏变量后面,在程序外则不可以被调用,否则会出错。(如果一个程序内部定义有宏变量变成全局变量,则需要使用%global)(这句话参考自: SAS 定义宏的三种用法

(1)%let

%let a=XXX;
%put &a;
%put here is &a;显示:
xxx
here is xxx
通过%let定义宏变量,格式:%let 宏变量名=宏变量值;

定义了宏变量之间,需要print一下,就要使用%put,相当于print 一下。
还有这样的用法:

%let var=you;
data w1;
X="here is &var";
run;
直接用在的文本之中,作为嵌入式。

(2)%str()

另外宏变量的定义方式有:当宏变量一个表达式,使用:%str()
                    %let print=%str(proc print; run;);


(3)%eval()

如果宏变量是数值计算表达式,则需要根据数值类型使用二个不同的宏变量:
                          %eval_r()   用于计算整数例如:%eval_r(1+2)
                         %sysevalf() 用于计算浮点数或者空值例如: %eval_r(1.0+2.3)

还有一种就是%eval(),%eval把字符型值变成数值型。



2、宏程序——可以复用程序(函数雏形)

类似R中的Function,不过这里可以完整将代码存在一个函数里面,下次可以重复调用。

% macro test;
data a2;
X=1;
run;
%mend test;%test;
%macro test;  以及 %mend test; 代表着宏程序的开始与结尾,下次调用的话,就直接%test;即可。

不过,要下次开机之后再用的话,必须地永久得对宏进行存储,就像函数一样。

存储的代码:

/*存储宏程序*/
libname test '';
options mstored sasmstore=test;
% macro test/store;
data a2;
X=1;
run;
%mend test;/*调用宏程序*/
libname test '';
options mstored sasmstore=test;
%test;
其中,options mstored sasmstore=宏名称;  是关键,同时,% macro test/store;存储时候中需要加入/store

3、宏参数——类函数

其实觉得宏程序其实没啥用,宏程序的升级版,宏参数才是最有用的,宏参数类似函数一样。

%MACRO A;1
%MEND A;%MACRO B(x,y);%let z=%eval(&x+&y);%put &z;%MEND B;%B(13,%A);

来看看来自经管之家论坛一篇帖子的内容,我觉得把宏变量、宏参数演绎得淋漓尽致。

通过%macro  %mend把A定义为1,以便可以复用;

然后%eval把字符型值变成数值型(关于这个需要深究一下,还有%str的用法)。

其中%B就代表调用函数,然后进行计算。


——————————————————————————————————————————————————————————


三、统计量

对数据集的操作。

data m15;set m14;data1=nobs**2;/*乘方用**表示*/data2=int(size);/*int:取整*/data3=ceil(size);/*返回大于等于变量的最小整数值*/data4=floor(size);/*返回小于等于变量的最大整数值*/data5=sqrt(data1);/*平方根*/
data6=exp(nobs-1);/*e的x次方*/data7=log10(asset);/*以10为底的对数*/data8=round(size,0.01);/*保留2位小数后的四舍五入结果*/data9=mod(nobs,2);/*求前者除以后者的余数*/data10=sign(log(mv)-log(asset));/*符号函数,对正数返回1,0返回0,负数返回-1*/data11=max(log(mv),log(asset));data12=min(log(mv),log(asset));run;

里面包括:乘方、取整、平方根、指数、对数、最大、最小值。


每每以为攀得众山小,可、每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~

———————————————————————————

这篇关于SAS︱操作语句(if、do、select、retain、array)、宏语言、统计量、运算符号的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/518515

相关文章

hdu1496(用hash思想统计数目)

作为一个刚学hash的孩子,感觉这道题目很不错,灵活的运用的数组的下标。 解题步骤:如果用常规方法解,那么时间复杂度为O(n^4),肯定会超时,然后参考了网上的解题方法,将等式分成两个部分,a*x1^2+b*x2^2和c*x3^2+d*x4^2, 各自作为数组的下标,如果两部分相加为0,则满足等式; 代码如下: #include<iostream>#include<algorithm

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

uva 575 Skew Binary(位运算)

求第一个以(2^(k+1)-1)为进制的数。 数据不大,可以直接搞。 代码: #include <stdio.h>#include <string.h>const int maxn = 100 + 5;int main(){char num[maxn];while (scanf("%s", num) == 1){if (num[0] == '0')break;int len =

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

flume系列之:查看flume系统日志、查看统计flume日志类型、查看flume日志

遍历指定目录下多个文件查找指定内容 服务器系统日志会记录flume相关日志 cat /var/log/messages |grep -i oom 查找系统日志中关于flume的指定日志 import osdef search_string_in_files(directory, search_string):count = 0

hdu4267区间统计

题意:给一些数,有两种操作,一种是在[a,b] 区间内,对(i - a)% k == 0 的加value,另一种操作是询问某个位置的值。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import

hdu4417区间统计

给你一个数列{An},然后有m次查询,每次查询一段区间 [l,r] <= h 的值的个数。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamRead

hdu3333区间统计

题目大意:求一个区间内不重复数字的和,例如1 1 1 3,区间[1,4]的和为4。 import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java.io.InputStreamReader;

实例:如何统计当前主机的连接状态和连接数

统计当前主机的连接状态和连接数 在 Linux 中,可使用 ss 命令来查看主机的网络连接状态。以下是统计当前主机连接状态和连接主机数量的具体操作。 1. 统计当前主机的连接状态 使用 ss 命令结合 grep、cut、sort 和 uniq 命令来统计当前主机的 TCP 连接状态。 ss -nta | grep -v '^State' | cut -d " " -f 1 | sort |