本文主要是介绍SAS FORMATS基础和概述,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1、
话说到此,我们也许会有疑问,平时读取和展示数据时,好像也没用到 SAS FORMATS?
例如数据集test1,在读取时并没有指定什么格式,也没碰到什么麻烦,但How about数据集test2呢?
data
datalines;
p001 2239.5
p002 456
p003 231.4567
;
run;
data test2;
datalines;
d1 p001
d1 p002
d1 p003
;
run;
其实SAS 在读取或展示数据时,都要按照一定的FORMATS来进行。只是不过如果是标准的数字型(如不带货币符号,千分位号等)和标准的字符型(如字符中间不嵌空格等),SAS 可以按默认的FORMATS来读取,而不必具体指定。如若不是,则需具体指定。如数据集test2,数字、字符均非“标准”的,故需另外指定读入格式。
data test2;
datalines;
d1 p001
d1 p002
d1 p003
;
run;
proc print;
run;
2、
以上面的 test2 为例,在读入数据集时,由于 pid 变量中间有空格,所以要加“ & ”格式修饰符; price 有货币符号和千分位符号,所以用 dollar 格式读入,在读取时以移除他们。不过 print 的结果并没有显示货币符号和千分位符号,在 explorer 窗口打开数据集,也不见货币符号和千分位符号的踪影。怎么回事?如何才能在结果中看到他们?这就需用到输出格式。
data test2;
datalines;
d1 p001
d1 p002
d1 p003
;
run;
proc print;
run;
硬要说,是可以的,只是要原样存入的话,就只能存入字符型数据,这样做至少有两个缺限:
一是数字变成字符型,再进行相关的加减乘除运算和后继统计分析都会很不方便。
二是增加了存储数据的空间。
其实,个人理解,简单地说,SAS 输入输出格式的作用有点像“脱外套”和“加外套”的关系。读入数据时存储时,要直击其本质,去掉花哨复杂的“外衣”,剥洋葱似的直取其“精华”部分;展示数据时,就像女孩要出门了,得打扮一番,加些漂亮的装饰,变得“好看”了再展现在世人面前。
proc format;
run;
data test3;
datalines;
s001 1
s002 2
s003 1
s004 2
;
run;
proc print;
run;
结果如下图:
3、
SAS 输入输出格式,有着统一的样貌。
<$> name <w> . <d>
$ :字符型格式必需用的前缀
Name:格式的名称,必需符合SAS 命名规则
W :指定读入或输出的宽度,注意,包括小数点,货币符号、千分位号、负号等
. :无论哪种格式都必需的,不能省略,因为靠他区别格式名和变量名
D :小数位数,只用于数字型格式。
偷个懒,截张图,可以看看以下例子。
4、
²
²
²
²
Input 语句 用于读入数据时指定输入格式, put 语句用于(在 LOG 里)输出时指定格式; format ,attrib 语句可以在 DATA 步或 PROC 步中指定格式。不同的是在 DATA 步中变量和格式是永久关联的,在 PROC 步是暂时关联的。当然在 PUT 语句里也是暂时关联的。
举例说明:
data test4;
datalines;
$23.32 110611 06nov11 11/06/11 06nov2011
;
run;
proc print;
run;
output
o
log结果:
简单解释:x 的dollar格式是暂时关联的,所以在output仍然显示数字格式。
f1,f2 的格式是永久联系的,所以在log和output ,f1都是按date9.格式显示,f2 都是按mmddyy10.格式显示。t1,t2 的格式暂时联系的,所以在LOG里还是显示的数字格式,而非mmddyy10.格式。
data test5;
run;
来源:
http://blog.sina.com.cn/s/blog_41889b900100wjz5.html
这篇关于SAS FORMATS基础和概述的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!