SAS/描述性统计
外观
< SAS
描述您的数据
proc contents 返回数据集所有变量的列表及其类型。
proc contents data= lib.data ;
title "Describe the content of a database";
run;
在输出中列出您的数据
proc print 在输出窗口中打印数据。firstobs 选项指定要打印的第一行,obs 选项指定要打印的行数。
proc print data= lib.data (firstobs=30 obs=40);
title "Partial Listing";
run;
proc freq data=lib_name.data_name;
tables x1 x2 ;
title "frequence table";
run;
- weight 指定权重
proc freq data=lib_name.data_name;
weight extri;
tables x1 / out=temp4 outexpect;
run;
proc freq data=lib_name.data_name;
tables x1*x2 ;
title "contingency table";
run;
proc means 展示 var 语句中列出的每个变量的描述性统计量,如果不存在 var 语句,则展示数据集中每个数值变量的描述性统计量。以下是一些关键字,可用于告诉 SAS 您希望查看哪些统计量。
- n : 非缺失变量的计数
- sum : 变量的总和
- range : 最大值减去最小值
- mean : 平均值
- var : 方差
- stddev : 标准差
proc means data= libdata n sum range mean var stddev ;
var x1 x2;
run;
class 语句针对 class 语句中分类变量的每个组生成统计量。weights 语句对观测值进行加权。
proc means data=lib_name.data_name;
var x1 x2;
class sexe;
weight extri;
run;
proc univariate 提供更多选项。它还返回分位数。还有一个histogram 语句,它可能很有用。
proc univariate data=lib_name.data_name;
var x1;
histogram / normal(color=red mu=0 sigma=0.045) kernel(color=blue);
title "Proc Univariate";
run;
如果您想进行核密度估计或直方图,可以使用 proc univariate 以及 histogram 语句或 proc capability。
proc univariate data=lib_name.data_name;
var x1;
histogram / normal(color=red mu=0 sigma=0.045) kernel(color=blue);
title "Proc Univariate";
run;
Proc capability
proc capability data=lib_name.data_name;
histogram x1 / normal(color=red mu=0 sigma=0.045)
kernel(color=blue);
title "Proc Capability";
run;
proc corr data=lib_name.data_name;
var x1 x2 x3;
weight extri;
title3 "Linear correlation";
run;
以下代码检验数据集 taille 中变量 x 的期望值为 1.75 的假设。
proc ttest data = taille h0=1.75 alpha=0.05;
var x;
run;