跳转到内容

SAS/描述性统计

来自维基教科书,开放的书籍,为开放的世界
< SAS

列出并描述您的数据

[编辑 | 编辑源代码]

描述您的数据 

proc contents 返回数据集所有变量的列表及其类型。

 proc contents data= lib.data ;
 title "Describe the content of a database";
 run;

在输出中列出您的数据 

proc print 在输出窗口中打印数据。firstobs 选项指定要打印的第一行,obs 选项指定要打印的行数。

 proc print data= lib.data (firstobs=30 obs=40);
 title "Partial Listing";
 run;

离散变量

[编辑 | 编辑源代码]
 proc freq data=lib_name.data_name;
 tables x1 x2 ;
 title "frequence table";
 run;
  • weight 指定权重
 proc freq data=lib_name.data_name;
 weight extri;
 tables x1 / out=temp4 outexpect;
 run;

列联表

[编辑 | 编辑源代码]
 proc freq data=lib_name.data_name;
 tables x1*x2 ;
 title "contingency table";
 run;

连续变量

[编辑 | 编辑源代码]

proc means 展示 var 语句中列出的每个变量的描述性统计量,如果不存在 var 语句,则展示数据集中每个数值变量的描述性统计量。以下是一些关键字,可用于告诉 SAS 您希望查看哪些统计量。

  • n : 非缺失变量的计数
  • sum : 变量的总和
  • range : 最大值减去最小值
  • mean : 平均值
  • var : 方差
  • stddev : 标准差
 proc means data= libdata n sum range mean var stddev ;
 var x1 x2;
 run;

class 语句针对 class 语句中分类变量的每个组生成统计量。weights 语句对观测值进行加权。

 proc means data=lib_name.data_name;
 var x1 x2;
 class sexe;
 weight extri;
 run;

proc univariate 提供更多选项。它还返回分位数。还有一个histogram 语句,它可能很有用。

 proc univariate data=lib_name.data_name;
 var x1;
 histogram / normal(color=red mu=0 sigma=0.045) kernel(color=blue);
 title "Proc Univariate";
 run;

核密度估计和直方图

[编辑 | 编辑源代码]

如果您想进行核密度估计或直方图,可以使用 proc univariate 以及 histogram 语句或 proc capability。

 proc univariate data=lib_name.data_name;
 var x1;
 histogram / normal(color=red mu=0 sigma=0.045) kernel(color=blue);
 title "Proc Univariate";
 run;

Proc capability 

 proc capability data=lib_name.data_name;
 histogram x1 / normal(color=red mu=0 sigma=0.045)
 kernel(color=blue);
 title "Proc Capability";
 run;


相关性和散点图

[编辑 | 编辑源代码]
 proc corr data=lib_name.data_name;
 var x1 x2 x3;
 weight extri;
 title3 "Linear correlation";
 run;

以下代码检验数据集 taille 中变量 x 的期望值为 1.75 的假设。

proc ttest data = taille h0=1.75 alpha=0.05;
var x;
run;
华夏公益教科书