朝鲜世界杯_2019篮球世界杯 - dyldrk.com

SAS基础:导入外部数据

一、读入sas数据集

1.文件格式:待读入的文件为图中选中的文件(sales.sas7bdat)

2.sas代码:

libname orion 'F:\打散虾\sas\P1 DATA';

data work.subset1;

set orion.sales;

where Customer_Gender = 'F' and

Customer_Age between 18 and 36 and

Customer_Group contains 'Gold';

keep Customer_Name Customer_Age Customer_Gender;

drop Customer_Group;

format Salary dollar12. Hire_Date monyy7.;

run;

proc print data=work.subset1;

run;

注释:

1)libname:定义工作空间,orion是个名字,表示后面的物理地址

2)data:定义个工作薄,名字是work.subset1

3)set:说明data的数据从哪来,后面是来源

4)where:表示对原始数据的筛选,就是一些逻辑语句

5)keep:保留某几个变量

6)drop:删除某几个变量

7)format:表示某变量的数据格式,”dollar12.“表示数据格式(后面带点".")

8)run:运行

9)proc print:输出结果

二、读入excel数据集

1.文件格式:待读入的文件为图中选中的文件(sales.xls)

2.SAS代码:

data work.subset2;

set orionxls.'Australia$'n;

where Job_Title contains 'Rep';

keep First_Name Last_Name Salary

Job_Title Hire_Date;

label Job_Title='Sales Title';

format Salary comma10. Hire_Date weekdata.;

run;

"label 表示输出的表格中,之前在data部分有label定义的都显示成定义后的内容"

proc print data=orionxls label;

run;

"orionxls.'XXX$'n XXX表示列名"

proc print data=orionxls.'Australia$'n;

run;

"取消分配逻辑库"

libname orionxls clear;

三、读入csv数据集

1.文件格式:sales.csv

2.SAS代码

data work.subset3;

infile 'sales.csv' dlm=',';

length First_Name Last_Name $ 12

Gender $ 1;

input Employee_ID First_Name $ Last_Name $

Gender $ Salary Job_Title $ Country $

Birth_Date :date.

Hire_Date :mmddyy.;

run;

proc print data=work.subset3;

run;

其中:

1)length表示某裂变两的长度限制

2)”Birth_Date :date. “ 和 ”Hire_Date :mmddyy.“ 表示这两个变量是“data“格式以及”mmddyy“格式(月日年)

3)infile中 “ dlm=',' ” 和 “dsd” 等价