- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS导入数据
SAS 培训第一讲
课程:数据的导入和导出
部门:创新业务部
时间:2014/11/19
内容概要:
1. 菜单操作
2. Proc import
3. Infile 语句
4. Libname
5. 批量导入数据(不讲)
6. 数据的导出(直接使用菜单方法或proc export ,不讲)
7. 各种导入方法的优缺点
数据类型:Excel 数据,csv 数据 (逗号分隔符),Access 数据
详细讲解:
1. 菜单导入数据 (只介绍EXCEL 数据导入,其他类似)
1) 打开导入数据向导,如下图;
2) 选择将要导入的数据类型,然后点击“next”;
3) 选择将要导入的数据的物理地址,点击“OK”进入下一步;
4) 选择将要导入的table ,点击“next”;
5) 选择将数据导入哪个逻辑库并填入数据集名称,点击“next”;
6) 该步让用户选择是否将菜单操作背后的代码导出,若无必要直接点击“Finish”,完成数
据的导入。
2. Import 过程步导入数据
1) Excel 表格数据
proc import out = index1
datafile = C:\Users\Administrator\Desktop\399101.xlsx
dbms = excel replace;
range = sheet1$;
getnames = NO;
run ;
参数解释:
dbms——规定外部文件格式的标示名
replace——规定替换已存在的文件
range——指定将要导入的数据范围
getnames——规定是否将第一行数据作为变量名
2) csv 数据
proc import out = import_csv
datafile = C:\Users\Administrator\Desktop\data_lesson1\鞍山 csv
dbms = csv replace;
delimiter = ,;
getnames = yes;
datarow = 2 ;
guessingrows = 4000;
run ;
参数解释:
dbms——规定外部文件格式的标示名
replace——规定替换已存在的文件
delimiter——规定外部文件分隔符
getnames——规定是否将第一行数据作为变量名
datarow——规定从第几行开始读取数据
guessingrows——规定根据前多少条数据确定变量格式
说明:
a) 对于文件格式的标示名与源文件格式之间的对应关系参《SAS 编程技术教程》
b) 一般情况都加上replace ,以免重新导入数据时出错,当然也可以不加
c) 若文件含分隔符,则必须规定delimiter 选项
d) 当getnames=yes 时,datarow 应大于 1
e) guessingrows 最大取值为 4000 ,若缺省此项,SAS 默认将第一条数据的格式作为变
量格式。
对于数据量超过4000 条的数据最好不要使用proc import 导入数据,有可能会导致字符被
截断等情况。接下来介绍的infile 方法可以解决这一点。
3) Access 数据
proc import out = import_ac
table = content
dbms = access replace;
database =
C:\Users\Administrator\Desktop\data_lesson1\SpiderResult.mdb;
uid = ;
pwd = ;
run ;
3. Infile 语句导入数据
在data 步中使用infile 语句,可以通过先定义变量的输入格式,再导入数据,避免出
现字符截断等情况。Infile 语句导入数据的基本格式如下:
data infile_csv;
infile C:\Users\Administrator\Desktop\data_lesson1\鞍csv
dsd delimiter=, firstobs=2 truncover lrecl=1000;
informat area_plate $40. community $60. address $200. price $20.
estate_time $40. constr_type $50. covers_area $30. constr_area $30.
developer $100. property $100.
文档评论(0)