现在的位置: 首页 > 综合 > 正文

SAS读取复杂的csv文件

2018年10月22日 ⁄ 综合 ⁄ 共 545字 ⁄ 字号 评论关闭

最初接触读取excel文件时候,学习过几种简单的读取方式,见: http://blog.csdn.net/yugao1986/article/details/6359406

但最近接触了一些稍微复杂的数据,再简单无变化的调用前面讲到的方法,发现sas总是报错。自己摸索了下,总结两条:

首先,数据形式大致形如下面两种情况:

 

1.方法来自《Reading Delimited Text Files into SAS®9》一文。

infile 'C:\temp\d_1202_1.csv' dlm=',' MISSOVER DSD lrecl=32767 firstobs=2 termstr=LF;

这里需要注意的是INFILE 语句下面的options:dlm,dlmstr,missover(trunover),termstr,firstobs,dsd等等,详见该文。

2.修改CSV(excel)文件本身数据属性。

数据不是自己操作完成的,我们有必要重新审查下数据特性,当然在导入SAS报错之后来重新审查数据属性更是有必要。

如上右图数据,导入出错的原因可以有:buydate时间格式不对,sum_fanli变量字符长度不等等,导入时可能导致变量缺失。

当我们对原始数据各变量的属性稍作修改,再利用proc import导入即可。

【上篇】
【下篇】

抱歉!评论已关闭.