在SAS中,可以通过使用PROC SQL
和LAG
函数来保留个人的最近5次访问记录。下面是一个示例代码:
/* 创建示例数据集 */
data visits;
input ID $ Visit_Date : yymmdd10.;
format Visit_Date yymmdd10.;
datalines;
A 2022-01-01
A 2022-01-05
A 2022-01-07
A 2022-01-10
A 2022-01-12
A 2022-01-15
B 2022-02-01
B 2022-02-03
B 2022-02-05
B 2022-02-08
B 2022-02-10
B 2022-02-12
;
run;
/* 保留个人的最近5次访问记录 */
proc sql;
create table recent_visits as
select ID, Visit_Date
from (
select ID, Visit_Date, lag(Visit_Date, 1) as prev_date, lag(Visit_Date, 2) as prev2_date,
lag(Visit_Date, 3) as prev3_date, lag(Visit_Date, 4) as prev4_date
from visits
order by ID, Visit_Date
)
where Visit_Date is not missing and
(prev_date is missing or intck('day', prev_date, Visit_Date) > 5) and
(prev2_date is missing or intck('day', prev2_date, Visit_Date) > 5) and
(prev3_date is missing or intck('day', prev3_date, Visit_Date) > 5) and
(prev4_date is missing or intck('day', prev4_date, Visit_Date) > 5);
quit;
/* 打印结果 */
proc print data=recent_visits;
run;
在上述代码中,首先创建了一个示例数据集visits
,该数据集包含个人ID和访问日期。然后,使用PROC SQL
来保留个人的最近5次访问记录。
在PROC SQL
中,首先使用子查询来为每个个人ID获取最近5次访问记录和前4次访问日期。然后,在外部查询中,使用WHERE
子句过滤掉不满足保留条件(访问日期间隔不超过5天)的记录。最后,将结果存储在名为recent_visits
的新数据集中。
最后,使用PROC PRINT
打印出结果数据集recent_visits
。
上一篇:保留三引号f字符串中的缩进。