在R语言中,可以使用dplyr包来按月统计唯一和重复的id。下面是一个示例代码:
library(dplyr)
# 创建一个包含id和日期的数据框
df <- data.frame(id = c(1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4),
date = c("2021-01-01", "2021-01-01", "2021-01-02", "2021-01-02",
"2021-02-01", "2021-02-01", "2021-02-02", "2021-02-02",
"2021-03-01", "2021-03-01", "2021-03-02", "2021-03-02"))
# 将日期列转换为日期类型
df$date <- as.Date(df$date)
# 按月统计唯一的id
unique_counts <- df %>%
group_by(month = format(date, "%Y-%m")) %>%
summarise(unique_ids = n_distinct(id))
# 按月统计重复的id
duplicate_counts <- df %>%
group_by(month = format(date, "%Y-%m")) %>%
summarise(duplicate_ids = sum(duplicated(id)))
# 输出结果
print(unique_counts)
print(duplicate_counts)
上述代码首先创建了一个包含id和日期的数据框,然后将日期列转换为日期类型。接下来,使用group_by
函数按照月份对数据进行分组,并使用summarise
函数计算每个月唯一和重复的id数量。最后,将结果打印输出。
运行上述代码,将会得到每个月唯一和重复的id数量的统计结果。
上一篇:按月统计特定对象的数量数组
下一篇:按月统计注册用户数量。