假设我们有一个名为data
的数据框,其中包含三个变量:group
,var1
和var2
。以下代码将对data
按group
变量分组并计算行数,然后计算每个组中var1
和var2
变量的比例。
library(dplyr)
data %>%
group_by(group) %>%
summarise(n = n(),
prop_var1 = mean(var1),
prop_var2 = mean(var2))
这个代码将返回一个数据框,其中包含四个变量:group
,n
,prop_var1
和prop_var2
。n
表示每个组中的行数,prop_var1
表示每个组中var1
变量的比例,prop_var2
表示每个组中var2
变量的比例。