可以使用Python中的pandas库解决此问题。
首先需要导入pandas库和数据集,假设数据集为df。
import pandas as pd df = pd.read_csv('data.csv')
然后将数据按用户 id 分组,再对每个分组中的数据进行滚动中位数计算。
rolling_median = df.groupby('user_id')['value'].rolling(window=3, min_periods=1).median().reset_index()
其中,window参数指定计算滚动中位数的窗口大小,这里设为3;min_periods参数指定在滚动过程中,如果数据量少于窗口大小,依然要计算中位数,这里设为1。
最后得到的rolling_median是一个包含每个用户 id 对应的滚动中位数的数据集。
上一篇:按用户ID从数据库筛选结果
下一篇:按用户ID过滤松果向量数据库。