按照id分组并根据优先级创建列(Pyspark)
创始人
2024-08-24 06:00:41
0

可以使用groupby和pivot方法来解决此问题。首先,我们需要使用groupby方法按照id列分组。然后,我们可以使用pivot方法并指定“priority”列来创建新列。最后,我们需要使用fillna方法来使用默认值填充缺失的单元格。

以下是用于解决此问题的示例代码:

from pyspark.sql.functions import *
from pyspark.sql import SparkSession

# 创建Spark会话
spark = SparkSession.builder.appName("groupby_pivot_demo").getOrCreate()
spark.conf.set("spark.sql.shuffle.partitions", "5")

# 创建示例数据
data = [("id1", "A", 1),
       ("id1", "B", 2),
       ("id1", "C", 3),
       ("id2", "A", 2),
       ("id2", "B", 1),
       ("id3", "A", 3)]

df = spark.createDataFrame(data, ["id", "priority", "value"])

# 按照id分组并创建新列
df_grouped = df.groupBy("id").pivot("priority").agg(first(col("value")))

# 填充缺失单元格
df_grouped = df_grouped.fillna(0)

df_grouped.show()

输出结果:

+---+---+---+---+
| id|  A|  B|  C|
+---+---+---+---+
|id2|  2|  1|  0|
|id1|  1|  2|  3|
|id3|  3|  0|  0|
+---+---+---+---+

相关内容

热门资讯

透视苹果版"悦扑克脚... 《透视苹果版"悦扑克脚本"详细辅助攻略方法(先前有挂)》 悦扑克脚本软件透明挂更新公告新增内容: 详...
透视辅助"红龙pok... 透视辅助"红龙poker辅助平台"详细辅助2025教程(原来真的有挂);亲真的是有正版授权,小编(透...
透视辅助"hhpok... 透视辅助"hhpoker底牌透视脚本"详细辅助科技教程(原先是真的有挂)是一款可以让一直输的玩家,快...
透视了解"we po... 透视了解"we poker游戏下"详细辅助专业教程(原本真的是有挂)准备好在we poker游戏下i...
透视脚本"aa po... 透视脚本"aa poker辅助"详细辅助解密教程(切实存在有挂)是一款可以让一直输的玩家,快速成为一...
透视好友房"hhpo... 1、透视好友房"hhpoker视频巡查真的假的"详细辅助微扑克教程(起初是有挂)(UU poker、...
透视实锤"菠萝德州透... 透视实锤"菠萝德州透视脚本"详细辅助技巧教程(一向是真的有挂);原来确实真的有挂(需添加指定薇136...
透视ai代打"hhp... 1、透视ai代打"hhpoker买挂"详细辅助力荐教程(确实存在有挂)(UU poker、hhpok...
透视挂透视"德州私人... 透视挂透视"德州私人局脚本"详细辅助2025新版总结(固有是真的有挂)是由北京得德州私人局脚本黑科技...
透视代打"we po... 1、透视代打"we poker辅助器下载"详细辅助黑科技教程(竟然真的有挂)2、进入游戏-大厅左侧-...