按照指定列进行分组并在PySpark数据帧中创建新列
创始人
2024-08-26 07:30:05
0

在PySpark中,可以使用groupBywithColumn方法来按照指定列进行分组并创建新列。

以下是一个示例代码:

# 导入必要的模块
from pyspark.sql import SparkSession
from pyspark.sql.functions import col

# 创建SparkSession对象
spark = SparkSession.builder.getOrCreate()

# 创建示例数据帧
data = [("Alice", 25, "A"),
        ("Bob", 30, "B"),
        ("Alice", 35, "A"),
        ("Bob", 40, "B")]

df = spark.createDataFrame(data, ["Name", "Age", "Group"])

# 按照指定列进行分组,并创建新列"Average Age"来计算每个组的平均年龄
df_with_avg_age = df.groupBy("Group").agg({"Age": "avg"}).withColumnRenamed("avg(Age)", "Average Age")

# 显示结果
df_with_avg_age.show()

运行以上代码,将会得到以下输出:

+-----+-----------+
|Group|Average Age|
+-----+-----------+
|    B|       35.0|
|    A|       30.0|
+-----+-----------+

在上面的代码中,我们使用groupBy方法按照"Group"列进行分组,并使用agg方法计算每个组的平均年龄。然后,使用withColumnRenamed方法为结果列重命名为"Average Age"。最后,使用show方法显示结果数据帧。

相关内容

热门资讯

透视有挂!wejoker辅助软... 透视有挂!wejoker辅助软件视频,wepoker私人辅助器(透视)黑科技教程(有挂工具);1、金...
透视辅助!wepoker透视挂... 透视辅助!wepoker透视挂底牌,wepoker有没有挂(透视)必备教程(有挂细节)1、起透看视 ...
透视插件!wepoker有什么... 透视插件!wepoker有什么规律,wepoker公共底牌(透视)存在挂教程(有挂解说)1、用户打开...
透视教学!wepoker辅助器... 透视教学!wepoker辅助器软件下载,wepoker辅助软件视频(透视)可靠教程(有挂黑科技)we...
透视规律!wepoker买脚本... 透视规律!wepoker买脚本靠谱吗,wepokerplus辅助(透视)黑科技教程(有挂黑科技)we...
透视ai!wepoker怎么提... 透视ai!wepoker怎么提高运气,we-poker软件(透视)必胜教程(有挂技巧)1、进入到we...
透视好友!wepoker可以开... 透视好友!wepoker可以开透视吗,wepoker轻量版透视(透视)存在挂教程(有挂细节);1、起...
透视ai代打!wepoker怎... 透视ai代打!wepoker怎么看牌型,wepoker轻量版透视方法(透视)安装教程(有挂解密)1、...
透视透视!wepoker辅助器... 透视透视!wepoker辅助器如何使用,wepoker破解是真的还是假的(透视)德州教程(有挂工具)...
透视规律!wepoker破解游... 透视规律!wepoker破解游戏盒子,wepoker有透视功能吗(透视)必备教程(有挂详情)1、玩家...