按照指定列进行分组并在PySpark数据帧中创建新列_程序开发

按照指定列进行分组并在PySpark数据帧中创建新列

创始人

2024-08-26 07:30:05

0次

在PySpark中，可以使用groupBy和withColumn方法来按照指定列进行分组并创建新列。

以下是一个示例代码：

# 导入必要的模块
from pyspark.sql import SparkSession
from pyspark.sql.functions import col

# 创建SparkSession对象
spark = SparkSession.builder.getOrCreate()

# 创建示例数据帧
data = [("Alice", 25, "A"),
        ("Bob", 30, "B"),
        ("Alice", 35, "A"),
        ("Bob", 40, "B")]

df = spark.createDataFrame(data, ["Name", "Age", "Group"])

# 按照指定列进行分组，并创建新列"Average Age"来计算每个组的平均年龄
df_with_avg_age = df.groupBy("Group").agg({"Age": "avg"}).withColumnRenamed("avg(Age)", "Average Age")

# 显示结果
df_with_avg_age.show()

运行以上代码，将会得到以下输出：

+-----+-----------+
|Group|Average Age|
+-----+-----------+
|    B|       35.0|
|    A|       30.0|
+-----+-----------+

在上面的代码中，我们使用groupBy方法按照"Group"列进行分组，并使用agg方法计算每个组的平均年龄。然后，使用withColumnRenamed方法为结果列重命名为"Average Age"。最后，使用show方法显示结果数据帧。

上一篇：按照指定ID创建观测数量

下一篇：按照指定顺序打印页面

热门资讯

透视有挂！wejoker辅助软... 透视有挂！wejoker辅助软件视频，wepoker私人辅助器（透视）黑科技教程（有挂工具）；1、金...

透视辅助！wepoker透视挂... 透视辅助！wepoker透视挂底牌，wepoker有没有挂（透视）必备教程（有挂细节）1、起透看视 ...

透视插件！wepoker有什么... 透视插件！wepoker有什么规律，wepoker公共底牌（透视）存在挂教程（有挂解说）1、用户打开...

透视教学！wepoker辅助器... 透视教学！wepoker辅助器软件下载，wepoker辅助软件视频（透视）可靠教程（有挂黑科技）we...

透视规律！wepoker买脚本... 透视规律！wepoker买脚本靠谱吗，wepokerplus辅助（透视）黑科技教程（有挂黑科技）we...

透视ai！wepoker怎么提... 透视ai！wepoker怎么提高运气，we-poker软件（透视）必胜教程（有挂技巧）1、进入到we...

透视好友！wepoker可以开... 透视好友！wepoker可以开透视吗，wepoker轻量版透视（透视）存在挂教程（有挂细节）；1、起...

透视ai代打！wepoker怎... 透视ai代打！wepoker怎么看牌型，wepoker轻量版透视方法（透视）安装教程（有挂解密）1、...

透视透视！wepoker辅助器... 透视透视！wepoker辅助器如何使用，wepoker破解是真的还是假的（透视）德州教程（有挂工具）...

透视规律！wepoker破解游... 透视规律！wepoker破解游戏盒子，wepoker有透视功能吗（透视）必备教程（有挂详情）1、玩家...

按照指定列进行分组并在PySpark数据帧中创建新列

相关内容

热门资讯