要在AWS Glue / Data Catalog中显示数据周围的引号,您可以使用以下代码示例:
from pyspark.sql.functions import col, lit
# 读取数据
df = spark.read.format("csv").option("header", "true").load("s3://path/to/input.csv")
# 添加引号
df_with_quotes = df.select(*[col(c).alias(c+"_quoted") for c in df.columns])
# 将数据保存到目标位置
df_with_quotes.write.format("csv").option("header", "true").save("s3://path/to/output.csv")
from pyspark.sql.functions import concat_ws
# 读取数据
df = spark.read.format("csv").option("header", "true").load("s3://path/to/input.csv")
# 添加引号
df_with_quotes = df.select(concat_ws('"', *[col(c) for c in df.columns]).alias("quoted_data"))
# 将数据保存到目标位置
df_with_quotes.write.format("csv").option("header", "true").save("s3://path/to/output.csv")
这些示例代码将读取CSV文件并在每个列的值周围添加引号。然后,它将保存带有引号的数据到指定的输出位置。您可以根据需要调整代码中的文件路径和选项。