以下是一个使用Python和Matplotlib库绘制每年电影类型数量多条曲线的示例代码:
import pandas as pd
import matplotlib.pyplot as plt
# 读取数据
data = pd.read_csv('movies.csv')
# 将日期列转换为日期时间格式
data['release_date'] = pd.to_datetime(data['release_date'])
# 提取年份和电影类型
data['year'] = data['release_date'].dt.year
data['genres'] = data['genres'].str.split('|')
# 统计每年不同电影类型的数量
genre_counts = data.explode('genres').groupby(['year', 'genres']).size().unstack()
# 绘制多条曲线
genre_counts.plot.line(figsize=(12, 6))
# 设置标题和标签
plt.title('Number of Movies by Genre per Year')
plt.xlabel('Year')
plt.ylabel('Number of Movies')
# 显示图例
plt.legend(title='Genre', bbox_to_anchor=(1, 1))
plt.tight_layout()
# 显示图形
plt.show()
请确保将代码中的movies.csv
替换为您的实际数据文件路径。这段代码假设数据文件中包含release_date
(发布日期)和genres
(电影类型)列。
上一篇:按照每列总和计算各列的百分比
下一篇:按照每年自定义时间间隔进行分组