以下是一个示例代码,用于按日期合并推文,并返回情感分数的计数:
from datetime import datetime
from collections import defaultdict
# 假设tweets是一个包含推文及其日期的列表
tweets = [
{"text": "今天天气真好!", "date": "2021-01-01", "score": 0.8},
{"text": "好开心啊!", "date": "2021-01-01", "score": 0.9},
{"text": "心情不好", "date": "2021-01-02", "score": -0.5},
{"text": "今天是个糟糕的一天", "date": "2021-01-02", "score": -0.7},
{"text": "太累了", "date": "2021-01-03", "score": -0.6},
]
# 创建一个默认为0的情感分数计数字典
score_counts = defaultdict(int)
# 遍历推文列表
for tweet in tweets:
# 将日期字符串转换为日期对象
date = datetime.strptime(tweet['date'], "%Y-%m-%d").date()
# 将情感分数添加到对应日期的计数中
score_counts[date] += tweet['score']
# 打印每个日期的情感分数计数
for date, score_count in score_counts.items():
print(f"{date}: {score_count}")
输出结果将是:
2021-01-01: 1.7
2021-01-02: -1.2
2021-01-03: -0.6
该示例代码首先创建了一个默认为0的情感分数计数字典score_counts。然后,它遍历推文列表,将每个推文的情感分数添加到对应日期的计数中。最后,它打印每个日期的情感分数计数。
上一篇:按日期合并数据帧生成NA