按月份将数据集分为训练集和测试集
创始人
2024-08-23 04:30:15
0

下面是一个按月份将数据集分为训练集和测试集的示例代码:

import pandas as pd
from sklearn.model_selection import train_test_split

# 读取数据集
data = pd.read_csv('data.csv')

# 将日期列转换为日期类型
data['date'] = pd.to_datetime(data['date'])

# 按月份排序数据集
data.sort_values(by='date', inplace=True)

# 获取数据集的起止日期
start_date = data['date'].min()
end_date = data['date'].max()

# 按月份划分训练集和测试集
train_start_date = start_date
train_end_date = pd.to_datetime('2019-12-31')  # 设置训练集的结束日期
test_start_date = pd.to_datetime('2020-01-01')  # 设置测试集的起始日期
test_end_date = end_date

# 划分训练集和测试集
train_data = data[(data['date'] >= train_start_date) & (data['date'] <= train_end_date)]
test_data = data[(data['date'] >= test_start_date) & (data['date'] <= test_end_date)]

# 输出训练集和测试集的大小
print('Train dataset size: ', train_data.shape)
print('Test dataset size: ', test_data.shape)

这个示例代码假设数据集中有一个名为'date'的日期列。首先,我们将日期列转换为日期类型,并按日期排序数据集。然后,我们指定训练集和测试集的起止日期,并根据这些日期将数据集划分为训练集和测试集。最后,我们输出训练集和测试集的大小。

相关内容

热门资讯

黑科技辅助!智星德州菠萝怎么开... 相信很多朋友都在电脑上玩过智星德州菠萝怎么开挂吧,但是很多朋友都在抱怨用电脑玩起来不方便。为此小编给...
黑科技系统!智星德州辅助器,德... 黑科技系统!智星德州辅助器,德扑之星玩的是啥,真是存在有挂(2026已更新)-哔哩哔哩;亲真的是有正...
黑科技挂!苹果菠萝德州辅助神器... 黑科技挂!苹果菠萝德州辅助神器,菠萝德州偷偷看功能,往昔真的是有挂(2022已更新)-哔哩哔哩;苹果...
黑科技ai!红龙扑克有没有挂,... 1、黑科技ai!红龙扑克有没有挂,德扑之星作弊,都是有挂(2020已更新)-哔哩哔哩。2、红龙扑克有...
黑科技脚本!红龙扑克辅助,po... 黑科技脚本!红龙扑克辅助,pokerx机器人,一向真的是有挂(2025已更新)-哔哩哔哩1、完成红龙...
黑科技讲解!智星德州菠萝辅助,... 黑科技讲解!智星德州菠萝辅助,fishpoker大菠萝外挂,本然是真的有挂(2023已更新)-哔哩哔...
黑科技辅助!红龙扑克有挂吗,鱼... 1、黑科技辅助!红龙扑克有挂吗,鱼扑克软件辅助,一直真的有挂(2020已更新)-哔哩哔哩;详细教程。...
黑科技软件!德州菠萝辅助工具,... 黑科技软件!德州菠萝辅助工具,轰趴十三水有后台吗,一直存在有挂(2023已更新)-哔哩哔哩1、很好的...
黑科技好牌!红龙扑克ai,德扑... 1、黑科技好牌!红龙扑克ai,德扑之星 ai软件,从来是有挂(2021已更新)-哔哩哔哩2、进入游戏...
黑科技辅助!红龙扑克透牌辅助器... 黑科技辅助!红龙扑克透牌辅助器,德扑计算胜率软件,本来真的有挂(2026已更新)-哔哩哔哩;亲们利用...