按月份将数据集分为训练集和测试集_程序开发

按月份将数据集分为训练集和测试集

创始人

2024-08-23 04:30:15

0次

下面是一个按月份将数据集分为训练集和测试集的示例代码：

import pandas as pd
from sklearn.model_selection import train_test_split

# 读取数据集
data = pd.read_csv('data.csv')

# 将日期列转换为日期类型
data['date'] = pd.to_datetime(data['date'])

# 按月份排序数据集
data.sort_values(by='date', inplace=True)

# 获取数据集的起止日期
start_date = data['date'].min()
end_date = data['date'].max()

# 按月份划分训练集和测试集
train_start_date = start_date
train_end_date = pd.to_datetime('2019-12-31')  # 设置训练集的结束日期
test_start_date = pd.to_datetime('2020-01-01')  # 设置测试集的起始日期
test_end_date = end_date

# 划分训练集和测试集
train_data = data[(data['date'] >= train_start_date) & (data['date'] <= train_end_date)]
test_data = data[(data['date'] >= test_start_date) & (data['date'] <= test_end_date)]

# 输出训练集和测试集的大小
print('Train dataset size: ', train_data.shape)
print('Test dataset size: ', test_data.shape)

这个示例代码假设数据集中有一个名为'date'的日期列。首先，我们将日期列转换为日期类型，并按日期排序数据集。然后，我们指定训练集和测试集的起止日期，并根据这些日期将数据集划分为训练集和测试集。最后，我们输出训练集和测试集的大小。

上一篇：按月份将数据分组为箱线图（并按时间顺序绘制）

下一篇：按月份进行的RedShift队列分析。

热门资讯

七分钟辅助！丽水茶苑苹果手机辅... 七分钟辅助！丽水茶苑苹果手机辅助，本来是真的有辅助教程（有挂方式）1、实时丽水茶苑苹果手机辅助透视辅...

第一分钟辅助！闲来辅助神器下载... 第一分钟辅助！闲来辅助神器下载2022，好像真的有辅助方法（有挂教程）1、不需要AI权限，帮助你快速...

九分钟辅助！丽水都莱辅助工具试... 九分钟辅助！丽水都莱辅助工具试用，确实存在有辅助神器（有挂方法）九分钟辅助！丽水都莱辅助工具试用，确...

第一分钟辅助！蛮王辅助器，好像... 第一分钟辅助！蛮王辅助器，好像是有辅助方法（有挂教学）1、首先打开蛮王辅助器辅助器下载最新版本，在蛮...

第六分钟辅助！潮汕汇挂，一贯真... 第六分钟辅助！潮汕汇挂，一贯真的是有辅助插件（有挂辅助）1、这是跨平台的潮汕汇挂轻量版有透视，在线的...

六分钟辅助！微信开心泉州辅助器... 六分钟辅助！微信开心泉州辅助器，一直有辅助器（有挂教学）1、下载好微信开心泉州辅助器透视辅助下载之后...

第3分钟辅助！佛手十三道破解版... 第3分钟辅助！佛手十三道破解版安卓，竟然真的有辅助攻略（有挂存在）1、让任何用户在无需佛手十三道破解...

2分钟辅助！sohoo竞技联盟... 2分钟辅助！sohoo竞技联盟辅助，切实真的有辅助脚本（有挂技术）1.sohoo竞技联盟辅助选牌创...

第8分钟辅助！心悦手游辅助器，... 第8分钟辅助！心悦手游辅助器，原来真的是有辅助技巧（确实有挂）；1、每一步都需要思考，不同水平的挑战...

第十分钟辅助！广东雀神祈福真的... 第十分钟辅助！广东雀神祈福真的有用吗，都是是有辅助技巧（有挂方略）1、下载好广东雀神祈福真的有用吗透...

按月份将数据集分为训练集和测试集

相关内容

热门资讯