我们可以使用Python中的pandas包来解决这个问题。首先导入pandas包:
import pandas as pd
接着,我们可以使用read_excel方法读取Excel文件,并通过指定sheet_name参数来选择需要读取的表单:
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
然后,我们可以使用duplicated方法来查找重复的行,可以通过指定subset参数来选择需要贯穿重复测试的列。在我们的情况下,我们需要选择日期列:
duplicates = df[df.duplicated(subset='Date')]
最后,我们可以使用drop_duplicates方法来删除重复项:
df.drop_duplicates(subset='Date', keep=False, inplace=True)
在这里,我们指定了keep参数为False,意味着我们删除了所有重复项,并使用inplace参数来告诉pandas在原始DataFrame上更新这些更改。
完整的代码如下所示:
import pandas as pd
df = pd.read_excel('example.xlsx', sheet_name='Sheet1') duplicates = df[df.duplicated(subset='Date')]
df.drop_duplicates(subset='Date', keep=False, inplace=True)
print(duplicates) print(df)
请注意,您需要将example.xlsx替换为您自己的Excel文件,Sheet1替换为您自己选择的工作表名称,并将Date替换为您的数据中的日期列。
上一篇:按照日期选择直接前任
下一篇:按照日期在Realm中排序