我有一个带有日期列的数据框,表示为 ndarray 对象。我想要对数据帧进行聚类,并决定将此列中的每个字符串(如“2009-01-04”)转换为 int。将最后一个日期视为今天的日期,如何将其表示为以天为单位的新近度?我遇到了“to_datetime”方法的一些问题。index col1 col2 date 0 a 34 '2009-01-04' 1 a 21 '2009-01-05' 2 b 8 '2009-01-06'
1 回答
茅侃侃
TA贡献1842条经验 获得超21个赞
我相信您需要将日期转换为日期时间,然后从右侧减去Series.rsub
今天的日期,最后将输出时间增量转换为天数Series.dt.days
:
df['new'] = pd.to_datetime(df['date']).rsub(pd.Timestamp('now').floor('d')).dt.days
print (df)
col1 col2 date new
0 a 34 '2009-01-04' 4282
1 a 21 '2009-01-05' 4281
2 b 8 '2009-01-06' 4280
添加回答
举报
0/150
提交
取消