1 回答
TA贡献1877条经验 获得超1个赞
我认为您在样本输出中的计数不正确。这是我所拥有的:
import pandas as pd
>>>df
row_id date_1 date_2 date_3 date_4 date_5
0 1 2006-07-28 2006-08-18 2007-01-02 2009-01-28 2011-02-03
1 2 2000-07-21 2002-02-18 2004-05-02 2009-01-28 2011-02-03
df.set_index('row_id', inplace=True)
df['count'] = df.diff(axis=1).lt(pd.Timedelta('1Y').sum(axis=1)
>>>df
date_1 date_2 date_3 date_4 date_5 count
row_id
1 2006-07-28 2006-08-18 2007-01-02 2009-01-28 2011-02-03 2
2 2000-07-21 2002-02-18 2004-05-02 2009-01-28 2011-02-03 0
row_id 1的计数应该是 2 而不是 3: 1. ( date_2 - date_1 ) 和 2. ( date_3 - date_2 )
添加回答
举报
