1 回答
TA贡献1802条经验 获得超6个赞
观察调用b_filter.value.items()内部返回的值filter与以下内容相同:
nested_filter.items()
#[('user1', '2018-02-15')]
那么你的比较就变成了:
("user1","2018-02-05") < [('user1', '2018-02-15')]
#False
这是False。假设这nested_filter是一个只有 1 项的字典(如此处所示),您可能打算做的是与列表的第一个元素进行比较:
("user1","2018-02-05") < nested_filter.items()[0]
#True
因此,要“修复”您的代码,您可以执行以下操作:
rdd_set.filter(lambda fields: fields <= b_filter.value.items()[0]).collect()
#[('user1', '2018-02-05')]
但相反,我认为你真正想要的是以下内容:
rdd_set.filter(lambda fields: fields[1] <= b_filter.value.get(fields[0])).collect()
#[('user1', '2018-02-05')]
这用于fields[0]从 获取日期nested_filter(None如果不存在则返回)并将值与fields[1].
正如您所指出的,这种比较将在字符串上按字典顺序进行。如果您的日期保持格式不变,这对您来说不是问题YYYY-MM-DD,但对于其他日期格式,您可能需要转换为datetime对象。
添加回答
举报
