3 回答
TA贡献1853条经验 获得超6个赞
您的第一个错误是因为list.sort()就地排序所以它不会返回,因此无法分配。解决方法:
for a in range(len(added)):
added[a][:2] = sorted(added[a][:2])
然后,您可以获得唯一索引:
unique, idx = np.unique([a[:2] for a in added], axis=0, return_index=True)
no_dups = [added[i] for i in idx]
len(added)
>>> 156
len(no_dups)
>>> 78
TA贡献1789条经验 获得超10个赞
至于TypeError: can only assign an iterable:
added[a][0:2].sort()返回None,因此,您不能将其分配给列表。如果你想要列表,你需要使用sorted()实际返回排序列表的方法:
added[a][0:2] = sorted(added[a][0:2])
至于<input>:2: DeprecationWarning: elementwise comparison failed; this will raise an error in the future.:
这是警告而不是错误。尽管如此,这对您不起作用,因为作为警告状态,您的对象数组没有明确定义=。因此,当您搜索 时if added[a][2] in no_dups,它无法真正与added[a][2]的元素进行比较no_dups,因为没有适当地定义相等性。如果它是 numpy 数组,你可以使用:
for a in range(len(added)):
added[a][0:2] = sorted(added[a][0:2])
no_dups = []
for a in added:
add_flag = True
for b in no_dups:
#to compare lists, compare first two elements using lists and compare array using .all()
if (a[0:2]==b[0:2]) and ((a[2]==b[2]).all()):
print('already appended')
add_flag = False
break
if add_flag:
no_dups.append(a)
len(no_dups): 78
len(added): 156
但是,如果所有数组的长度都相同,则应使用速度明显更快的 numpy 堆叠
TA贡献1847条经验 获得超11个赞
您可以将整个 added 转换为一个 numpy 数组,然后对索引进行切片并对其进行排序,然后使用 np.unique 获取唯一行。
#dummy added in the form [[a,b,array],[a,b,array],...]
added = [np.random.choice(5,2).tolist()+[np.random.randint(10, size=(1,5))] for i in range(156)]
# Convert to numpy
added_np = np.array(added)
vals, idxs = np.unique(np.sort(added_np[:,:2], axis = 1).astype('int'), axis=0, return_index= True)
added_no_duplicate = added_np[idxs].tolist()
添加回答
举报