zl程序教程

您现在的位置是:首页 >  后端

当前栏目

python中对list去重的多种方法

2023-06-13 09:15:46 时间

今天遇到一个问题,在同事随意的提示下,用了itertools.groupby这个函数。不过这个东西最终还是没用上。

问题就是对一个list中的新闻id进行去重,去重之后要保证顺序不变。

直观方法

最简单的思路就是:

复制代码代码如下:


ids=[1,2,3,3,4,2,3,4,5,6,1]
news_ids=[]
foridinids:
   ifidnotinnews_ids:
       news_ids.append(id)

printnews_ids

这样也可行,但是看起来不够爽。

用set

另外一个解决方案就是用set:

复制代码代码如下:

ids=[1,4,3,3,4,2,3,4,5,6,1]
ids=list(set(ids))

这样的结果是没有保持原来的顺序。

按照索引再次排序

最后通过这种方式解决:

复制代码代码如下:
ids=[1,4,3,3,4,2,3,4,5,6,1]
news_ids=list(set(ids))
news_ids.sort(ids.index)

使用itertools.grouby

文章一开始就提到itertools.grouby,如果不考虑列表顺序的话可用这个:

复制代码代码如下:
ids=[1,4,3,3,4,2,3,4,5,6,1]
ids.sort()
it=itertools.groupby(ids)

fork,ginit:
   printk

关于itertools.groupby的原理可以看这里:http://docs.python.org/2/library/itertools.html#itertools.groupby

网友补充:用reduce

网友reatlk留言给了另外的解决方案。我补充并解释到这里:

复制代码代码如下:
In[5]:ids=[1,4,3,3,4,2,3,4,5,6,1]

In[6]:func=lambdax,y:xifyinxelsex+[y]

In[7]:reduce(func,[[],]+ids)
Out[7]:[1,4,3,2,5,6]


上面是我在ipython中运行的代码,其中的lambdax,y:xifyinxelsex+[y]等价于lambdax,y:yinxandxorx+[y]。

思路其实就是先把ids变为[[],1,4,3,......],然后在利用reduce的特性。reduce解释参看这里:http://docs.python.org/2/library/functions.html#reduce