zl程序教程

您现在的位置是:首页 >  数据库

当前栏目

一日一技:如何对数据进行过滤

2023-03-20 15:39:16 时间

有一个列表[1, 2, False, '', 'test', 0],现在需要把里面所有非空、非False,非0的数据取出来。

可能有一些人会使用列表推导式:

a = [1, 2, False, '', 'test', 0] 
useful = [x for x in a if x] 

但如果过滤规则稍微复杂一些呢?例如,如果列表里面的元素不是字符串,那么先把元素转换为字符串,然后转换为bytes型数据,计算md5值。如果md5值转换成10进制数以后是3的倍数,那么就把这个数筛选出来。

为了实现这个目的,我们可以定义一个函数:

import hashlib 
def check(value): 
    value_str = str(value) 
    value_hex = str(hashlib.md5(value_str.encode()).hexdigest()) 
    value_decimal = int(value_hex, 16) 
    return value_decimal % 3 == 0 
a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 
b = [x for x in a if check(x)] 

运行效果如下图所示。

在Python里面,有一个现成的函数filter也能实现这个效果:

a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 
b = filter(check, a) 

此时,获得的b变量是一个生成器对象,只有在对它进行迭代的时候,才能获取里面的值。如下图所示。

filter函数接收两个参数,第一个参数是一个函数名,第二个参数是一个可迭代的对象。filter函数把可迭代对象的每一个值都放进参数1对应的函数中,如果返回True,那么这个值就是有效的,就会被保留。如果返回False,那么这个值就会被丢弃。

Filter的第一个参数也可以是None,此时filter(None, [1, 2, '', False, 'xx'])的效果就是把列表里面所有非空,非0,非False的数据返回出来。