您现在的位置是：首页 > 数据库

当前栏目

一日一技：如何对数据进行过滤

数据

2023-03-20 15:39:16 时间

有一个列表[1, 2, False, '', 'test', 0]，现在需要把里面所有非空、非False，非0的数据取出来。

可能有一些人会使用列表推导式：

a = [1, 2, False, '', 'test', 0] 
useful = [x for x in a if x]

但如果过滤规则稍微复杂一些呢？例如，如果列表里面的元素不是字符串，那么先把元素转换为字符串，然后转换为bytes型数据，计算md5值。如果md5值转换成10进制数以后是3的倍数，那么就把这个数筛选出来。

为了实现这个目的，我们可以定义一个函数：

import hashlib 
def check(value): 
    value_str = str(value) 
    value_hex = str(hashlib.md5(value_str.encode()).hexdigest()) 
    value_decimal = int(value_hex, 16) 
    return value_decimal % 3 == 0 
a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 
b = [x for x in a if check(x)]

运行效果如下图所示。

在Python里面，有一个现成的函数filter也能实现这个效果：

a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 
b = filter(check, a)

此时，获得的b变量是一个生成器对象，只有在对它进行迭代的时候，才能获取里面的值。如下图所示。

filter函数接收两个参数，第一个参数是一个函数名，第二个参数是一个可迭代的对象。filter函数把可迭代对象的每一个值都放进参数1对应的函数中，如果返回True，那么这个值就是有效的，就会被保留。如果返回False，那么这个值就会被丢弃。

Filter的第一个参数也可以是None，此时filter(None, [1, 2, '', False, 'xx'])的效果就是把列表里面所有非空，非0，非False的数据返回出来。

猜你喜欢

Python中的函数与方法以及Bound Method和Unbound Method
从本体论开始说起——运营商关系图谱的构建及应用
一篇运维老司机的大数据平台监控宝典（2）-联通大数据集群平台监控体系详解
一篇运维老司机的大数据平台监控宝典（1）-联通大数据集群平台监控体系进程详解
Flask中的请求上下文和应用上下文
深入探讨Java中的异常与错误处理
研究学习Kotlin的一些方法
如何成为一名数据科学家？
金融服务领域的大数据：即时分析
影响大数据、机器学习和人工智能未来发展的8个因素
从未见过的堂兄杀了人，你的DNA是关键证据
一文贯通python文件读取
数据显示Java热度持续下落，日子屈指可数？
从0开始构建一个属于你自己的PHP框架
如何将Hadoop集成到工作流程中？这6个优秀实践必看
2017年5月编程语言排行榜：Java与C语言优势正开始缩小
SEO公司使用大数据优化其模型的5种方法
Java多线程之内置锁与显示锁
关于Web Workers你需要了解的七件事
20个安全可靠的免费数据源，各领域数据任你挑

zl程序教程

当前栏目

一日一技：如何对数据进行过滤

相关文章