您现在的位置是：首页 > 后端

当前栏目

Python基础11-迭代器,生成器

Python 基础迭代 11 生成器

2023-06-13 09:11:05 时间

-曾老湿, 江湖人称曾老大。

-多年互联网运维工作经验，曾负责过大规模集群架构自动化运维管理工作。 -擅长Web集群架构与自动化运维，曾负责国内某大型金融公司运维工作。 -devops项目经理兼DBA。 -开发过一套自动化运维平台（功能如下）： 1)整合了各个公有云API，自主创建云主机。 2)ELK自动化收集日志功能。 3)Saltstack自动化运维统一配置管理工具。 4)Git、Jenkins自动化代码上线及自动化测试平台。 5)堡垒机，连接Linux、Windows平台及日志审计。 6)SQL执行及审批流程。 7)慢查询日志分析web界面。

迭代器介绍

什么是迭代器？

迭代器：指的是迭代取值的工具迭代：迭代是一个重复过程，每一次重复都是基于上一次的结果而来

# 错误例子，单纯的重复不是迭代
i=0
while True:
    print(i)

# 迭代：重复+每次重复都是基于上一次的结果而进行
l=['a','b','c']
i=0
while i < len(l):
    print(l[i])
    i+=1

为何要使用迭代器？

刚才我们实现的迭代器，只能适用于，字符串，列表，元组等数据类型，但是字典，就不合适了

迭代器提供了一种通用的且不依赖于索引的迭代取值方式

如何使用迭代器？

首先了解一个概念，并不是所有数据都阔以使用迭代器，只有可迭代对象才可以使用迭代器。

那么什么是可迭代对象呢？

可迭代的对象iterable：但凡内置有__iter__方法的对象都称之为可迭代的对象。

# 以下数据类型包括文件，我们挨个测试一番
a=1
b=1.1
c='hello'
d=['a','b']
e=('a','b')
j={'x':1}
g={1,2,3}
f=open('a.txt','w')

## 结论：可迭代的对象：str，list，tuple，dict，set,文件对象

# 执行可迭代对象下的__iter__方法，返回的值就是一个迭代器对象iterator
dic={'x':1,'y':2,'z':3}
iter_dic=dic.__iter__()
print(iter_dic)


# 迭代取值
dic={'x':1,'y':2,'z':3}
iter_dic=dic.__iter__()

print(iter_dic.__next__())
print(iter_dic.__next__())
print(iter_dic.__next__())
// 我们只有三个key，如果取第四次，就会报错，但是这是好事，我们可以把它当成是一个结束信号
print(iter_dic.__next__())

# 文件同样可以迭代
f=open('a.txt','rt',encoding='utf-8')
iter_f=f.__iter__()
print(iter_f.__next__())
print(iter_f.__next__())
print(iter_f.__next__())
print(iter_f.__next__())

迭代器使用

迭代器对象

既内置有__next__方法的对象，执行迭代器__next__方法可以不依赖索引取值
又内置有__iter__方法的对象，执行迭代器__iter__方法得到的仍然是迭代器本身

注意： 1.迭代器对象一定是可迭代的对象，而可迭代的对象却不一定是迭代器对象 2.文件对象本身就是一个迭代器对象

l=['a','b','c']
iter_l=l.__iter__() # 调用可迭代的对象__iter__得到的是迭代对象，
print(iter_l is iter_l.__iter__().__iter__().__iter__().__iter__().__iter__().__iter__())


# 迭代器取值
dic={'x':1,'y':2,'z':3}
iter_dic=iter(dic) # dic.__iter__()
print(next(iter_dic)) # iter_dic.__next__()
print(next(iter_dic))
print(next(iter_dic))
print(next(iter_dic))
print(next(iter_dic))

## 这么取会发现，全都是重复代码

# 使用循环取值
dic={'x':1,'y':2,'z':3}
iter_dic=iter(dic) # dic.__iter__()
while True:
    print(next(iter_dic)) # iter_dic.__next__()
    
# 如果一直取就会报错异常

# 捕捉异常方案
dic={'x':1,'y':2,'z':3}
iter_dic=iter(dic) # dic.__iter__()
while True:
    try:
        print(next(iter_dic)) #iter_dic.__next__()
    except StopIteration:
        break

注意：同一个迭代器只能完整地取完一次值

dic={'x':1,'y':2,'z':3}
iter_dic=iter(dic) # dic.__iter__()
while True:
    try:
        print(next(iter_dic)) #iter_dic.__next__()
    except StopIteration:
        break

print('==='*100)

while True:
    try:
        print(next(iter_dic)) #iter_dic.__next__()
    except StopIteration:
        break

如果想再次取值，那就重新赋值

dic={'x':1,'y':2,'z':3}
iter_dic=iter(dic) # dic.__iter__()
while True:
    try:
        print(next(iter_dic)) #iter_dic.__next__()
    except StopIteration:
        break

print('==='*100)

iter_dic=iter(dic) #dic.__iter__()
while True:
    try:
        print(next(iter_dic)) #iter_dic.__next__()
    except StopIteration:
        break

for循环底层原理分析

for本质应该称之为迭代器循环

工作原理： 1. 先调用in后面那个对象的__iter__方法，将其变成一个迭代器对象 2. 调用next(迭代器)，将得到的返回值赋值给变量名k 3. 循环往复直到next(迭代器)抛出异常，for会自动捕捉异常然后结束循环

注意： 从for角度，可以分辨出但凡可以被for循，环循环取值的对象都是可迭代的对象

dic={'x':1,'y':2,'z':3}

for k in dic:
    print(k)

for k in dic:
    print(k)

迭代器总结

优点： 1.提供一种通用的且不依赖于索引的迭代取值方式 2.同一时刻在内存中只存在一个值，更节省内存

## 在python3中，直接做成迭代器对象，返回的是内存地址
l=[1,2,2,3,3,3,3,3,3,3,3,3,3,3]
iter_l=iter(l)
print(iter_l)

names = ['qls', 'lls', 'cls']
res=map(lambda x:x+"_SB",names)
print(res)

## 对于内存保护
obj=range(1,1000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000)
print(obj)

缺点： 1.取值不如按照索引的方式灵活，（不能取指定的某一个值，而且只能往后取） 2.无法预测迭代器的长度

自定义迭代器

生成器介绍

emm...看到标题，我们要讲一个自定义的迭代器，结果mmp，为啥就变成了生成器的介绍呢？

Because，生成器就是一种自定义的迭代器，本质就是迭代器

新概念：yield

def func():
    print('first')
    yield 
    
func()

但凡函数内包含yield关键字，调用函数不会执行函数体代码

def func():
    print('first')
    # yield


func()

但是，它会得到一个返回值，该返回值就是生成器对象

def func():
    print('first')
    yield

g=func()
print(g)

所以，现在我们就会自己自定义迭代器了，只要在函数里面来一个yield，然后调用该函数得到这个函数的返回值即可。

yield后面可以跟返回值，类似于return

区别： 如果用return返回，一个函数只能返回一次，但是如果要用yield，只要next一次就能返回一个值

def func():
    print('first')
    yield 1
    print('second')
    yield 2
    print('third')
    yield 3
    print('fourth')

g=func()
print(g)
print(g.__iter__().__iter__() is g)

调用迭代器

def func():
    print('first')
    yield 1
    print('second')
    yield 2
    print('third')
    yield 3
    print('fourth')

g=func()
# print(g)
# print(g.__iter__().__iter__() is g)

res1=next(g) #会触发函数的执行，直到碰到一个yield停下来，并且将yield后的值当作本次next的结果返回
print(res1)

一直调用，一直爽

def func():
    print('first')
    yield 1
    print('second')
    yield 2
    print('third')
    yield 3
    print('fourth')

g=func()
# print(g)
# print(g.__iter__().__iter__() is g)

res1=next(g) #会触发函数的执行，直到碰到一个yield停下来，并且将yield后的值当作本次next的结果返回
print(res1)
res2=next(g)
# print(res2)
res3=next(g)
# print(res3)
res4=next(g)

练习：实现range功能

def my_range(start,stop,step=1):
    while start < stop: # 3 < 3
        yield start
        start+=step #start=3

obj=my_range(1,5,2) # 1 3

print(next(obj))
print(next(obj))
# 取干净了就报错
print(next(obj))

表达式yield应用（了解）

yield的表达式形式的应用: x=yield

喂狗：

def dog(name):
    print('狗哥 %s 准备开吃' %name)
    food_list=[]
    while True:
        food=yield food_list #  food=yield='肉包子'
        print('%s 吃了 %s' %(name,food))
        food_list.append(food)

g=dog('qls')

# 强调：针对表达式形式的yield的使用，第一步必须让函数先暂停到一个yield的位置，才能进行传值操作
next(g) # 张开狗嘴，让生成器先暂停到yield的位置，准备接收外部传进来的值
res1=next(g) #g.send(None)
print(res1)

res2=g.send('屎包子') # 1. 先为当前暂停位置的yield赋值 2. next(生成器)直到再次碰到一个yield停下来，然后其的值当做本次next的结果
# print(res2)

res3=g.send('肉包子')
# print(res3)

res4=g.send('泔水')
print(res4)

yield关键字总结

总结yield:

0.只能在函数中使用。
1.yield提供了一种自定义迭代器的解决方案。
2.yield可以保存函数的暂停的状态。
3.yield对比return。
- 3.1相同点：都可以返回值，值的类型与个数都没有限制。
- 3.2不同点：yield可以返回多次值，而return只能返回一次值函数就结束了。

生成器表达式

回顾列表表达式

l=[i**2 for i in range(1,6) if i > 3]
print(l)

生成器表达式

# 生成器表达式
g=(i**2 for i in range(1,6) if i > 3)
# print(g)
print(next(g))
print(next(g))
print(next(g))

# 统计文件中的字符数量
with open(r'/Users/driverzeng/Desktop/PYTHON/01 装饰器.py','rt',encoding='utf-8') as f:
    data=f.read()
    print(len(data))

## 但是这样会出问题，如果文件过大，可能会导致内存溢出

# 使用for循环一行一行的读
with open(r'/Users/driverzeng/Desktop/PYTHON/01 装饰器.py','rt',encoding='utf-8') as f:
    res=0
    for line in f:
        res+=len(line)
    print(res)

## 但是麻烦

# 使用生成器表达式
with open(r'/Users/driverzeng/Desktop/PYTHON/01 装饰器.py','rt',encoding='utf-8') as f:
    g=(len(line) for line in f)
    print(sum(g))

猜你喜欢

Luminar Neo for Mac(AI技术图像编辑软件) 1.7.1激活版
mysql查找最后一条记录_mysql查询记录总数
STM32之NVIC的深入详解
MySQL函数:性能优化实践（mysql函数优化）
如何使用Linux查看所有文件夹？（linux查看所有文件夹）
LabVIEW实现ST-Link自动烧录
android AlarmManager讲解详解手机开发
使用Oracle实现大数据分析的设计与应用（oracle大数据设计）
优化Oracle性能：重组索引（oracle索引重组）
Oracle创建唯一索引:用法与实践（oracle创建唯一索引）
数据分析 VS 算法模型，如何高效分工合作？
使用Oracle管理数据，实现数据集中管理（oracle回车符）
java ORM框架（一）

zl程序教程