Python中yield用法学习示例

本文以一个爬虫示例,来记录python学习过程中yield的用法。

目的:爬取代理网站的IP地址、端口及地区信息,定义一个函数,该函数为一个生成器,每次调用返回列表中的不同的值(直到遍历整个列表,即每次调用返回一个不同的IP地址及端口信息)。

import requests
from lxml import etree



url =
'https://www.xicidaili.com/nn'
header = {
       
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36"
   
}
response = requests.get(
url=url,headers=header).text
html = etree.HTML(response)
ip_list = html.xpath(
'//div/table/tr/td[2]/text()')
port_list = html.xpath(
'//div/table/tr/td[3]/text()')
area_list = html.xpath(
'//div/table/tr/td[4]/a/text()')
i_list = (x
for x in ip_list)
p_list = (y
for y in port_list)
a_list = (z
for z in area_list)
def get_proxy():

   
# for i in range(3):
    #     print('-' * 10)
    #     print('ip
列表:',next(i_list))
    #     print('
端口列表',next(p_list))
    #     print('
地区列表',next(a_list))
    #     print('-' * 10)
    # print(i_list,p_list,a_list)
   
new_list = [next(i_list),next(p_list),next(a_list)] # 第一次返回
   
# print(new_list)
   
for count in i_list:
       
yield new_list  #当第1次程序执行到此处,直接返回'第一次返回'的列表内容
       
new_list = [next(i_list), next(p_list), next(a_list)] #当第2次调用,执行此处语句(从yield下面语句开始执行),重新给列表赋新值,然后走循环,再次返回列表new_list,如此循环,直至遍历i_list列表

a = get_proxy()
print(next(a))
print(next(a))
print(next(a))
print(next(a))

执行结果如下:

['223.198.1.145', '9999', '海南']

['222.190.163.228', '9999', '浙江金华']

['175.42.68.32', '9999', '江苏泰州']

['123.163.27.179', '808', '江苏宿迁市泗阳县']

 

### 回答1: 在Python中,yield是一个关键字,用于生成器函数中。生成器函数是指包含yield语句的函数,当生成器函数被调用时,它会返回一个迭代器对象,通过该对象可以逐步获取生成器函数中yield语句返回的值。 yield语句可以将生成器函数的执行状态保存下来,并在下一次调用时从上一次执行的位置继续执行。这使得生成器函数可以在需要时才生成数据,而不是一次性生成所有数据,从而节省内存空间。 下面是一个简单的示例,演示了如何使用yield来定义一个生成器函数,并使用next()函数获取生成器返回的值: ``` def my_generator(): yield 1 yield 2 yield 3 gen = my_generator() print(next(gen)) # 输出 1 print(next(gen)) # 输出 2 print(next(gen)) # 输出 3 ``` 在以上示例中,my_generator() 函数是一个生成器函数,其中包含了三个yield语句,分别返回了1、2、3三个值。当 my_generator() 函数被调用时,它会返回一个生成器对象,通过该对象可以逐步获取yield语句返回的值。在使用next()函数获取生成器返回的值时,生成器函数会在每次调用时执行到下一个yield语句,并返回该语句的返回值。 除了使用next()函数外,我们还可以使用for循环来逐个获取生成器返回的值,例如: ``` for value in my_generator(): print(value) ``` 希望以上介绍对您有所帮助。 ### 回答2: 在Python中,yield是一个关键字,用于定义生成器函数。生成器函数可以像普通函数一样进行定义,但是当函数执行到yield语句时,会暂停执行并保存当前的所有状态,然后将yield后面的值作为生成器的返回值。 生成器函数可以通过多次调用生成器的next()方法来逐步执行,每次执行到yield语句时,会返回yield后面的值,并将函数暂停。下一次调用next()方法时,函数会从上次暂停的地方继续执行,直到再次遇到yield语句。 生成器函数的特点是可以一边循环一边计算,能够节省内存空间。通过yield语句,我们可以将一个复杂的计算过程分解成多个简单的步骤,每次只计算一个步骤的结果。 除了next()方法外,生成器还可以使用for循环来进行遍历。当for循环对生成器进行迭代时,每次循环都会调用next()方法,直到生成器函数执行完毕。 yield还可以用于实现协程(Coroutine)的功能,协程允许在多个任务之间进行切换,以实现非抢占式多任务调度。通过使用yield语句来暂停和恢复执行,可以让程序在多个任务之间灵活切换,提高了程序的性能和效率。 总结来说,yield是定义生成器函数的关键字,可以让函数在执行过程中暂停并保存状态,返回一个值,然后再次恢复执行。生成器函数可以用于迭代和分步计算,以及实现协程的功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值