python使用for...else跳出双层嵌套循环的方法实例

所属分类：脚本专栏 / python 阅读数： 1947

收藏 0赞 0分享

背景

周末在写一个爬虫时，遇到这样一种场景：从搜索结果中下载指定数量的文件

例如：搜索结果中共分为10页展示，加起来一共50条数据，现在要做的是从50条数据中下载指定数量的数据

为了实现这个功能，开始我是这样想的：

1、依次遍历10页数据，并且把每页的数据都追加到同一个列表中，这样的话，请求完10页数据后，这个列表中就包含了所有结果；

2、然后再从这个大列表中提取指定数量的数据进行下载即可

这种方法确实可行，但是在运行过程中发现一个问题：程序运行速度太慢了，原因是无论你想下载多少条数据，都会先把所有数据请求下来并追加到列表中，这个过程实在是太耗时了，而且也不合理

所以换一种思路：要下载n条数据，就只提取n条，不提前把所有数据请求下来

具体实现方法

上面举的例子，可以抽象为如下功能

首先有一个嵌套的列表

[[1,2,3,4,5],[6,7,8,9,10],[11,12,13,14,15],[16,17,18,19,20]]

然后提取这个列表中的数据到一个新的列表中，例如取前3个数字、前5个数字或者前8个数字

可以通过双层for循环来实现，另外要注意设置条件来跳出循环，如下

source = [[1,2,3,4,5],[6,7,8,9,10],[11,12,13,14,15],[16,17,18,19,20]]
target = []

def get_data(source, count):
 for i in range(0, len(source)+1):
  temp = source[i]
  for j in temp:
   target.append(j)
   if len(target) >= count:
    break

  else:
   continue
  break

t = get_data(source, 6)
print(target)

source代表原列表；count代表提取数字的个数

根据菜鸟教程的提示， for ... else 的意思如下：

1、for 中的语句和普通的没有区别，else 中的语句会在循环正常执行完的情况下执行（即 for 不是通过 break 跳出而中断的）；

2、如果for是由于break中断的，则不会执行else语句

来分析下count为不同值时的运行过程及结果

1、count=3

当count=3时，得到如下结果

target = [1, 2, 3]

source中包含4个子列表，每个子列表包含5个数字；

先遍历外层for循环，当遍历到第一个子列表时，就能够满足内层for循环中断的条件了，即：当提取到第一个子列表的数字3时，target的长度等于3，满足len(target)>=count，跳出内层for循环

由于此时不是正常退出内层for循环，所以不会执行后面的else语句（ps：这里else语句下是执行continue指令，也就是继续遍历外层for循环），然后继续执行else后的berak语句，跳出外层for循环

综上，得到 target = [1, 2, 3] 的结果

2、count=8

当count=3时，得到如下结果

target = [1, 2, 3, 4, 5, 6, 7, 8]

同样，先取出外层for循环的第一个子列表，第一个子列表只有5个数字，当遍历完后，target的长度等于5，不满足len(target)>=count

此时内层for循环正常结束第一轮遍历，由于for循环正常结束，所以执行else下的语句，也就是执行continue指令，这里的continue是针对外层for循环的，也就是说继续取出外层for循环的第二个子列表

当第二个子列表遍历到第三个数字时，target的长度等于8，满足len(target)>=count，，跳出内层for循环

同理，由于此时不是正常退出内层for循环，所以不会执行后面的else语句，然后继续执行else后的berak语句，跳出外层for循环

综上，得到 target =[1, 2, 3, 4, 5, 6, 7, 8] 的结果

更多精彩内容其他人还在看

python使用for...else跳出双层嵌套循环的方法实例

Python调用C/C++的方法解析

学习Python爬虫的几点建议

Python创建临时文件和文件夹

浅析Python 序列化与反序列化

8种常用的Python工具

python爬虫使用requests发送post请求示例详解

Python结合Window计划任务监测邮件的示例代码

Python用来做Web开发的优势有哪些

如何解决pycharm调试报错的问题

基于logstash实现日志文件同步elasticsearch

网络赚钱

站长故事