Python 深入浅出：并发计算利器 concurrent.futures 详解

作者：CoderWang 时间：2026-06-28 阅读数：2人阅读

在 Python 中，进行并发编程最底层的工具是 threading（多线程）和 multiprocessing（多进程）模块。然而，直接操作底层的线程/进程、手动管理线程生命周期、处理队列通信以及收集执行结果，编写起来极其繁琐且极易出错。

为了简化并发编程，Python 3.2 引入了高层抽象的并发框架——concurrent.futures 模块。

它通过统一的 Executor（执行器） 接口，将底层的“线程池”与“进程池”进行了高度抽象，让我们能够用极其一致、优雅的代码来编写并发任务。

本文将带您深度剖析 concurrent.futures 的核心架构，掌握 ThreadPoolExecutor 与 ProcessPoolExecutor 的实战场景。

一、核心抽象：Executor、ThreadPool 与 ProcessPool

concurrent.futures 的核心是抽象基类 Executor。它有两个核心子类实现：

ThreadPoolExecutor（线程池）：
适用场景：IO 密集型任务（如网页抓取、多文件读写、调用第三方 Web API）。
特点：线程轻量，创建开销小，适合在等待网络/磁盘 IO 时交替切换。
ProcessPoolExecutor（进程池）：
适用场景：CPU 密集型任务（如图像旋转缩放、大矩阵计算、数据加密/解密）。
特点：每个子进程拥有独立的 Python 解释器和独立的内存，彻底打破 GIL（全局解释器锁）的限制，实现真正的多核并行计算。

二、任务提交的双子星：`submit()` vs. `map()`

Executor 提供了两种最常用的任务分发方法：

1. `submit(func, *args, **kwargs)`

机制：非阻塞。将任务函数提交给线程/进程池后，立即返回一个 Future 对象。
优势：灵活性极高。你可以为每个任务传入不同的参数，并且可以动态控制任务。

2. `map(func, *iterables)`

机制：类似于 Python 内置的 map 函数，但会自动将迭代器中的参数异步分发给池并发运行。
优势：代码极其精简，且返回的结果迭代器会严格按照传入的参数顺序产出。

三、理解 Future（期物）对象

当你调用 submit() 时，返回的并不是函数执行的真实结果，而是一个 Future 对象。 Future 代表一个“在未来才会完成的异步操作”。它是一个占位符，用来追踪任务的状态。

核心方法：

future.done()：判断任务是否已经执行完毕（返回 True/False）。
future.result(timeout=None)：阻塞式获取任务的真实返回值。如果任务尚未结束，当前线程会原地挂起等待；如果任务执行期间报错，调用此方法会直接抛出对应的异常。
future.cancel()：尝试取消尚未开始运行的任务。

四、实战：使用 `ThreadPoolExecutor` 并发获取网页

下面我们使用 ThreadPoolExecutor 并发请求多个网页，并使用 as_completed 机制实现“先下载完先处理”的高效模式：

from concurrent.futures import ThreadPoolExecutor, as_completed
import urllib.request

URLS = [
    "https://www.python.org",
    "https://www.wikipedia.org",
    "https://www.github.com"
]

def load_url(url, timeout):
    # 模拟网络下载函数
    with urllib.request.urlopen(url, timeout=timeout) as conn:
        return conn.read()

def main():
    # 1. 使用 with 语句自动管理线程池的启动与销毁
    # 线程池大小推荐设置为：CPU 核心数 * 5
    with ThreadPoolExecutor(max_workers=5) as executor:

        # 2. 批量提交任务，并用字典建立 Future 到 URL 的映射关系
        future_to_url = {
            executor.submit(load_url, url, 60): url 
            for url in URLS
        }

        # 3. 使用 as_completed 监控任务。一旦有任何一个线程执行完毕，立刻 yield 出来
        for future in as_completed(future_to_url):
            url = future_to_url[future]
            try:
                data = future.result()  # 此时获取结果不会阻塞，因为任务已 done
                print(f"📡 {url} 下载成功，数据大小: {len(data)} 字节")
            except Exception as exc:
                print(f"❌ {url} 发生异常: {exc}")

if __name__ == "__main__":
    main()

五、总结与最佳实践

统一生命周期管理：推荐始终使用 with 语句（上下文管理器）来使用 Executor。它能保证在退出 with 块时，自动隐式调用 executor.shutdown(wait=True)，等待所有子线程/进程安全退出，防止资源遗漏。
选择适合的池：
IO 密集型，选 ThreadPoolExecutor；
CPU 密集型，选 ProcessPoolExecutor。
不要混用并发模式：在高度异步的 asyncio 项目中，如果需要使用线程/进程池，不要直接实例化 concurrent.futures，而应优先使用前面学过的 loop.run_in_executor()。

concurrent.futures 用高级的池化抽象，屏蔽了底层线程与进程调度的繁琐细节，是 Python 并发编程中的中流砥柱！

本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。

如果侵犯了你的权益请来信告知我们删除。

上一篇：Python 中的协程 (Coroutines) 与 asyncio 异步编程从入门到精通

下一篇：Python 中的垃圾回收机制 (Garbage Collection) 与内存管理机制详解

评论交流 (0)

正在加载评论...

Python 深入浅出：并发计算利器 concurrent.futures 详解

一、核心抽象：Executor、ThreadPool 与 ProcessPool

二、任务提交的双子星：`submit()` vs. `map()`

1. `submit(func, *args, **kwargs)`

2. `map(func, *iterables)`

三、理解 Future（期物）对象

核心方法：

四、实战：使用 `ThreadPoolExecutor` 并发获取网页

五、总结与最佳实践

评论交流 (0)

CoderWang

猜你喜欢

腾讯云EKS一键部署k8s容器总结

Java程序员如何突破技术瓶颈

Centos7系统下的安装RabbitMQ3.10

某光K8s项目v8.3.9版本上线

如何学好一门互联网技术

商城项目的业务分析——创建订单

Python 深入浅出：并发计算利器 concurrent.futures 详解

一、 核心抽象：Executor、ThreadPool 与 ProcessPool

二、 任务提交的双子星：submit() vs. map()

1. submit(func, *args, **kwargs)

2. map(func, *iterables)

三、 理解 Future（期物）对象

核心方法：

四、 实战：使用 ThreadPoolExecutor 并发获取网页

五、 总结与最佳实践

评论交流 (0)

CoderWang

猜你喜欢

腾讯云EKS一键部署k8s容器总结

Java程序员如何突破技术瓶颈

Centos7系统下的安装RabbitMQ3.10

某光K8s项目v8.3.9版本上线

如何学好一门互联网技术

商城项目的业务分析——创建订单

一、核心抽象：Executor、ThreadPool 与 ProcessPool

二、任务提交的双子星：`submit()` vs. `map()`

1. `submit(func, *args, **kwargs)`

2. `map(func, *iterables)`

三、理解 Future（期物）对象

四、实战：使用 `ThreadPoolExecutor` 并发获取网页

五、总结与最佳实践