一、学习目标
- 理解线程和进程的区别及其应用场景。
- 掌握 Python 中 threading 模块的基本用法。
- 能够编写一个多线程下载器,应用并发编程知识。
二、学习内容与时间安排
上午(2小时):理论学习
1. 理解线程与进程的区别(0.5小时)
- 学习目标:掌握线程和进程的基本概念及其差异。
- 内容: 进程:操作系统分配资源的基本单位,具有独立的内存空间,进程间通信较复杂。 线程:进程内的执行单元,共享进程的内存空间,线程间通信更高效。 Python 中的 GIL(全局解释器锁):限制多线程在 CPU 密集型任务中的并行性,适合 I/O 密集型任务。
- 练习:阅读文档,记录线程和进程的优缺点。
2. 学习 threading 模块的基本使用(1小时)
- 学习目标:掌握线程的创建、启动和同步。
- 内容:
- threading.Thread:创建线程。
- start() 和 join():启动线程和等待线程结束。
- Lock:线程同步工具,避免资源竞争。
- 代码示例:python
import threading # 导入 threading 模块
import time # 导入 time 模块,用于模拟耗时操作
def worker(name):
"""线程工作函数,模拟一个简单的任务"""
print(f"线程 {name} 开始执行")
time.sleep(2) # 模拟耗时操作
print(f"线程 {name} 执行完成")
# 创建两个线程
t1 = threading.Thread(target=worker, args=("A",))
t2 = threading.Thread(target=worker, args=("B",))
# 启动线程
t1.start()
t2.start()
# 等待所有线程完成
t1.join()
t2.join()
print("所有线程执行完毕")
- 输出示例:
线程 A 开始执行
线程 B 开始执行
线程 A 执行完成
线程 B 执行完成
所有线程执行完毕
3. 复习与总结(0.5小时)
- 比较线程和进程的使用场景: 线程:适合 I/O 密集型任务(如网络请求、文件读写)。 进程:适合 CPU 密集型任务(如计算密集型操作)。
- 阅读 threading 模块文档,记录常用方法。
下午(2小时):实践与编程
1. 基础练习(1小时)
- 编写代码:
- 创建 3 个线程,分别打印 1-10 的数字。
- 使用 Lock 确保输出不混乱。
- 代码示例:python
import threading # 导入 threading 模块
# 创建一个锁对象,用于同步线程
lock = threading.Lock()
def print_numbers(thread_name):
"""线程函数,打印 1-10 的数字"""
with lock: # 使用锁确保输出顺序
for i in range(1, 11):
print(f"{thread_name}: {i}")
# 创建 3 个线程
threads = []
for name in ["线程1", "线程2", "线程3"]:
t = threading.Thread(target=print_numbers, args=(name,))
threads.append(t)
t.start()
# 等待所有线程完成
for t in threads:
t.join()
print("所有线程执行完毕")
2. 项目练习:多线程下载器(1小时)
- 任务:编写一个多线程下载器,从多个 URL 下载文件。
- 要求:使用 threading 模块实现并发下载,使用 requests 模块获取文件。
- 代码示例(带注释)**:python
import threading # 导入 threading 模块,用于创建线程
import requests # 导入 requests 模块,用于下载文件
import time # 导入 time 模块,用于记录下载时间
# 下载锁,确保文件写入安全
download_lock = threading.Lock()
def download_file(url, filename):
"""
下载文件的线程函数
参数:
url (str): 文件的下载地址
filename (str): 保存的文件名
"""
print(f"开始下载 {url} 到 {filename}")
start_time = time.time() # 记录开始时间
try:
# 发送 HTTP GET 请求下载文件
response = requests.get(url, timeout=10)
response.raise_for_status() # 检查请求是否成功
# 使用锁确保文件写入不冲突
with download_lock:
with open(filename, "wb") as f:
f.write(response.content)
# 计算下载耗时
elapsed_time = time.time() - start_time
print(f"{filename} 下载完成,耗时 {elapsed_time:.2f} 秒")
except requests.RequestException as e:
print(f"下载 {url} 失败: {e}")
# 主程序
if __name__ == "__main__":
# 定义下载任务列表:URL 和目标文件名
download_tasks = [
("https://example.com/file1.txt", "file1.txt"),
("https://example.com/file2.txt", "file2.txt"),
("https://example.com/file3.txt", "file3.txt"),
]
# 创建线程列表
threads = []
start_time = time.time() # 记录总开始时间
# 为每个下载任务创建并启动线程
for url, filename in download_tasks:
t = threading.Thread(target=download_file, args=(url, filename))
threads.append(t)
t.start()
# 等待所有线程完成
for t in threads:
t.join()
# 计算总耗时
total_time = time.time() - start_time
print(f"所有文件下载完成,总耗时 {total_time:.2f} 秒")
- 说明: 使用 threading.Thread 创建多个线程并发下载。 使用 download_lock 确保文件写入时不发生冲突。 requests.get 下载文件,保存到本地。
- 注意:运行此代码需安装 requests 模块(pip install requests),并将 URL 替换为真实可用的文件地址(如图片或文本文件)。
三、学习资源
- Python 官方文档: threading 模块:https://docs.python.org/3/library/threading.html requests 模块:https://docs.python-requests.org/
- 参考书籍:《Python 并发编程实战》。
四、代码说明
- 基础练习代码: 使用 Lock 确保多个线程的输出不混乱。
- 多线程下载器代码: 每个线程负责下载一个文件,Lock 保护文件写入操作。 记录每个文件和总体的下载时间,展示并发效果。
五、学习成果检验
- 运行基础练习代码,观察线程输出是否有序。
- 运行多线程下载器,下载多个文件,比较单线程和多线程的耗时差异。
- 修改下载器代码,尝试添加进度条或错误重试功能。
通过本学习计划,您将掌握线程与进程的区别,熟练使用 threading 模块,并通过多线程下载器实践并发编程的核心概念。理论学习结合代码示例,确保您理解线程的创建、同步和应用场景。完成计划后,您可以进一步探索 multiprocessing 模块,扩展到进程级并发编程。