Python实现多线程下载文件_Linux系统教程

本文要用Python实现简单的多线程下载文件，这可以显著减少下载一个文件所用的时间。

基本步骤：

1.把要下载的文件平均分成几块

2.每个线程分别下载对应的块

3.把各块写入到文件中相应的位置

使用到的模块

pip install requests # 负责下载文件

pip install threading # 多线程，默认已安装

代码 (my_file_downloader.py)

# 在python3下测试

import sys

import requests

import threading

import datetime

# 传入的命令行参数，要下载文件的url

url = sys.argv[1]

def Handler(start, end, url, filename):

headers = {'Range': 'bytes=%d-%d' % (start, end)}

r = requests.get(url, headers=headers, stream=True)

# 写入文件对应位置

with open(filename, "r+b") as fp:

fp.seek(start)

var = fp.tell()

fp.write(r.content)

def download_file(url, num_thread = 5):

r = requests.head(url)

try:

file_name = url.split('/')[-1]

file_size = int(r.headers['content-length']) # Content-Length获得文件主体的大小，当http服务器使用Connection:keep-alive时，不支持Content-Length

except:

print("检查URL，或不支持对线程下载")

return

# 创建一个和要下载文件一样大小的文件

fp = open(file_name, "wb")

fp.truncate(file_size)

fp.close()

# 启动多线程写文件

part = file_size // num_thread # 如果不能整除，最后一块应该多几个字节

for i in range(num_thread):

start = part * i

if i == num_thread - 1: # 最后一块

end = file_size

else:

end = start + part

t = threading.Thread(target=Handler, kwargs={'start': start, 'end': end, 'url': url, 'filename': file_name})

t.setDaemon(True)

t.start()

# 等待所有线程下载完成

main_thread = threading.current_thread()

for t in threading.enumerate():

if t is main_thread:

continue

t.join()

print('%s 下载完成' % file_name)

if __name__ == '__main__':

start = datetime.datetime.now().replace(microsecond=0)

download_file(url)

end = datetime.datetime.now().replace(microsecond=0)

print("用时: ", end='')

print(end-start)

测试：

$ python my_file_downloader.py http://blog.topspeedsnail.com/wp-content/uploads/2016/05/bitcoin.pdf

上面使用5个线程下载一个文件用时1分59秒。

把 num_thread 改为1，对比单线程下载用时：

单线程用时9分11秒。

本文永久更新地址：http://www.linuxdiyf.com/linux/24511.html

Python实现多线程下载文件

频道文章

网站推荐文章

推荐教程

热点推荐