常见模型分类
循环服务器模型 :循环接收客户端请求,处理请求。同一时刻只能处理一个请求,处理完毕后再
处理下一个。
- 优点:实现简单,占用资源少
- 缺点:无法同时处理多个客户端请求
- 适用情况:处理的任务可以很快完成,客户端无需长期占用服务端程序。udp比tcp更适合循环。
IO并发模型:利用IO多路复用,异步IO等技术,同时处理多个客户端IO请求。
- 优点 : 资源消耗少,能同时高效处理多个IO行为
- 缺点 : 只能处理并发产生的IO事件,无法处理cpu计算
- 适用情况:HTTP请求,网络传输等都是IO行为。
多进程/线程网络并发模型:每当一个客户端连接服务器,就创建一个新的进程/线程为该客户端服务,客户端退出时再销毁该进程/线程。
- 优点:能同时满足多个客户端长期占有服务端需求,可以处理各种请求。
- 缺点: 资源消耗较大
- 适用情况:客户端同时连接量较少,需要处理行为较复杂情况。
基于fork的多进程网络并发模型
- 创建监听套接字
- 等待接收客户端请求
- 客户端连接创建新的进程处理客户端请求
- 原进程继续等待其他客户端连接
- 如果客户端退出,则销毁对应的进程
from socket import *
import os
import signal # 创建监听套接字
HOST = '0.0.0.0'
PORT = 8888
ADDR = (HOST,PORT) # 客户端服务函数
def handle(c):
while True:
data = c.recv(1024)
if not data:
break
print(data.decode())
c.send(b'OK')
c.close() s = socket() # tcp套接字
s.setsockopt(SOL_SOCKET,SO_REUSEADDR,1) # 设置套接字端口重用
s.bind(ADDR)
s.listen(3) signal.signal(signal.SIGCHLD,signal.SIG_IGN) # 处理僵尸进程 print("Listen the port %d..." % PORT) # 循环等待客户端连接
while True:
try:
c,addr = s.accept()
except KeyboardInterrupt:
os._exit(0)
except Exception as e:
print(e)
continue # 创建子进程处理这个客户端
pid = os.fork()
if pid == 0: # 处理客户端请求
s.close()
handle(c)
os._exit(0) # handle处理完客户端请求子进程也退出 # 无论出错或者父进程都要循环回去接受请求
# c对于父进程没用
c.close()
基于threading的多线程网络并发
- 创建监听套接字
- 循环接收客户端连接请求
- 当有新的客户端连接创建线程处理客户端请求
- 主线程继续等待其他客户端连接
- 当客户端退出,则对应分支线程退出
from socket import *
from threading import Thread
import sys # 创建监听套接字
HOST = '0.0.0.0'
PORT = 8888
ADDR = (HOST,PORT) # 处理客户端请求
def handle(c):
while True:
data = c.recv(1024)
if not data:
break
print(data.decode())
c.send(b'OK')
c.close() s = socket() # tcp套接字
s.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)
s.bind(ADDR)
s.listen(3) print("Listen the port %d..."%PORT)
# 循环等待客户端连接
while True:
try:
c,addr = s.accept()
except KeyboardInterrupt:
sys.exit("服务器退出")
except Exception as e:
print(e)
continue # 创建线程处理客户端请求
t = Thread(target=handle, args=(c,))
t.setDaemon(True) # 父进程结束则所有进程终止
t.start()
ftp 文件服务器
项目功能 :
* 客户端有简单的页面命令提示: 功能包含:
- 查看服务器文件库中的文件列表(普通文件)
- 可以下载其中的某个文件到本地
- 可以上传客户端文件到服务器文件库
* 服务器需求 :
- 允许多个客户端同时操作
- 每个客户端可能回连续发送命令
技术分析:
- tcp套接字更适合文件传输
- 并发方案 ---》 fork 多进程并发
- 对文件的读写操作
- 获取文件列表 ----》 os.listdir()
粘包的处理
整体结构设计
- 服务器功能封装在类中(上传,下载,查看列表)
- 创建套接字,流程函数调用 main()
- 客户端负责发起请求,接受回复,展示
服务端负责接受请求,逻辑处理
from socket import *
from threading import Thread
import os
import time # 全局变量
HOST = '0.0.0.0'
PORT = 8080
ADDR = (HOST,PORT)
FTP = "/home/tarena/FTP/" # 文件库位置 # 创建文件服务器服务端功能类
class FTPServer(Thread):
def __init__(self,connfd):
self.connfd = connfd
super().__init__() def do_list(self):
# 获取文件列表
files = os.listdir(FTP)
if not files:
self.connfd.send("文件库为空".encode())
return
else:
self.connfd.send(b'OK')
time.sleep(0.1) # 防止和后面发送内容粘包 # 拼接文件列表
files_ = ""
for file in files:
if file[0] != '.' and \
os.path.isfile(FTP+file):
files_ += file + '\n'
self.connfd.send(files_.encode()) def do_get(self,filename):
try:
fd = open(FTP+filename,'rb')
except Exception:
self.connfd.send("文件不存在".encode())
return
else:
self.connfd.send(b'OK')
time.sleep(0.1)
# 文件发送
while True:
data = fd.read(1024)
if not data:
time.sleep(0.1)
self.connfd.send(b'##')
break
self.connfd.send(data) # 循环接收客户端请求
def run(self):
while True:
data = self.connfd.recv(1024).decode()
if not data or data == 'Q':
return
elif data == 'L':
self.do_list()
elif data[0] == 'G': # G filename
filename = data.split(' ')[-1]
self.do_get(filename) # 网络搭建
def main():
# 创建套接字
sockfd = socket()
sockfd.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)
sockfd.bind(ADDR)
sockfd.listen(3)
print("Listen the port %d..."%PORT)
while True:
try:
connfd,addr = sockfd.accept()
print("Connect from",addr)
except KeyboardInterrupt:
print("服务器程序退出")
return
except Exception as e:
print(e)
continue # 创建新的线程处理客户端
client = FTPServer(connfd)
client.setDaemon(True)
client.start() # 运行run方法 if __name__ == "__main__":
main()
ftp_sever
from socket import *
import sys ADDR = ('127.0.0.1',8080) # 服务器地址 # 客户端功能处理类
class FTPClient:
def __init__(self,sockfd):
self.sockfd = sockfd def do_list(self):
self.sockfd.send(b'L') # 发送请求
# 等待回复
data = self.sockfd.recv(128).decode()
if data == 'OK':
# 一次接收文件列表字符串
data = self.sockfd.recv(4096)
print(data.decode())
else:
print(data) def do_get(self,filename):
# 发送请求
self.sockfd.send(('G '+filename).encode())
# 等待回复
data = self.sockfd.recv(128).decode()
if data == 'OK':
fd = open(filename,'wb')
# 接收文件
while True:
data = self.sockfd.recv(1024)
if data == b'##':
break
fd.write(data)
fd.close()
else:
print(data) def do_quit(self):
self.sockfd.send(b'Q')
self.sockfd.close()
sys.exit("谢谢使用") # 创建客户端网络
def main():
sockfd = socket()
try:
sockfd.connect(ADDR)
except Exception as e:
print(e)
return ftp = FTPClient(sockfd) # 实例化对象 # 循环发送请求
while True:
print("\n=========命令选项==========")
print("**** list ****")
print("**** get file ****")
print("**** put file ****")
print("**** quit ****")
print("=============================") cmd = input("输入命令:") if cmd.strip() == 'list':
ftp.do_list()
elif cmd[:3] == 'get':
# get filename
filename = cmd.strip().split(' ')[-1]
ftp.do_get(filename)
elif cmd[:3] == 'put':
# put ../filename
filename = cmd.strip().split(' ')[-1]
ftp.do_put(filename)
elif cmd.strip() == 'quit':
ftp.do_quit()
else:
print("请输入正确命令") if __name__ == "__main__":
main()
ftp_client
IO并发
定义:在内存中数据交换的操作被定义为IO操作,IO------输入输出
内存和磁盘进行数据交换: 文件的读写 数据库更新
内存和终端数据交换 : input print
sys.stdin sys.stdout sys.stderr
内存和网络数据的交换: 网络连接 recv send recvfrom
IO密集型程序 : 程序执行中有大量的IO操作,而较少的cpu运算操作。消耗cpu较少,IO运行时间长
CPU(计算)密集型程序:程序中存在大量的cpu运算,IO操作相对较少,消耗cpu大。
IO分类
IO分为:阻塞IO、非阻塞IO、IO多路复用、事件驱动IO、异步IO
阻塞IO
- 定义: 在执行IO操作时如果执行条件不满足则阻塞。阻塞IO是IO的默认形态。
- 效率: 阻塞IO是效率很低的一种IO。但是由于逻辑简单所以是默认IO行为。
阻塞情况:
- 因为某种执行条件没有满足造成的函数阻塞 e.g. accept input recv
- 处理IO的时间较长产生的阻塞状态 e.g. 网络传输, 大文件读写
非阻塞IO
定义 : 通过修改IO属性行为, 使原本阻塞的IO变为非阻塞的状态。
- 设置套接字为非阻塞IO
- sockfd.setblocking(bool)
- 功能: 设置套接字为非阻塞IO
- 参数: 默认为True,表示套接字IO阻塞;设置为False则套接字IO变为非阻塞
- 超时检测 :设置一个最长阻塞时间,超过该时间后则不再阻塞等待。
- sockfd.settimeout(sec)
- 功能:设置套接字的超时时间
- 参数:设置的时间
IO多路复用
定义 :通过一个监测,可以同时监控多个IO事件的行为。当哪个IO事件可以执行,即让这个IO事件发生。
rs, ws, xs = select(rlist, wlist, xlist[, timeout]) 监控IO事件,阻塞等待监控的IO时间发生
参数 :
- rlist 列表,存放(被动)等待处理的IO (接收)
- wlist 列表,存放主动处理的IO(发送)
- xlist 列表,存放出错,希望去处理的IO(异常)
- timeout 超时检测
返回值:
- rs 列表 rlist中准备就绪的IO
- ws 列表 wlist中准备就绪的IO
- xs 列表 xlist中准备就绪的IO
select 实现tcp服务
- 将关注的IO放入对应的监控类别列表
- 通过select函数进行监控
- 遍历select返回值列表,确定就绪IO事件
- 处理发生的IO事件
from socket import *
from select import select # 创建一个监听套接字作为关注的IO
s = socket()
s.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)
s.bind(('0.0.0.0',8888))
s.listen(3) # 设置关注列表
rlist = [s]
wlist = []
xlist = [s] # 循环监控IO
while True:
rs,ws,xs = select(rlist,wlist,xlist)
# 遍历三个返回列表,处理IO
for r in rs:
# 根据遍历到IO的不同使用if分情况处理
if r is s:
c,addr = r.accept()
print("Connect from",addr)
rlist.append(c) # 增加新的IO事件
# else为客户端套接字就绪情况
else:
data = r.recv(1024)
# 客户端退出
if not data:
rlist.remove(r) # 从关注列表移除
r.close()
continue # 继续处理其他就绪IO
print("Receive:",data.decode())
# r.send(b'OK')
# 我们希望主动处理这个IO对象
wlist.append(r) for w in ws:
w.send(b'OK')
wlist.remove(w) # 使用后移除 for x in xs:
pass
注意:
- wlist中如果存在IO事件,则select立即返回给ws
- 处理IO过程中不要出现死循环占有服务端的情况
- IO多路复用消耗资源较少,效率较高
扩展: 位运算
将整数转换为二进制, 按照二进制位进行运算符操作
& 按位与 | 按位或 ^ 按位异或 << 左移 >> 右移
11 1011 14 1110
(11 & 14 1010) (11 | 14 1111) (11 ^ 14 0101 )
11 << 2 ===> 44 右侧补0 14 >> 2 ===> 3 挤掉右侧的数字
使用 : 1. 在做底层硬件时操作寄存器
2. 做标志位的过滤
poll方法实现IO多路复用
p = select.poll() 创建poll对象
p.register(fd,event) 注册关注的IO事件
- fd 要关注的IO
- event 要关注的IO事件类型
常用类型:
- POLLIN 读IO事件(rlist)
- POLLOUT 写IO事件 (wlist)
- POLLERR 异常IO (xlist)
- POLLHUP 断开连接
e.g. p.register(sockfd,POLLIN|POLLERR)
p.unregister(fd) 取消对IO的关注
- 参数: IO对象或者IO对象的fileno
events = p.poll()
- 功能: 阻塞等待监控的IO事件发生
- 返回值: 返回发生的IO事件
events 是一个列表 [(fileno,evnet),(),()....]
每个元组为一个就绪IO,元组第一项是该IO的fileno,第二项为该IO就绪的事件类型
poll_server 步骤
- 创建套接字
- 将套接字register
- 创建查找字典,并维护
- 循环监控IO发生
- 处理发生的IO
from socket import *
from select import * # 创建套接字
s = socket()
s.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)
s.bind(('0.0.0.0',8888))
s.listen(3) # 创建poll对象关注s
p = poll() # 建立查找字典,用于通过fileno查找IO对象
fdmap = {s.fileno():s} # 关注s
p.register(s,POLLIN|POLLERR) # 循环监控
while True:
events = p.poll()
# 循环遍历发生的事件 fd-->fileno
for fd,event in events:
# 区分事件进行处理
if fd == s.fileno():
c,addr = fdmap[fd].accept()
print("Connect from",addr)
# 添加新的关注IO
p.register(c,POLLIN|POLLERR)
fdmap[c.fileno()] = c # 维护字典
# 按位与判定是POLLIN就绪
elif event & POLLIN:
data = fdmap[fd].recv(1024)
if not data:
p.unregister(fd) # 取消关注
fdmap[fd].close()
del fdmap[fd] # 从字典中删除
continue
print("Receive:",data.decode())
fdmap[fd].send(b'OK')
epoll方法
1. 使用方法 : 基本与poll相同
- 生成对象改为 epoll()
- 将所有事件类型改为EPOLL类型
2. epoll特点
- epoll 效率比select poll要高
- epoll 监控IO数量比select要多
- epoll 的触发方式比poll要多 (EPOLLET边缘触发)
from socket import *
from select import * # 创建套接字
s = socket()
s.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)
s.bind(('0.0.0.0',8888))
s.listen(3) # 创建epoll对象关注s
ep = epoll() # 建立查找字典,用于通过fileno查找IO对象
fdmap = {s.fileno():s} # 关注s
ep.register(s,EPOLLIN|EPOLLERR) # 循环监控
while True:
events = ep.poll()
# 循环遍历发生的事件 fd-->fileno
for fd,event in events:
print("亲,你有IO需要处理哦")
# 区分事件进行处理
if fd == s.fileno():
c,addr = fdmap[fd].accept()
print("Connect from",addr)
# 添加新的关注IO
# 将触发方式变为边缘触发
ep.register(c,EPOLLIN|EPOLLERR|EPOLLET)
fdmap[c.fileno()] = c # 维护字典
# 按位与判定是EPOLLIN就绪
# elif event & EPOLLIN:
# data = fdmap[fd].recv(1024)
# if not data:
# ep.unregister(fd) # 取消关注
# fdmap[fd].close()
# del fdmap[fd] # 从字典中删除
# continue
# print("Receive:",data.decode())
# fdmap[fd].send(b'OK')