红联Linux门户
Linux帮助

Linux小型FTP服务系统的实现

发布时间:2014-12-01 15:06:00来源:linux网站作者:echodjb

UDP是简单的,不可靠的数据报协议,而TCP是精致的,可靠的字节流协议。SCTP跟TCP类似也是可靠的传输协议,但它还提供消息边界,传输层支持多宿主,最小化拥塞。

UDP(用户数据报协议):

提供无连接的服务,同一个套接口可以发送数据报给不同的服务器,也可以在同一个套接口接收来自不同服务器的数据报。

TCP(传输控制协议):

一. TCP提供客户与服务器连接。

二. 提供可靠性,发过去后需要对方的确认,如果没有收到确认会重传。

三. TCP通过给所发送数据的每一个字节关联一个序列号进行排序。接收方的TCP将根据分节的序列号重新排序在将结果数据传递给应用进程。

四. 提供流量控制。通告窗口(advertised window)告诉对方它能接收多少字节的数据。缓冲区满时,必须等应用程序取走数据后才能再接收

五. TCP是全双工的

TCP建立连接的三路握手

1. 服务器通过调用socket, bind, listen 函数来完成被动打开;

2. 客户通过connect进行主动打开,引起TCP发送一个SYN分节,告诉服务器客户将在连接中发送的数据的初始序列号,

3. 服务器必须确认客户的SYN,同时自己发送一个SYN,含有服务器在连接中发送的数据的初始序列号,同时发送对客户SYN的ACK。

4. 客户确认服务器的SYN。

SYN使用的TCP选项:

MSS选项。 通知对象自己的最大分节大小,即能接受的每个TCP分节中的最大数据量

窗口规模选项。 只有对方收到对方的SYN来的这个选项时,才能发送该选项。

时间戳选项。

高带宽或长延时的网络才会用到后两个选项。

TCP连接终止:

1. 某个进程先调用close(主动关闭)。发送一个FIN,表示数据发送完毕。

2. 另一端收到后被动关闭,由TCP确认FIN,它的接收也作为文件结束符接收方应用程序。

3. 收到文件结束符的应用程序将调用close关闭套接口,导致它的TCP也发送一个FIN。

4. 收到这个FIN的原发送方对它确认。

Socket函数:
#include<sys/socket.h>

int socket(int family,int type,int protocol);
返回非负描述字则成功,-1出错。
family指明协议族(IPv4、IPv6或Unix),type表示套接口的类型,protocol一般设置为0。
Connect函数:
#include<sys/socket.h>

int connect(int sockfd,const struct sockaddr * servaddr, socklen_t addrlen);

返回0成功,-1出错。

Sockfd是由socket函数返回的套接口描述字,第二、第三个参数分别是一个指向套接口地址结构的指针和该结构的大小。地址结构必须含有服务器的IP地址和端口号。

Bind函数

#include<sys/socket.h>

int bind(int sockfd,const struct sockaddr * myaddr, socklen_t addrlen);

返回0成功,-1出错。

第二个参数是一个指向特定协议的地址结构的指针,第三个参数是该地址结构的长度。这个函数给套接口分配一个协议地址,协议地址的含义取决于协议本身。

Listen函数:

#include<sys/socket.h>

int listen(int sockfd,int bavklog);

返回0成功,-1出错。

第二个参数规定了内核为此套接口排队的最大连接个数。函数listen只被服务器调用,将未连接的套接口转换成被动套接口,指示内核应接受指向此套接口的连接请求。调用此函数可使套接口从CLOSED状态转换到LISTEN状态。

Accept函数:

#include<sys/socket.h>

int accept(int sockfd,const struct sockaddr * cliaddr, socklen_t addrlen);

返回非负描述字成功,-1出错。

此函数由服务器调用,从已完成连接队列头返回下一个已完成连接。若已完成连接队列为空,则进程睡眠。参数cliaddr和addrlen用来返回连接对方进程(客户)的协议地址。

Close函数:

#include<unistd.h>

int close(int sockfd);

套接口的close缺省功能是将套接口做上“已关闭”标记,并立即返回到进程。这个套接口描述字不能再为进程所用。
Shutdown函数

#include<sys/socket.h>

int shutdown(int s,int how);

成功返回0,否则返回-1。

该函数调用将导致socket描述符s所指的全双工socket连接被部分或全部关闭。

Getsockopt和setsockopt函数;
#include<sys/socket.h>
int getsockopt(int sockfd,int level,int optname,void *optval,socklen_t *optlen);
int setsockopt(int sockfd,int level,int optname,const void *optval,socklen_t *optlen);

sockfd必须指向一个打开的套接字,level指定系统中解释选项的代码:普通套接口代码或特定于协议的代码;optval是一个指向变量的指针。

Recv和send函数:
#include<sys/socket.h>
ssize_t rect(int sockfd,void * buff,size_t nbytes,int flags);
ssize_t send(int sockfd,const void * buff,size_t nbytes,int flags);
 
成功则返回读入或写出的字节数,出错返回-1。

这两个函数和标准的read和write函数很类似,只是多了一个附加的参数flags。

FTP上进行的大量操作都是对文件或文件夹操作的,主要类型也就是文件的读写,所以文件I/O和高级文件操作函数也是本次实验的一个重点,对于这部分函数我们了解接触不是很多,大部分课程对这部分的介绍也是一带而过,所以这部分的函数要靠自己去查找资料进行学习使用。现在把FTP中用到的和文件操作相关的函数及其头文件列举如下:open函数:

#include<sys/types.h>  
#include<sys/stat.h>  
#include<fcnt1.h>  
int open(const char *pathname,int flags,…mode_t mode); 

打开(或创建)文件失败返回-1。

第一个参数pathname是要打开(或创建)的文件名或含路径的文件名。第二个参数是标志打开的方式,这个参数用来说明这个系统调用的多个选择项。

creat函数:

#include<sys/types.h>  
#include<sys/stat.h>  
#include<fcnt1.h>  
int creat(const char *pathname, mode_t mode); 

创建文件失败返回-1。

参数含义与open函数相同。

read函数:

#include<unist.h>  
size_t read(int filedes,void *buff,size_t nbytes); 

调用成功返回读取的字节数,返回0表示文件指针在文件尾。错误返回-1。

该函数从文件描述符fd所指的文件中读取nbytes字节到buff所指向的内存缓冲中。

write函数:

#include<unist.h>  
size_t write(int filedes,void *buff,size_t nbytes); 

FTP协议工作原理

FTP有两个过程一个是控制连接,一个是数据传输。FTP协议不像HTTP协议一样需要一个端口作为连接(默认时HTTP端口是80,FTP端口是 21)。FTP协议需要两个端口,一个端口是作为控制连接端口,也就是FTP的21端口,用于发送指令给服务器以及等待服务器响应;另外一个端口用于数据传输端口,端口号为20(仅用PORT模式),是用建立数据传输通道的,主要作用是从客户向服务器发送一个文件,从服务器向客户发送一个文件,从服务器向客户发送文件或目录列表。

FTP协议的传输模式

FTP协议的任务是从一台计算机将文件传送到另一台计算机,它与这两台计算机所处的位置、联接的方式、甚至是是否使用相同的操作系统无关。假设两台计算机通过ftp协议对话,并且能访问Internet, 你可以用ftp命令来传输文件。每种操作系统使用上有某一些细微差别,但是每种协议基本的命令结构是相同的。

FTP的传输有两种方式:ASCII传输模式和二进制数据传输模式。

ASCII传输方式假定用户正在拷贝的文件包含的简单ASCII码文本,如果在远程机器上运行的不是UNIX,当文件传输时ftp通常会自动地调整文件的内容以便于把文件解释成另外那台计算机存储文本文件的格式。但是常常有这样的情况,用户正在传输的文件包含的不是文本文件,它们可能是程序,数据库,字处理文件或者压缩文件(尽管字处理文件包含的大部分是文本,其中也包含有指示页尺寸,字库等信息的非打印字符)。在拷贝任何非文本文件之前,用 binary 命令告诉ftp逐字拷贝,不要对这些文件进行处理,这也是下面要讲的二进制传输。

二进制传输模式在二进制传输中,保存文件的位序,以便原始和拷贝的是逐位一一对应的。即使目的地机器上包含位序列的文件是没意义的。例如,macintosh以二进制方式传送可执行文件到Windows系统,在对方系统上,此文件不能执行。如果你在ASCII方式下传输二进制文件,即使不需要也仍会转译。这会使传输稍微变慢 ,也会损坏数据,使文件变得不能用。(在大多数计算机上,ASCII方式一般假设每一字符的第一有效位无意义,因为ASCII字符组合不使用它。如果你传输二进制文件,所有的位都是重要的。)如果你知道这两台机器是同样的,则二进制方式对文本文件和数据文件都是有效的。

FTP协议的工作方式

FTP支持两种模式,一种方式叫做Standard (也就是 PORT方式,主动方式),一种是 Passive (也就是PASV,被动方式)。

Standard模式 FTP的客户端发送 PORT 命令到FTP服务器。Passive模式FTP的客户端发送 PASV命令到 FTP Server。

下面介绍一个这两种方式的工作原理:

Port模式FTP客户端首先动态的选择一个端口(一般是1024以上的)和FTP服务器的TCP 21端口建立连接,通过这个通道发送命令,客户端需要接收数据的时候在这个通道上发送PORT命令。

PORT命令包含了客户端用什么端口接收数据。在传送数据的时候,服务器端通过自己的TCP 20端口连接至客户端的指定端口发送数据。

FTP server必须和客户端建立一个新的连接用来传送数据。

Passive模式在建立控制通道的时候和Standard模式类似,但建立连接后发送的不是Port命令,而是Pasv命令。FTP协议服务器收到Pasv命令后,随机打开一个高端端口(端口号大于1024)并且通知客户端在这个端口上传送数据的请求,客户端连接FTP服务器此端口,然后FTP服务器将通过这个端口进行数据的传送,这个时候FTP server不再需要建立一个新的和客户端之间的连接。很多防火墙在设置的时候都是不允许接受外部发起的连接的,所以许多位于防火墙后或内网的FTP服务器不支持PASV模式,因为客户端无法穿过防火墙打开FTP服务器的高端端口;而许多内网的客户端不能用PORT模式登陆FTP服务器,因为从服务器的 TCP 20无法和内部网络的客户端建立一个新的连接,造成无法工作。