理解 “端口号” 和 “进程ID”
我们之前在学习系统编程的时候, 学习了 pid 表示唯一一个进程; 此处我们的端口号也是唯一表示一个进程. 那么这
两者之间是怎样的关系?
因为进程id当程序重启的时候会发生改变,而端口不会改变。另外, 一个进程可以绑定多个端口号; 但是一个端口号不能被多个进程绑定;
因此,对端B的IP和端口就必须固定,不固定,A端不知道对方的地址和端口,无法通信。如果B端主机上的QQ所使用的固定端口,万一被其他程序占用了, QQ用不了就必须换个端口才行,但是换个端口对方找不到了。因此,实际上我们大多数的网络应用通信(qq,微信), 并不是两台客户端主机之间的直接通信,而是有一个网络服务提供商,搭建了服务器,这个服务器使用固定的地址和端口不会改变,每个用户用的都是客户端,实质上的通信时客户端与服务器的通信,A主机QQ与QQ服务器通信,告诉QQ服务器,我的这条数据要发送给哪个QQ号,对应QQ号的主机上线后,会登录QQ服务器,QQ服务器就知道了它的地址和端口,然后将数据转发过去,历史消息就是保存到了服务器中。
实际的网络通信中,必然有一 端主机的地址和端口是固定的,是让所有人都知道的。这一端通常叫做服务端(为用户提供服务的一端)。我们使用的客户端程序,都封装了自己的服务器主机地址和端口在里边。
协议
认识 “协议”
“协议” 是一种约定.,是网络通信中的数据格式约定,不同主机必须遵守相同的网络通信协议(不是一个单个的协议,而是一组协议)才可以实现实质通信。
计算机生产厂商有很多;计算机操作系统, 也有很多;计算机网络硬件设备, 还是有很多;如何让这些不同厂商之间生产的计算机能够相互顺畅的通信? 就需要有人站出来, 约定一个共同的标准,大家都来遵守, 这就是 网络协议;
举个有趣的例子:
小明给小红发送了一 条:我想你了,对应的二进制011111001111xxx转换为电信号的高低电平进行传输,但是如果小明和小红的主机上的网卡是不同厂商生产的,他们对于高低电平的波长解释不同,就会导致010101111,实际对方收到的是1010111111,可能就被翻译成为:吃了吗,小红回复了:还没呢,小明收到了:收到的数据被解释成为:滚蛋,这时候的小明和小红,并没有形成实质上的通信。
协议分层
协议分层:按照网络通信环境,不同层次所提供的服务,使用的协议,提供的接口,对整个通信环境进行了分层。
在这个例子中, 我们的协议只有两层; 但是实际的网络通信会更加复杂, 需要分更多的层次.分层最大的好处在于 “封装” .
OSI七层模型
OSI(Open System Interconnection,开放系统互连)七层网络模型称为开放式系统互联参考模型,是一个逻辑上的定义和规范;把网络从逻辑上分为了7层. 每一层都有相关、相对应的物理设备,比如路由器,交换机;OSI 七层模型是一种框架性的设计方法,其最主要的功能使就是帮助不同类型的主机实现数据传输;它的最大优点是将服务、接口和协议这三个概念明确地区分开来,概念清楚,理论也比较完整. 通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯;但是, 它既复杂又不实用; 所以我们按照TCP/IP五层模型来讲解.
重点:
应用层:负责应用程序之间的数据沟通的格式约定(QQ与QQ的沟通协议,SSH) ;典型协议: HTTP,SSH, SMTP, FTP, …
传输层:负责进程之间的数据传输的格式约定; 典型协议: TCP/UDP (内部就描述 了源端端口,对端端口)
网络层:负责地址管理与路由选择;典型协议: IP协议(内部描述 了源端IP,对端IP) ;典型设备: 路由器
链路层:负责相邻设备之间的数据传输(就像搬运一样,快递员一交给快递员二…最终交给用户);典型协议: ETH协议–以太网协议(内部描述了相邻设别的MAC地址) ;典型设备: 交换机
物理层:负责物理光电信号的传输;典型协议: 以太网协议(与组网技术有关) ; ;典型设备: 集线器
举一个qq传输的例子:
注意:
分层顺序是固定的,但是不一定每一层使用的协议相同,从传输层开始,往下都是定义好的,只能选择用哪一种,不能自定义,但是应用层的协议是程序员可以自定义的,往下都是特定约定的,是一种标准。
拓展:
TCP/IP五层(或四层)模型
TCP/IP是一组协议的代名词,它还包括许多协议,组成了TCP/IP协议簇. TCP/IP通讯协议采用了5层的层级结构,每一层都呼叫它的下一层所提供的网络来完成自己的需求.
物理层: 负责光/电信号的传递方式. 比如现在以太网通用的网线(双绞 线)、早期以太网采用的的同轴电缆(现在主要用于有线电视)、光纤, 现在的wifi无线网使用电磁波等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等. 集线器(Hub)工作在物理层.
数据链路层: 负责设备之间的数据帧的传送和识别. 例如网卡设备的驱动、帧同步(就是说从网线上检测到什么信号算作新帧的开始)、冲突检测(如果检测到冲突就自动重发)、数据差错校验等工作. 有以太网、令牌环网, 无线LAN等标准. 交换机(Switch)工作在数据链路层.
网络层: 负责地址管理和路由选择. 例如在IP协议中, 通过IP地址来标识一台主机, 并通过路由表的方式规划出两台主机之间的数据传输的线路(路由). 路由器(Router)工作在网路层.传输层: 负责两台主机之间的数据传输. 如传输控制协议 (TCP), 能够确保数据可靠的从源主机发送到目标主机.
应用层: 负责应用程序间沟通,如简单电子邮件传输(SMTP)、文件传输协议(FTP)、网络远程访问协议(Telnet)等. 我们的网络编程主要就是针对应用层.
物理层我们考虑的比较少. 因此很多时候也可以称为 TCP/IP四层模型.一般而言:
对于一台主机,它的操作系统内核实现了从传输层到物理层的内容;
对于一台路由器, 它实现了从网络层到物理层; 对于一台交换机,
它实现了从数据链路层到物理层; 对于集线器, 它只实现了物理层;
但是并不绝对. 很多交换机也实现了网络层的转发; 很多路由器也实现了部分传输层的内容(比如端口转发);
网络传输基本流程
网络传输流程图
同一个网段内的两台主机进行文件传输.
跨网段的主机的文件传输. 数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器.
数据包封装和分用
不同的协议层对数据包有不同的称谓,在传输层叫做段(segment),在网络层叫做数据报 (datagram),在链路层叫做帧(frame).应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部(header),称为封装(Encapsulation).首部信息中包含了一些类似于首部有多长, 载荷(payload)有多长, 上层协议是什么等信息.数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部, 根据首部中的 “上层协议字段” 将数据交给对应的上层协议处理.
下图为数据分用的过程
网络中的地址管理
认识IP地址
IP协议有两个版本, IPv4和IPv6. 我们整个的课程, 凡是提到IP协议, 没有特殊说明的, 默认都是指IPv4
IP地址是在IP协议中, 用来标识网络中不同主机的地址;对于IPv4来说, IP地址是一个4字节, 32位的整数;我们通常也使用"点分十进制" 的字符串表示IP地址, 例如 192.168.0.1 ; 用点分割的每一个数字表示一个字节, 范围是 0 - 255;
认识MAC地址
mac地址就是物理硬件地址,每个网卡都有一个物理硬件地址,本质是一个6字节的无符号整数。
网络层的ip地址,描述了通信的起点和终点,但是数据不是直接从起点到终点的,而是经过大量的中间设备转发过去的,中间相邻设备转发的时候,就使用的是mac地址进行的表示。比如交换机就是通过mac地址进行转发的,mac地址上有一个mac地址表,交换机通过mac地址表,知道这个主机链接的是哪个插口,就把数据发送过去。
MAC地址用来识别数据链路层中相连的节点;长度为48位, 及6个字节. 一般用16进制数字加上冒号的形式来表示(例如: 08:00:27:03:fb:19)在网卡出厂时就确定了, 不能修改. mac地址通常是唯一的(虚拟机中的mac地址不是真实的mac地址, 可能会冲突; 也有些网卡支持用户配置mac地址).