面试总结(一)-网络 & IO

网络基础知识

TCP 连接

客户端与服务器之间数据的发送和返回的过程当中需要创建一个叫TCP connection的东西;

由于TCP不存在连接的概念,只存在请求和响应,请求和响应都是数据包,它们之间都是经过由TCP创建的一个从客户端发起,服务器接收的类似连接的通道,这个连接可以一直保持,http请求是在这个连接的基础上发送的;

在一个TCP连接上是可以发送多个http请求的,不同的版本这个模式不一样。

在HTTP/1.0中这个TCP连接是在http请求创建的时候同步创建的,http请求发送到服务器端,服务器端响应了之后,这个TCP连接就关闭了;

HTTP/1.1中可以以某种方式声明这个连接一直保持,一个请求传输完之后,另一个请求可以接着传输。这样的好处是:在创建一个TCP连接的过程中需要“三次握手”的消耗,“三次握手”代表有三次网络传输,如果TCP连接保持,第二个请求发送就没有这“三次握手”的消耗。

HTTP/2.0中同一个TCP连接里还可以并发地传输http请求。

重要字段:

  1. 序号(sequence number): seq 序号,占 32 位,用来标识从 TCP 源端到目的端发送的字节流,发起方发送数据时对此进行标记。
  2. 确认号(acknowledgement number): ack 序号,占 32 位,只有 ACK 标志位为 1 时,确认序号字段才有效, ack = seq + 1。
  3. 标志位(flags): 共 6 个,即 URG、ACK、PSH、RST、SYN、FIN 等。其值要么是 1, 要么是 0。具体含义如下:
  • URG: 紧急指针(urgent pointer)有效。
  • ACK: 确认序号有效。
  • PSH: 接收方应该尽快将这个报文交给应用层。
  • RST: 重置连接。
  • SYN: 发起一个新连接。
  • FIN: 释放一个连接。
TCP 三次握手

  1. 主动打开连接的客户端结束CLOSED阶段,发送一段 TCP 报文,(SYN = 1, seq = x )(x 一般为 1)。随后客户端进入 SYN-SEND 阶段。
  2. 服务端接收到来自客户端的报文,结束 LISTEN 阶段,并返回一段报文(SYN = 1, ACK = 1, seq = y, ack = x + 1),随后服务器进入 SYN-RCVD 阶段。
  3. 客户端接收到来自服务器端的确认收到数据的 TCP 报文后,明确了从客户端到服务器的数据传输是正常的,结束了 SYN-SEND 阶段。并返回一段 TCP 报文,(ACK = 1, seq = x + 1, ack = y + 1)。随后客户端进入 ESTABLISHED 阶段。
  4. 服务端收到来自服务端的确认收到服务器数据的 TCP 报文后,明确了从服务器到客户端的数据传输是正常的。结束 SYN-RCVD 阶段,进入 ESTABLISHED 阶段。
  5. 此后客户端和服务器端进行正常的数据传输。
TCP 四次挥手

  1. 客户端想要释放连接,向服务端发送一段报文,(FIN = 1, seq = u),随后客户端进入 FIN-WAIT-1 阶段,即半关闭阶段。并且停止在客户端到服务器端方向上发送数据,但是客户端仍然能接收从服务器端传输过来的数据。
  2. 服务器端接收到从客户端发出的TCP报文之后,确认了客户端想要释放连接,随后服务器端结束ESTABLISHED阶段,进入CLOSE-WAIT阶段(半关闭状态)并返回一段TCP报文,(ACK = 1, seq = v, ack = u + 1)。随后服务端开始准备释放服务端到客户端方向上的连接。客户端收到从服务器端发出的TCP报文之后,确认了服务器收到了客户端发出的释放连接请求,随后客户端结束FIN-WAIT-1阶段,进入FIN-WAIT-2阶段。
  3. 服务器端自从发送 ACK 确认报文后,经过 CLOSED-WAIT 阶段,做好了释放服务器到客户端方向上的连接准备。再次向客户端发出一段 TCP 报文,(FIN = 1, ACK = 1, seq = w, ack = u + 1)。随后服务器端结束CLOSE-WAIT阶段,进入LAST-ACK阶段。并且停止在服务器端到客户端的方向上发送数据,但是服务器端仍然能够接收从客户端传输过来的数据。
  4. 客户端收到从服务器端发出的TCP报文,确认了服务器端已做好释放连接的准备,结束FIN-WAIT-2阶段,进入TIME-WAIT阶段,并向服务器端发送一段报文,(ACK = 1, seq = u + 1, ack = w + 1)。随后客户端开始在TIME-WAIT阶段等待2MSL。服务器端收到从客户端发出的TCP报文之后结束LAST-ACK阶段,进入CLOSED阶段。由此正式确认关闭服务器端到客户端方向上的连接。客户端等待完2MSL之后,结束TIME-WAIT阶段,进入CLOSED阶段,由此完成“四次挥手”。

TCP 与 UDP

  1. TCP 和 UDP 都属于网络传输层的协议。
  2. TCP 面向连接,在数据传输前需经过三次握手建立连接,在数据传递时,有确认、窗口、重传、拥塞控制机制,在数据传完后,通过四次挥手断开连接用来节约系统资源;UDP 面向无连接,发送数据之前不需要建立连接。UDP 没有拥塞控制,因此网络出现拥塞不会使源主机的发送速率降低。
  3. TCP 提供可靠的服务。通过 TCP 连接传送的数据,无差错,不丢失,不重复,且按序到达;UDP 尽最大努力交付,即不保证可靠交付。
  4. TCP 面向字节流,实际上是 TCP 把数据看成一连串无结构的字节流;UDP 是面向报文的。
  5. TCP 连接只能是点到点的;UDP支持一对一,一对多,多对一和多对多的交互通信。

IO 机制

IO 指的是 Input/Output,也就是输入和输出。由于程序和运行时数据是在内存中驻留,由 CPU 这个超快的计算核心来执行,涉及到数据交换的地方,通常是磁盘、网络等,就需要 IO 接口。

BIO

BIO 即 Blocking I/O,属于同步阻塞 I/O 模式,数据的读取写入必须阻塞在一个线程内等待其完成。
BIO 以流的形式处理数据。其中包括了输入流和输出流。Java IO 提供的输出流有字符输出流(Writer) 和字节输出流(OutputStream)。输入流有字符输入流(Reader)和字节输入流(InputStream)。java 中操作流的实现都是基于这四个接口类实现。

NIO

NIO 即 Non-Blocking I/O,属于同步非阻塞 I/O 模式,支持多路复用。在数据的读取写入过程中,不需要阻塞获取数据读取写入结果,通过轮询获取数据读取写入结果。
NIO 以数据块的形式处理数据。每一个操作都在一步中产生或者消费一个数据块。按块处理数据比按(流式的)字节处理数据要快得多。java 中提供了 Channels、Selectors、Buffers等。

  • channels 类似于流的形式,数据可以从 channel 中写入 buffer 中,也可以从 buffer中写入 channel 中。
  • buffers 读取的数据块缓存。
  • selector 选择器,可在一个线程中通过 selector 操作多个 channel。

AIO

AIO 即 Asynchronous Non-Blocking I/O,属于异步非阻塞 I/O 模式,获取数据读取写入结果 java 提供了两种方式。

  1. 基于回调:实现 CompletionHandler 接口,调用时触发回调函数。
  2. 返回 Future:通过 isDone() 查看是否准备好,通过 get() 等待返回数据。

序列化与反序列化

  • 序列化就是一种用来处理对象流的机制,所谓对象流也就是将对象的内容进行流化(将对象转换成二进制)。可以对流化后的对象进行读写操作,也可将流化后的对象传输于网络之间。序列化是为了解决在对对象流进行读写操作时所引发的问题。对象的序列化主要有两种用途:(1)把对象的字节序列永久地保存到硬盘上,通常存放在一个文件中;(2)在网络上传送对象的字节序列。

  • 反序列化就是把字节序列恢复为Java对象的过程。