本系列文章将整理到我在GitHub上的《Java面试指南》仓库,更多精彩内容请到我的仓库里查看
喜欢的话麻烦点下Star哈
文章将同步到我的个人博客:
本文是微信公众号【Java技术江湖】的《不可轻视的Java网络编程》其中一篇,本文部分内容来源于网络,为了把本文主题讲得清晰透彻,也整合了很多我认为不错的技术博客内容,引用其中了一些比较好的博客文章,如有侵权,请联系作者。
该系列博文会告诉你如何从计算机网络的基础知识入手,一步步地学习Java网络基础,从socket到nio、bio、aio和netty等网络编程知识,并且进行实战,网络编程是每一个Java后端工程师必须要学习和理解的知识点,进一步来说,你还需要掌握Linux中的网络编程原理,包括IO模型、网络编程框架netty的进阶原理,才能更完整地了解整个Java网络编程的知识体系,形成自己的知识框架。
为了更好地总结和检验你的学习成果,本系列文章也会提供部分知识点对应的面试题以及参考答案。
如果对本系列文章有什么建议,或者是有什么疑问的话,也可以关注公众号【Java技术江湖】联系作者,欢迎你参与本系列博文的创作和修订。
前言
之前写了两篇关于 NIO 的文章,第一篇介绍了 NIO 的 Channel、Buffer、Selector 使用,第二篇介绍了非阻塞 IO 和异步 IO,并展示了简单的用例。
本文将介绍 Tomcat 中的 NIO 使用,使大家对 Java NIO 的生产使用有更加直观的认识。
虽然本文的源码篇幅也不短,但是 Tomcat 的源码毕竟不像 Doug Lea 的并发源码那么“变态”,对于大部分读者来说,阅读难度比之前介绍的其他并发源码要简单一些,所以读者不要觉得有什么压力。
本文基于 Tomcat 当前(2018-03-20)最新版本 9.0.6。
先简单画一张图示意一下本文的主要内容:
目录
源码环境准备
Tomcat 9.0.6 下载地址:https://tomcat.apache.org/download-90.cgi
由于上面下载的 tomcat 的源码并没有使用 maven 进行组织,不方便我们看源码,也不方便我们进行调试。这里我们将使用 maven 仓库中的 tomcat-embed-core,自己编写代码进行启动的方式来进行调试。
首先,创建一个空的 maven 工程,然后添加以下依赖。
1 | <dependency> |
上面的依赖,只会将 tomcat-embed-core-9.0.6.jar 和 tomcat-annotations-api-9.0.6.jar 两个包引进来,对于本文来说,已经足够了,如果你需要其他功能,需要额外引用其他的依赖,如 Jasper。
然后,使用以下启动方法:
1 | public static void main(String[] args) throws LifecycleException { |
经过以上的代码,我们的 Tomcat 就启动起来了。
Tomcat 中的其他接口感兴趣的读者请自行探索,如设置 webapp 目录,设置 resources 等
这里,介绍第一个重要的概念:Connector。在 Tomcat 中,使用 Connector 来处理连接,一个 Tomcat 可以配置多个 Connector,分别用于监听不同端口,或处理不同协议。
在 Connector 的构造方法中,我们可以传 HTTP/1.1
或 AJP/1.3
用于指定协议,也可以传入相应的协议处理类,毕竟协议不是重点,将不同端口进来的连接对应不同处理类才是正道。典型地,我们可以指定以下几个协议处理类:
- org.apache.coyote.http11.Http11NioProtocol:对应非阻塞 IO
- org.apache.coyote.http11.Http11Nio2Protocol:对应异步 IO
- org.apache.coyote.http2.Http2Protocol:对应 http2 协议,对 http2 感兴趣的读者,赶紧看起来吧。
本文的重点当然是非阻塞 IO 了,之前已经介绍过异步 IO
的基础知识了,读者看完本文后,如果对异步 IO 的处理流程感兴趣,可以自行去分析一遍。
如果你使用 9.0 以前的版本,Tomcat 在启动的时候是会自动配置一个 connector 的,我们可以不用显示配置。
9.0 版本的 Tomcat#start() 方法:
1
2
3
4
5 > public void start() throws LifecycleException {
> getServer();
> server.start();
> }
>
8.5 及之前版本的 Tomcat#start() 方法:
1
2
3
4
5
6
7 > public void start() throws LifecycleException {
> getServer();
> // 自动配置一个使用非阻塞 IO 的 connector
> getConnector();
> server.start();
> }
>
endpoint
前面我们说过一个 Connector 对应一个协议,当然这描述也不太对,NIO 和 NIO2 就都是处理 HTTP/1.1 的,只不过一个使用非阻塞,一个使用异步。进到指定 protocol 代码,我们就会发现,它们的代码及其简单,只不过是指定了特定的 endpoint。
打开 Http11NioProtocol
和 Http11Nio2Protocol
源码,我们可以看到,在构造方法中,它们分别指定了 NioEndpoint 和 Nio2Endpoint。
1 | // 非阻塞模式 |
这里介绍第二个重要的概念:endpoint。Tomcat 使用不同的 endpoint 来处理不同的协议请求,今天我们的重点是 NioEndpoint,其使用非阻塞 IO 来进行处理 HTTP/1.1 协议的请求。
NioEndpoint 继承 => AbstractJsseEndpoint 继承 => AbstractEndpoint。中间的 AbstractJsseEndpoint 主要是提供了一些关于 HTTPS
的方法,这块我们暂时忽略它,后面所有关于 HTTPS 的我们都直接忽略,感兴趣的读者请自行分析。
init 过程分析
下面,我们看看从 tomcat.start() 一直到 NioEndpoint 的过程。
1. AbstractProtocol # init
1 | @Override |
2. AbstractEndpoint # init
1 | public final void init() throws Exception { |
3. NioEndpoint # bind
这里就到我们的 NioEndpoint 了,要使用到我们之前学习的 NIO 的知识了。
1 | @Override |
- ServerSocketChannel 已经打开,并且绑定要了之前指定的 8080 端口,设置成了阻塞模式。
- 设置了 acceptor 的线程数为 1
- 设置了 poller 的线程数,单核 CPU 为 1,多核为 2
- 打开了一个 SelectorPool,我们先忽略这个
到这里,我们还不知道 Acceptor 和 Poller 是什么东西,我们只是设置了它们的数量,我们先来看看最后面提到的 SelectorPool。
start 过程分析
刚刚我们分析完了 init() 过程,下面是启动过程 start() 分析。
AbstractProtocol # start
1 | @Override |
AbstractEndpoint # start
1 | public final void start() throws Exception { |
下面这个方法还是比较重要的,这里会创建前面说过的 acceptor 和 poller。
NioEndpoint # startInternal
1 | @Override |
到这里,我们启动了工作线程池、 poller 线程组、acceptor 线程组。同时,工作线程池初始就已经启动了 10 个线程。我们用 jconsole 来看看此时的线程,请看下图:
从 jconsole 中,我们可以看到,此时启动了 BlockPoller、worker、poller、acceptor、AsyncTimeout,大家应该都已经清楚了每个线程是哪里启动的吧。
Tomcat 中并没有 Worker 这个类,此名字是我瞎编。
此时,我们还是不知道 acceptor、poller 甚至 worker 到底是干嘛的,下面,我们从 acceptor 线程开始看起。
Acceptor
它的结构非常简单,在构造函数中,已经把 endpoint 传进来了,此外就只有 threadName 和 state 两个简单的属性。
1 | private final AbstractEndpoint<?,U> endpoint; |
threadName 就是一个线程名字而已,Acceptor 的状态 state 主要是随着 endpoint 来的。
1 | public enum AcceptorState { |
我们直接来看 acceptor 的 run 方法吧:
Acceptor # run
1 | @Override |
大家应该发现了,Acceptor 绕来绕去,都是在调用 NioEndpoint 的方法,我们简单分析一下这个。
在 NioEndpoint init 的时候,我们开启了一个 ServerSocketChannel,后来 start 的时候,我们开启多个 acceptor(实际上,默认是 1 个),每个 acceptor 启动以后就开始循环调用 ServerSocketChannel 的 accept() 方法获取新的连接,然后调用 endpoint.setSocketOptions(socket) 处理新的连接,之后再进入循环 accept 下一个连接。
到这里,大家应该也就知道了,为什么这个叫 acceptor 了吧?接下来,我们来看看 setSocketOptions 方法到底做了什么。
NioEndpoint # setSocketOptions
1 | @Override |
我们看到,这里又没有进行实际的处理,而是将这个 SocketChannel 注册到了其中一个 poller 上。因为我们知道,acceptor 应该尽可能的简单,只做 accept 的工作,简单处理下就往后面扔。acceptor 还得回到之前的循环去 accept 新的连接呢。
我们只需要明白,此时,往 poller 中注册了一个 NioChannel 实例,此实例包含客户端过来的 SocketChannel 和一个 SocketBufferHandler 实例。
Poller
之前我们看到 acceptor 将一个 NioChannel 实例 register 到了一个 poller 中。在看 register 方法之前,我们需要先对 poller 要有个简单的认识。
1 | public class Poller implements Runnable { |
敲重点:每个 poller 关联了一个 Selector。
Poller 内部围着一个 events 队列转,来看看其 events() 方法:
1 | public boolean events() { |
events() 方法比较简单,就是取出当前队列中的 PollerEvent 对象,逐个执行 event.run() 方法。
然后,现在来看 Poller 的 run() 方法,该方法会一直循环,直到 poller.destroy() 被调用。
Poller # run
1 | public void run() { |
poller 的 run() 方法主要做了调用 events() 方法和处理注册到 Selector 上的 ready key,这里我们暂时不展开 processKey 方法,因为此方法必定是及其复杂的。
我们回过头来看之前从 acceptor 线程中调用的 register 方法。
Poller # register
1 | public void register(final NioChannel socket) { |
这里将这个 socket(包含 socket 和 buffer 的 NioChannel 实例) 包装为一个 PollerEvent,然后添加到 events 中,此时调用此方法的 acceptor 结束返回,去处理新的 accepted 连接了。
接下来,我们已经知道了,poller 线程在循环过程中会不断调用 events() 方法,那么 PollerEvent 的 run() 方法很快就会被执行,我们就来看看刚刚这个新的连接被注册到这个 poller 后,会发生什么。
PollerEvent # run
1 | @Override |
到这里,我们再回顾一下:刚刚在 PollerEvent 的 run() 方法中,我们看到,新的 SocketChannel 注册到了 Poller 内部的 Selector 中,监听 OP_READ 事件,然后我们再回到 Poller 的 run() 看下,一旦该 SocketChannel 是 readable 的状态,那么就会进入到 poller 的 processKey 方法。
processKey
Poller # processKey
1 | protected void processKey(SelectionKey sk, NioSocketWrapper attachment) { |
接下来是 processSocket 方法,注意第三个参数,上面进来的时候是 true。
AbstractEndpoint # processSocket
1 | public boolean processSocket(SocketWrapperBase<S> socketWrapper, |
NioEndpoint # createSocketProcessor
1 | @Override |
我们看到,提交到 worker 线程池中的是 NioEndpoint.SocketProcessor 的实例,至于它的 run() 方法之后的逻辑,我们就不再继续往里分析了。
总结
最后,再祭出文章开始的那张图来总结一下:
这里简单梳理下前面我们说的流程,帮大家回忆一下:
- 指定 Protocol,初始化相应的 Endpoint,我们分析的是 NioEndpoint;
- init 过程:在 NioEndpoint 中做 bind 操作;
- start 过程:启动 worker 线程池,启动 1 个 Acceptor 和 2 个 Poller,当然它们都是默认值,可配;
- Acceptor 获取到新的连接后,getPoller0() 获取其中一个 Poller,然后 register 到 Poller 中;
- Poller 循环 selector.select(xxx),如果有通道 readable,那么在 processKey 中将其放到 worker 线程池中。
后续的流程,感兴趣的读者请自行分析,本文就说到这里了。
(全文完)
微信公众号
个人公众号:程序员黄小斜
微信公众号【程序员黄小斜】新生代青年聚集地,程序员成长充电站。作者黄小斜,职业是阿里程序员,身份是斜杠青年,希望和更多的程序员交朋友,一起进步和成长!这一次,我们一起出发。
关注公众号后回复“2019”领取我这两年整理的学习资料,涵盖自学编程、求职面试、算法刷题、Java技术、计算机基础和考研等8000G资料合集。
技术公众号:Java技术江湖
微信公众号【Java技术江湖】一位阿里 Java 工程师的技术小站,专注于 Java 相关技术:SSM、SpringBoot、MySQL、分布式、中间件、集群、Linux、网络、多线程,偶尔讲点Docker、ELK,同时也分享技术干货和学习经验,致力于Java全栈开发!
关注公众号后回复“PDF”即可领取200+页的《Java工程师面试指南》强烈推荐,几乎涵盖所有Java工程师必知必会的知识点。