首先,我們需要弄清楚幾個概念:同步和非同步,阻塞和非阻塞。
一、同步和非同步
1. 同步
進程觸發 IO 操作的時候,必須親自處理;
比如你必須親自去銀行取錢。
2. 非同步
進程觸發 IO 操作的時候,可以不親自處理,它把操作委託給 OS 處理,委託的時候需要告知數據的地址和大小,然後自己去做別的事情,當 IO 操作結束後會得到通知;
比如你把銀行卡給我,讓我幫你去銀行取錢,你需要告訴我銀行卡密碼和取多少錢,我取完了之後把錢給你。
3. 總結
自己干就是同步,別人干就是非同步。
二、阻塞和非阻塞
1. 阻塞
進程觸發 IO 操作的時候,如果此時此時沒辦法讀或者寫,那麼進程就一直等待,直到讀寫結束;
比如你去銀行 ATM 取錢,前面有人在排隊,那麼就要一直等待,直到你取完錢;
2. 非阻塞
進程觸發 IO 操作的時候,如果此時此時沒辦法讀或者寫,那麼就先去做別的,等到有通知後,再繼續讀寫;
比如你去銀行櫃檯取錢,人比較多,那就先領一個號,等著叫到號再去對應的窗口辦理業務;這裡稍微有些不太恰當的是,我們等待的過程中,還得聽著叫號。
3. 總結
我要等著不能做其他事就是阻塞,我不用等可以做其他事就是非同步。
三、BIO
同步阻塞;一個請求過來,應用程序開了一個線程,等 IO 準備好,IO 操作也是自己干;
採用 BIO 模型的服務端,由一個獨立的 Acceptor 線程負責進行監聽;在 while(true) 循環中調用 accept() 方法,等待客戶端的請求;
一旦接收到請求,就可以建立套接字開始進行讀寫操作,這時候不再接收其他的請求,直到讀寫完成;
為了讓 BIO 能夠同時處理多個請求,那麼就需要使用多線程處理;當服務端接收到請求,就為客戶端創建一個線程進行處理,處理完成後再做線程銷毀;
不過因為一個請求就要啟動一個線程,所以開銷是比較大的,啟動和銷毀線程開銷很大,而且每個線程都要佔用內存,所以可以引入線程池,可以在一定程度上減少線程創建和銷毀的開銷;這也被叫做 偽非同步 IO。
線程池維護著 N 個線程和一個消息隊列;當有請求接入時,服務端將 Socket 作為參數傳遞到一個線程任務中進行處理;通過對線程池最大線程數和消息隊列大小進行控制,所以就算訪問量高於服務端的承載能力,也不會因為服務端的資源耗盡而導致宕機;
這個模型在 請求量不高的時候,效率還是不錯的,而且也不需要考慮限流的問題(控制線程池的最大線程數量)。
四、NIO
同步非阻塞;不用等待 IO 準備,準備好了會通知,不過 IO 操作還是要自己干;NIO 是一種多路復用機制,利用單線程輪詢事件,Channel 來決定做什麼,避免連接數多的時候,頻繁進行線程切換導致性能問題(Select 階段阻塞)。
聽到這裡,很多人可能已經懵了...什麼是多路復用?Channel又是啥?Select 階段到底是什麼階段?這裡我用白話解釋一下。
NIO是面向緩衝區的,可以將數據讀取到一個緩衝區,稍後進行處理。NIO 有幾個核心概念:
1. Channel 和 Buffer
Channel 可以理解成一個雙向流,或者理解成一個通道,Buffer 就是緩存區,或者你就把它看做是一塊內存空間,數據可以從 Channel 流進 Buffer ,也可以從 Buffer 流進 Channel 。
Channel 有很多種實現,比如:FileChannel 是從文件中讀寫數據,SocketChannel 通過 TCP 讀寫網路中的數據等等。
Buffer 也有多重類型,比如:ByteBuffer、CharBuffer、IntBuffer等等,光看他們的名字就知道他們代表了不同的數據類型。
2. Selector
我們可以把 Selector 看做是一個管理員,可以管理多個 Channel , Selector 能夠知道到哪個 Channel 已經做好了讀寫的準備。這樣一個線程只要操作這個管理員就可以了,相當於一個線程可以管理多個 Channel;一旦監聽到有準備好的 Channel,就可以進行相應的處理。
不過 Java 原生的 NIO 不好用,直到 Netty 的出現。
五、AIO
非同步非阻塞;因為事情不是自己做,其實也沒有阻塞一說(都是非阻塞);
AIO 是在 NIO 的基礎上,引入非同步通道的概念;NIO 是採用輪詢的方式,不停地詢問數據是否準備好了,準備好了就處理;AIO 是向操作系統註冊 IO 監聽,操作系統完成 IO 操作了之後,主動通知,觸發響應的函數(自己不做,讓操作系統來做)。
目前看,AIO 應該的還不是很廣泛。
看過這篇文章之後,您是否對 BIO、NIO 和 AIO 有了初步的了解呢?如果有任何疑問,可以上學步園進行了解。