Java web客戶端和服務器端交互的原理

其實HTTP客戶端和服務器端的交互原理很簡單:即先是瀏覽器和服務器端建立Socket無狀態連接,也就是短連接,然後通過IO流進行報文信息(這個報文是嚴格遵循HTTP報文接口的)的交互,最後會話結束後就關閉連接。對於這些底層的協議和報文的打包解包交互的實現,其實java和瀏覽器早都已經封裝好了,程序員只要專注於業務邏輯的實現就行。

Java web客戶端和服務器端交互的原理

  1. 協議

a. TCP/IP整體構架概述

TCP/IP協議並不完全符合OSI的七層參考模型。傳統的開放式系統互連參考模型,是一種通信協議的7層抽象的參考模型,其中每一層執行某一特定任務。該模型的目的是使各種硬件在相同的層次上相互通信。這7層是:物理層、數據鏈路層、網路層、傳輸層、話路層、表示層和應用層。而TCP/IP通訊協議採用了4層的層級結構,每一層都呼叫它的下一層所提供的網絡來完成自己的需求。這4層分別爲:

i. 應用層:應用程序間溝通的層,如超文本傳送協議(HTTP)、簡單電子郵件傳輸(SMTP)、文件傳輸協議(FTP)、網絡遠程訪問協議(Telnet)等。

ii. 傳輸層:在此層中,它提供了節點間的數據傳送服務,如傳輸控制協議(TCP)、用戶數據報協議(UDP)等,TCP和UDP給數據包加入傳輸數據並把它傳輸到下一層中,這一層負責傳送數據,並且確定數據已被送達並接收。

iii. 互連網絡層:負責提供基本的數據封包傳送功能,讓每一塊數據包都能夠到達目的主機(但不檢查是否被正確接收),如網際協議(IP)。

iv. 網絡接口層:對實際的網絡媒體的管理,定義如何使用實際網絡(如Ethernet、Serial Line等)來傳送數據。

b. HTTP協議介紹:

i. HTTP是一種超文本傳送協議(HyperText Transfer Protocol),是一套計算機在網絡中通信的一種規則。在TCP/IP體系結構中,HTTP屬於應用層協議,位於TCP/IP協議的頂層

ii. HTTP是一種無狀態的的協議,意思是指 在Web 瀏覽器(客戶端)和 Web 服務器之間不需要建立持久的連接。整個過程就是當一個客戶端向服務器端發送一個請求(request),然後Web服務器返回一個響應 (response),之後連接就關閉了,在服務端此時是沒有保留連接的信息。

iii. HTTP 遵循 請求/響應(request/response) 模型的.,所有的通信交互都被構造在一套請求和響應模型中。

iv. 瀏覽WEB時,瀏覽器通過HTTP協議與WEB服務器交換信息,Web服務器向Web瀏覽器返回的文件都有與之相關的類型,這些信息類型的格式由MIME定義。

c. 協議的java實現方式

不論是TCP/IP協議也好,還是HTTP協議也好,java都是通過套接字(et)來實現的,可以參考我的另一篇技術博客:一個項目看java TCP/IP Socket編程(1.3版)

  2. HTTP報文接口及客戶端和服務器端交互原理

a. HTTP定義的事務處理由以下四步組成:

i. 建立連接:

例如我在瀏覽器裏輸入 ,客戶端請求這個地址時即打開了web服務器HTTP端口的一個套接字。因爲在網絡中間作爲傳遞數據的實體介質就是網線,數據實質上是通過IO流進行輸出和輸入,這就不難理解我們爲什麼在寫一個Servlet的時候要引用 import .*; 的原因 ,包括我們在向客戶端回髮結果的時候要用到PrintWriter對象的println()方法。其實請求的這個地址還要加上端口號80,80可以不寫,是因爲瀏覽器默認的端口號是80。

在Java底層代碼中是這樣實現的,只不過它們已經幫我們做了。

Socket socket = new Socket("",80);

InputStream in = nputStream();

OutputStream out = utputStream();

ii. 客戶端發送HTTP請求報文(request)

一旦建立了TCP連接,Web瀏覽器就會向Web服務器發送請求命令,是一個ASCII文本請求行,後跟0個或多個HTTP頭標,一個空行和實現請求的任意數據。

即報文分四個部分:請求行,請求頭標,空行和請求數據

1)請求行

請求行由三個標記組成:請求方法、請求URL和HTTP版本,中間用空格分開

例如: GET HTTP/1.1

HTTP規範定義了8種可能的請求方法:(最常見的就是 GET 和 POST 兩種方法)

GET -- 檢索URI中標識資源的一個簡單請求

HEAD -- 與GET方法相同,服務器只返回狀態行和頭標,並不返回請求文檔

POST -- 服務器接受被寫入客戶端輸出流中的數據的請求

PUT -- 服務器保存請求數據作爲指定URI新內容的請求

DELETE -- 服務器刪除URI中命名的資源的請求

OPTIONS -- 關於服務器支持的請求方法信息的請求

TRACE -- Web服務器反饋Http請求和其頭標的請求

CONNECT -- 已文檔化但當前未實現的一個方法,預留做隧道處理

2)請求頭標

請求頭標:由key :value 健值組成,每行一對。請求頭標用來通知服務器有關客戶端的功能和標識。

HOST -- 請求的哪一個服務器端地址,主地址,比如:我的技術blog:

User-Agent -- 用戶即客戶端可以使用的瀏覽器 ,如: Mozilla/4.0

Accept -- 即客戶端可以接受的MIME 類型列表,如image/gif、text/html、application/msword

Content-Length -- 只適用於POST請求,以字節給出POST數據的尺寸

3)空行

發送回車符和退行,通知服務器以下不再有頭標。

4)請求數據

使用POST傳送數據,最常使用的是Content-Type和Content-Length頭標。

請求報文總結:

我們可以這樣寫出一個標準的 HTTP請求:

POST /blog/242842 HTTP1.1

HOST:

User-Agent: Mozilla/4.0

Accpt: image/gif,text/html,application/pdf,image/png...

key=value&key=value&key=value...... (POST()請求的數據)

這上面的一個例子意思是:

我要去訪問的服務器端的地址是 它下面的資源 /blog/242842

連起來就是:

這個頁面用的是 HTTP1.1 規範,我的瀏覽器版本是Mozilla/4.0

可以支持的MIME格式爲 image/gif,text/html,application/pdf,image/png...等等

這個MIME格式我們在servlet中寫法是:ontentType("text/html;charset=gb2312");

或者在jsp中寫法是:

或者在html中寫法是:

GET 和 POST 最直觀的區別就是:GET方法將數據的請求跟在了所請求的URL後面,也就是在請求行裏面我們是這麼樣來做的:

GET /blog/242842?key=value&key=value&key=1.1

實際上用 GET 是這樣傳遞數據的:

iii.服務器端響應請求生成結果並回發(response)

Web 服務器解析請求,定位指定的資源

1)根據請求時的 GET/POST 對應的用servlet裏的 doGet() / doPost()方法來處理(有可能是一些業務邏輯,也有可能是一些驗證等等,也有可能是一些數據查詢,提交等等)其有效的數據就來源於key=value&key=value&key=value......,以及其它的一些封裝在 request 對象中的數據資源。

2)處理請求之後,由 response 對象得到 tWriter 輸出流對象out,通過 tln(); 將數據以指定的格式,如按照ontentType("text/html;charset=gb2312");的格式輸出到輸出流。

它的響應報文與請求報文非常類似,其區別就在於:我們在請求階段的請求行被狀態行給替換了,再來看響應報文:

3)一個響應報文由四個部分組成:狀態行、響應頭標、空行、響應數據:

(a).狀態行:

狀態行由三個標記組成:HTTP版本、響應代碼和響應描述。

HTTP1.1 --- 100 --- continue //繼續追加後繼內容

HTTP1.1 --- 200 --- OK //一切正常

HTTP1.1 --- 301 --- Moved Permanently //請求的文檔在其它地方,會自動連接

HTTP1.1 --- 403 --- Forbidden //絕對拒絕你訪問這個資源,不管授權沒有

HTTP1.1 --- 400 --- Bad Request //客戶端請求中的不良語法

HTTP1.1 --- 404 --- Not Found //最常見,絕對是大名鼎鼎的找不到

HTTP響應碼:

1xx:提示性信息,告訴客戶端應該對某些其它的動作作出響應

2xx:這些就代表了請求成功

3xx:重定向,爲了完成請求,必須進一步執行的動作

4xx:客戶端錯誤

500-599: 服務器端的錯誤

(b).響應頭標:像請求頭標一樣,它們指出服務器的功能,標識出響應數據的細節。

Date: Sat, 31 Dec 2005 23:59:59 GMT --響應生成的日期和時間

ContentType: 'text/html;charset=gb2312'

Content-Length: 122 --響應中的字節數,只在瀏覽器使用永久(Keep-alive)HTTP連接時需要。

(c).空行:最後一個響應頭標之後是一個空行,發送回車符和退行,表明服務器以下不再有頭標。

(d).響應數據:HTML文檔和圖像等,也就是HTML本身。tln("......");寫到客戶端。

iv. 服務器端關閉連接,客戶端解析回發響應報文,恢復頁面

1)瀏覽器先解析狀態行,查看請求是否成功的狀態代碼--HTTP響應碼:404 400 200 ....

2)解析每一個響應頭標,如:

ContentType: text/html;charset=gb2312

Content-Length: 122 --- 響應中的字節數,只在瀏覽器使用永久(Keep-alive)HTTP連接時需要。

3)讀取響應數據HTML,根據標籤中的內容恢復標準的HTML格式頁面或者其它。

4)一個HTML 文檔可能包含其它的需要被載入的資源,瀏覽器會識別,並對這些資源再進行額外的請求,這個過程可以是循環的方式一直到所有的數據都按照響應頭標中規定的格式恢復到頁面中。

5)數據傳送完畢,服務器端關閉連接,即無狀態協議。