網絡與路由器故障診斷的基礎知識

計算機網絡是由計算機集合加通信設施組成的系統,即利用各種通信手段,把地理上分散的計算機連在一起,達到相互通信而且共享軟件、硬件和數據等資源的系統。計算機網絡按其計算機分佈範圍通常被分爲局域網和廣域網。局域網覆蓋地理範圍較小,一般在數米到數十公里之間。廣域網覆蓋地理範圍較大,如校園、城市之間、乃至全球。計算機網絡的發展,導致網絡之間各種形式的連接。採用統一協議實現不同網絡的互連,使互聯網絡很容易得到擴展。因特網就是用這種方式完成網絡之間聯結的網絡。因特網採用TCP/IP協議作爲通信協議,將世界範圍內計算機網絡連接在一起,成爲當今世界最大的和最流行的國際性網絡。

網絡與路由器故障診斷的基礎知識

爲了完成計算機間的通信,把每部計算機互連的功能劃分成定義明確的層次,規定了同層進程通信的協議及相鄰層之間的接口和服務,將這些層、同層進程通信的協議及相鄰層之間的接口統稱爲網絡體系結構。國際標準化組織(ISO)提出的開放系統互連參考模型(OSI)是當代計算機網絡技術體系的核心。該模型將網絡功能劃分爲7個層次:物理層、數據鏈路層、網絡層、傳輸層、會話層、表示層和應用層。

TCP/IP即傳輸控制協議和網間互聯協議是一組網絡協議。TCP/IP起源於美國ARPANET網,發展至今已成爲因特網使用的標準通信協議。使用TCP/IP能夠使採用不同操作系統的計算機以有序的方式交換數據。

路由器是一種網絡設備,是用於網絡連接、執行路由選擇任務的專用計算機。路由器工作於網絡層,對信包轉發,並具有過濾功能。路由器能夠將使用不同技術的兩個網絡互連起來,能夠在多種類型的網絡之間(局域網或廣域網)建立網絡連接。它將處在七層模型中的網絡層的信息,根據最快、最直接的路由原理從一個網絡的網絡層傳輸到另一個網絡的網絡層,以達到最佳路由選擇。同時在內部使用高檔微處理器,用高速的內部總線連接適合各種網絡協議的接口卡。並具有多種網管功能,能監視與路由器相連接的一些網絡設備和它們的配置運行情況。

CISCO路由器是目前網絡建設中使用最多的一種路由器,有多種檔次、多種系列,目前常用的當屬2500系列,本文以2500系列爲例討論。2500系列路由器是固定接口的多協議路由器,支持CISCO IOS全部功能。根據特定的協議環境分爲以下四種類型:固定配置的路由器(2501)、帶HUB口的路由器(2507)、摸塊化的路由器(2514)和訪問服務器(2511)。它們結構簡單、操作方便、易於配置和管理,是一種用於小規模局域網和廣域網網絡層中繼的路由設備。

CISCO IOS是CISCO所特有的互連網操作系統,所有的CISCO產品都運行IOS,IOS將它們無縫連接在一起協同工作。給用戶提供一個可支持任意硬件界面、任意鏈路層、網絡層協議的可擴展的開放型網絡。IOS支持衆多的協議,包括各種網絡通信協議和路由協議等。CISCO IOS已成爲工業界網際網互聯的事實標準。CISCO IOS提供幾種不同的操作模式,每一種模式提供一組相關的命令集、不同的操作權限和操作功能。基於安全目的,CISCO用戶界面中有兩級訪問權限:用戶級和特權級。第一級訪問允許查看路由狀態,叫做用戶EXEC模式,又稱爲查看模式;第二級訪問允許查看路由器配置、修改配置和運行調試命令,叫做特權EXEC模式,又稱爲配置模式。在特權級中,按不同的配置內容,可進入不同的配置模式,如全球配置模式、接口配置模式、線配置模式等。 網絡故障診斷應該實現三方面的目的:確定網絡的故障點,恢復網絡的正常運行;發現網絡規劃和配置中欠佳之處,改善和優化網絡的性能;觀察網絡的運行狀況,及時預測網絡通信質量。

網絡故障診斷以網絡原理、網絡配置和網絡運行的知識爲基礎。從故障現象出發,以網絡診斷工具爲手段獲取診斷信息,確定網絡故障點,查找問題的根源,排除故障,恢復網絡正常運行。

網絡故障通常有以下幾種可能:物理層中物理設備相互連接失敗或者硬件及線路本身的問題;數據鏈路層的網絡設備的接口配置問題;網絡層網絡協議配置或操作錯誤;傳輸層的設備性能或通信擁塞問題;上三層CISCO IOS或網絡應用程序錯誤。診斷網絡故障的過程應該沿着OSI七層模型從物理層開始向上進行。首先檢查物理層,然後檢查數據鏈路層,以此類推,設法確定通信失敗的故障點,直到系統通信正常爲止。

網絡診斷可以使用包括局域網或廣域網分析儀在內的多種工具:

路由器診斷命令;網絡管理工具和其它故障診斷工具。CISCO提供的工具足以勝任排除絕大多數網絡故障。查看路由表,是解決網絡故障開始的好地方。

ICMP的ping、trace命令和Cisco的show命令、debug命令是獲取故障診斷有用信息的網絡工具。我們通常使用一個或多個命令收集相應的信息,在給定情況下,確定使用什麼命令獲取所需要的信息。譬如,通過IP協議來測定設備是否可達到的常用方法是使用ping命令。ping從源點向目標發出ICMP信息包,如果成功的話,返回的ping信息包就證實從源點到目標之間所有物理層、數據鏈路層和網絡層的功能都運行正常。

如何在互聯網絡運行後瞭解它的信息,瞭解網絡是否正常運行,監視和了解網絡在正常條件下運行細節,瞭解出現故障的情況。監視那些內容呢?利用show interface命令可以非常容易地獲得待檢查的每個接口的信息。另外show buffer命令提供定期顯示緩衝區大小、用途及使用狀況等。Show proc命令和 show proc mem命令可用於跟蹤處理器和內存的使用情況,可以定期收集這些數據,在故障出現時,用於診斷參考。

網絡故障以某種症狀表現出來,故障症狀包括一般性的(象用戶不能接入某個服務器)和較特殊的(如路由器不在路由表中)。對每一個症狀使用特定的故障診斷工具和方法都能查找出一個或多個故障原因。一般故障排除模式如下:

第一步,當分析網絡故障時,首先要清楚故障現象。應該詳細說明故障的症侯和潛在的原因。爲此,要確定故障的具體現象,然後確定造成這種故障現象的原因的類型。例如,主機不響應客戶請求服務。可能的故障原因是主機配置問題、接口卡故障或路由器配置命令丟失等。

第二步,收集需要的用於幫助隔離可能故障原因的信息。向用戶、網絡管理員、管理者和其他關鍵人物提一些和故障有關的問題。廣泛的從網絡管理系統、協議分析跟蹤、路由器診斷命令的輸出報告或軟件說明書中收集有用的信息。

第三步,根據收集到的情況考慮可能的故障原因。可以根據有關情況排除某些故障原因。例如,根據某些資料可以排除硬件故障,把注意力放軟件原因上。對於任何機會都應該設法減少可能的故障原因,以至於儘快的策劃出有效的故障診斷計劃。

第四步,根據最後的.可能的故障原因,建立一個診斷計劃。開始僅用一個最可能的故障原因進行診斷活動,這樣可以容易恢復到故障的原始狀態。如果一次同時考慮一個以上的故障原因,試圖返回故障原始狀態就困難的多了。

第五步,執行診斷計劃,認真做好每一步測試和觀察,直到故障症狀消失。

第六步,每改變一個參數都要確認其結果。分析結果確定問題是否解決,如果沒有解決,繼續下去,直到解決。

1. 物理層及其診斷

物理層是OSI分層結構體系中最基礎的一層,它建立在通信媒體的基礎上,實現系統和通信媒體的物理接口,爲數據鏈路實體之間進行透明傳輸,爲建立、保持和拆除計算機和網絡之間的物理連接提供服務。

物理層的故障主要表現在設備的物理連接方式是否恰當;連接電纜是否正確;MODEM、CSU/DSU等設備的配置及操作是否正確。

確定路由器端口物理連接是否完好的最佳方法是使用show interface命令,檢查每個端口的狀態,解釋屏幕輸出信息,查看端口狀態、協議建立狀態和EIA狀態。

  2. 數據鏈路層及其診斷

數據鏈路層的主要任務是使網絡層無須瞭解物理層的特徵而獲得可靠的傳輸。數據鏈路層爲通過鏈路層的數據進行打包和解包、差錯檢測和一定的校正能力,並協調共享介質。在數據鏈路層交換數據之前,協議關注的是形成幀和同步設備。

查找和排除數據鏈路層的故障,需要查看路由器的配置,檢查連接端口的共享同一數據鏈路層的封裝情況。每對接口要和與其通信的其他設備有相同的封裝。通過查看路由器的配置檢查其封裝,或者使用show命令查看相應接口的封裝情況。

  3. 網絡層及其診斷

  網絡層提供建立、保持和釋放網絡層連接的手段,包括路由選擇、流量控制、傳輸確認、中斷、差錯及故障恢復等。

  排除網絡層故障的基本方法是:沿着從源到目標的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現,應該通過檢查來確定是否已經輸入適當的靜態路由、默認路由或者動態路由。然後手工配置一些丟失的路由,或者排除一些動態路由選擇過程的故障,包括RIP或者IGRP路由協議出現的故障。例如,對於IGRP路由選擇信息只在同一自治系統號(AS)的系統之間交換數據,查看路由器配置的自治系統號的匹配情況。路由器接口故障排除

  1. 串口故障排除

串口出現連通性問題時,爲了排除串口故障,一般是從show interface serial命令開始,分析它的屏幕輸出報告內容,找出問題之所在。串口報告的開始提供了該接口狀態和線路協議狀態。接口和線路協議的可能組合有以下幾種:1)串口運行、線路協議運行,這是完全的工作條件。該串口和線路協議已經初始化,並正在交換協議的存活信息。2)串口運行、線路協議關閉,這個顯示說明路由器與提供載波檢測信號的設備連接,表明載波信號出現在本地和遠程的調制解調器之間,但沒有正確交換連接兩端的協議存活信息。可能的故障發生在路由器配置問題、調制解調器操作問題、租用線路干擾或遠程路由器故障,數字式調制解調器的時鐘問題,通過鏈路連接的兩個串口不在同一子網上,都會出現這個報告。3)串口和線路協議都關閉,可能是電信部門的線路故障、電纜故障或者是調制解調器故障。4)串口管理性關閉和線路協議關閉,這種情況是在接口配置中輸入了shutdown命令。通過輸入no shutdown命令,打開管理性關閉。

接口和線路協議都運行的狀況下,雖然串口鏈路的基本通信建立起來了,但仍然可能由於信息包丟失和信息包錯誤時會出現許多潛在的故障問題。正常通信時接口輸入或輸出信息包不應該丟失,或者丟失的量非常小,而且不會增加。如果信息包丟失有規律性增加,表明通過該接口傳輸的通信量超過接口所能處理的通信量。解決的辦法是增加線路容量。查找其他原因發生的信息包丟失,查看show interface serial命令的輸出報告中的輸入輸出保持隊列的狀態。當發現保持隊列中信息包數量達到了信息的最大允許值,可以增加保持隊列設置的大小。

  2.以太接口故障排除

以太接口的典型故障問題是:帶寬的過分利用;碰撞衝突次數頻繁;使用不兼容的幀類型。使用show interface ethernet命令可以查看該接口的吞吐量、碰橦衝突、信息包丟失、和幀類型的有關內容等。

通過查看接口的吞吐量可以檢測網絡的利用。如果網絡廣播信息包的百分比很高,網絡性能開始下降。光纖網轉換到以太網段的信息包可能會淹沒以太口。互聯網發生這種情況可以採用優化接口的措施,即在以太接口使用no ip route-cache命令,禁用快速轉換,並且調整緩衝區和保持隊列。

兩個接口試圖同時傳輸信息包到以太電纜上時,將發生碰橦。以太網要求衝突次數很少,不同的網絡要求是不同的,一般情況發現衝突每秒有3、5次就應該查找衝突的原因了。碰橦衝突產生擁塞,碰橦衝突的原因通常是由於敷設的電纜過長、過分利用、或者“聾”節點。以太網絡在物理設計和敷設電纜系統管理方面應有所考慮,超規範敷設電纜可能引起更多的衝突發生。

如果接口和線路協議報告運行狀態,並且節點的物理連接都完好,可是不能通信。引起問題的原因也可能是兩個節點使用了不兼容的幀類型。解決問題的辦法是重新配置使用相同幀類型。如果要求使用不同幀類型的同一網絡的兩個設備互相通信,可以在路由器接口使用子接口,併爲每個子接口指定不同的封裝類型。

  3. 異步通信口故障排除

互連網絡的運行中,異步通信口的任務是爲用戶提供可靠服務,但又是故障多發部位。主要的問題是,在通過異步鏈路傳輸基於LAN通信量時,將丟失的信息包的量降止最少。

異步通信口故障一般的外部因素是:撥號鏈路性能低劣;電話網交換機的連接質量問題;調制解調器的設置。檢查鏈路兩端使用的調制解調器:連接到遠程PC機端口調制解調器的問題不太多,因爲每次生成新的撥號時通常都初始化調制解調器,利用大多數通信程序都能在發出撥號命令之前發送適當的設置字符串;連接路由器端口的問題較多,這個調制解調器通常等待來自遠程調制解調器的連接,連接之前,並不接收設置字符串。如果調制解調器丟失了它的設置,應採用一種方法來初始化遠程調制解調器。簡單的辦法是使用可通過前面板配置的調制解調器,另一種方法是將調制解調器接到路由器的異步接口,建立反向telnet,發送設置命令配置調制解調器。

show interface async 命令、show line命令是診斷異步通信口故障使用最多的工具。show interface async 命令輸出報告中,接口狀態報告關閉的唯一的情況是接口沒有設置封裝類型。線路協議狀態顯示與串口線路協議顯示相同。show line命令顯示接口接收和傳輸速度設置以及EIA狀態顯示。show line命令可以認爲是接口命令(show interface async)的擴展。show line命令輸出的EIA信號及網絡狀態:

noCTS noDSR DTR RTS:調制解調器未與異步接口連接。

CTS noDSR DTR RTS:調制解調器與異步接口連接正常,但未連接遠程調制解調器。

CTS DSR DTR RTS:遠程調制解調器撥號進入並建立連接。

確定異步通信口故障一般可用下列步驟:檢查電纜線路質量;檢查調制解調器的參數設置;檢查調制解調器的連接速度;檢查rxspeed 和txspeed是否與調制解調器的配置匹配;通過show interface async 命令和 show line命令查看端口的通信狀況;從show line命令的報告檢查EIA狀態顯示;檢查接口封裝;檢查信息包丟失及緩衝區丟失情況。

  結語

網絡發生故障是不可避免的。網絡建成運行後,網絡故障診斷是網絡管理的重要技術工作。搞好網絡的運行管理和故障診斷工作,提高故障診斷水平需要注意以下幾方面的問題:認真學習有關網絡技術理論;清楚網絡的結構設計,包括網絡拓樸、設備連接、系統參數設置及軟件使用;瞭解網絡正常運行狀況、注意收集網絡正常運行時的各種狀態和報告輸出參數;熟悉常用的診斷工具,準確的描述故障現象