2018最新有關路由器系統故障問題解決技巧論文
2018最新有關路由器系統故障問題解決技巧論文
路由器是連線因特網中各區域網、廣域網的裝置,它會根據通道的情況自動選擇和設定路由,以最佳路徑,按前後順序傳送訊號。以下是小編收集的路由器系統故障問題解決技巧論文,歡迎檢視!
有關路由器系統故障問題解決技巧論文1
在區域網剛剛組建的一段時間內,網路執行狀態往往都比較穩定,這是因為網路裝置都是新的,網路應用也比較少;可是執行時間長了之後,區域網中出現的網路故障就比較多了,例如Web站點不能瀏覽了,物理連線掉線了,網路連線速度變慢了,上網效能不穩定了等等。其中,一些網路故障由於具有特別明顯的現象,排查、解決起來往往比較輕鬆;但是也有一些網路故障卻非常奇怪,明明ping測試一切正常,可是網路傳輸速度異常緩慢,對於這類特殊的故障現象,我們必須要多點出發、全面排查,才能定位故障原因、解決故障現象。這不,筆者曾經遭遇一則上網不穩定的故障現象,經過多點、全面地排查,竟然發現該故障是由於路由器記憶體容量不足引起的,由於這種故障因素很少出現,在排查該故障的過程中很容易多走彎路,現在本文就將該故障的排除過程還原出來,供各位朋友參考交流!
案發現場
筆者單位的一個下屬公司,共包含技術部、工程部、業務部、銷售部這幾個部門,每個部門大約有20臺左右的普通計算機,這些計算機全部透過各自部門的BayNet品牌的普通交換機連線到區域網的CISCO路由器中,每個部門都擁有自己獨立的工作子網,它們相互之間不能互相訪問,普通計算機只能在相同的工作子網中進行共享、交流;但是,單位的檔案伺服器、列印伺服器、Web伺服器等,都是直接連線到路由器埠上的,所有部門的計算機都可以直接訪問,並且它們還能透過路由器訪問Internet網路。為了保證區域網網路的執行安全,下屬公司的網路管理員還在路由器與Internet網路之間,架設了天融信硬體防火牆,來對整個單位的網路訪問行為進行安全控制與監視。
平時,各個部門的普通計算機都能正常上網,並且這些計算機在各個部門的內網中,都能互相進行共享、交流訪問;同時,由於工作需要,各個部門的上網使用者幾乎每天都要訪問公司的Web伺服器,從中查詢、下載公司的一些內部資訊。可是,最近一段時間,網路管理員發現各個部門的使用者在訪問Web伺服器或Internet網路時,經常會出現上網不穩定的現象,也就是說有時候上網速度很快,有的時候上網速度很慢,甚至還會出現一會兒能上網,一會兒不能上網的故障現象。
排查故障
由於這種故障現象存在於各個部門,網路管理員估計這種現象多半與普通客戶端系統自身的設定沒有任何關係,那究竟有哪些因素會影響整個區域網的上網穩定性呢?網路管理員對故障現象再次進行了琢磨分析,認為該故障發生時幾乎沒有什麼規律可遵循,上網有快有慢,網路有時能上有時不能上,這種無規律的故障現象很有可能是區域網中的網路病毒引起的,事實上許多由病毒造成的網路故障就是表現得如此沒有規律。如果確認網路病毒的確是造成上網不穩定故障因素的話,那麼網路病毒很可能造成了網路中某些重要通訊埠資料流量的異常;依照這樣的分析,網路管理員決定先用超級終端程式登入進入區域網路由器後臺系統,然後利用該系統自帶的掃描診斷功能,發現區域網中各個交換埠的資料流量並不是很大,這說明網路病毒並沒有造成重要埠資料傳輸發生瓶頸現象。雖然如此,網路管理員還是有點不放心,要求各個部門的工作人員,立即登入到區域網中的網路病毒防禦伺服器,安裝更新網路防毒軟體,並利用它對自己部門的計算機系統進行一次病毒查殺操作,可是這樣的努力沒有取得任何效果,看來區域網上網不穩定的故障現象與網路病毒無關。
考慮到網路管理員先前已經掃描過各個交換埠的流量情況,並沒有看到有異常情況,這說明區域網中並不存在重要資料埠瓶頸現象,也就是說上網不穩定故障現象與埠瓶頸因素也沒有關係。同時,重要交換埠的資料流量大小正常,也反映了局域網中不存在廣播風暴或者網路環路現象,因為這些現象要是存在的話,我們應該能夠看到重要交換埠的輸出廣播包大小應該不斷增加才對,可事實卻沒有,這就意味著上網不穩定故障不是由網路廣播風暴或網路環路現象引起的。
在初步排除了埠瓶頸因素、網路環路因素、廣播風暴因素以及網路病毒因素後,網路故障還是不能消除,這讓網路管理員萬分的懊惱。以前提到上網不穩定故障,網路管理員可能會下意識地認為是網路連線不牢靠的因素,可是現在他怎麼也不會懷疑到網路連線因素上,因為這種上網不穩定的故障幾乎在各個部門的工作子網中都會出現,如果真的是網路連線不牢靠的話,那也不可能區域網中所有計算機都同時出現不牢靠現象吧。
有沒有可能是網路裝置自身效能不穩定,造成了上網不穩定現象呢?聯想到夏天的時候,一些裝置由於散熱不好,造成自身工作效能下降,經常出現上網掉線或速度緩慢現象,為此網路管理員推斷可能是區域網中的路由器或交換機過熱,造成自身工作效能不穩定。於是,網路管理員立即來到公司機房,先是觀察了路由器、交換機的訊號燈狀態,發現一切正常,之後用手觸控這些裝置的表面溫度時,也沒有覺察到有什麼異常現象。
在萬般無奈的情況下,網路管理員決定登入進入區域網的防火牆系統,檢視其中的一些執行狀態資訊,看看有沒有什麼值得懷疑的地方。讓他感到非常意外的事情出現了,網路管理員看到區域網防火牆竟然記錄了許多IP地址為0.0.0.0主機的通訊痕跡,那0.0.0.0究竟是什麼樣的'主機地址呢?經過上網搜尋,網路管理員發現該地址是Windows系統對所有未知IP的地址描述,包括網絡卡裝置透過dhcp方式取得的地址,pppoe的IP地址,以及其它非本機指定的IP地址;此外,0.0.0.0地址也代表全零網路,它能幫助路由器傳送路由表中無法查詢的包。如果設定了全零網路的路由,路由表中無法查詢的包都將送到全零網路的路由中去。 透過上面的描述,網路管理員認為該地址其實就是一個不存在的地址,那麼究竟是什麼因素讓外網不停地與區域網中一個根本不存在的主機進行通訊呢?如果真的是外網與0.0.0.0地址不斷進行通訊的話,那麼外網的資料包是如何進入到區域網中的呢,因為單位區域網中的防火牆已經被設定,阻止那些使用明顯虛假地址的主機進行通訊的?
解決故障
經過進一步檢視防火牆記錄,網路管理員看到0.0.0.0地址沒有進行任何通訊操作,難道它們真的被防火牆攔截了?會不會是區域網遭到了非法攻擊,攻擊包在進入內網之後,將其IP地址喬裝成0.0.0.0地址了呢?可事實情況是,那個IP地址為0.0.0.0的主機沒有進行任何通訊操作,那麼非法攻擊包即使在嘗試攻擊內網,也沒有成功,如此一來它也不會造成上網不穩定的現象;為此,網路管理員斷定不存在外網攻擊的事情,那個0.0.0.0地址肯定來自區域網內部,那麼這個不可能的IP地址究竟是怎麼產生的呢?再次上網諮詢相關資訊,網路管理員發現一些重要網路裝置的記憶體容量不夠時,可能會在通訊過程中丟棄一些資料包資訊,造成某些上網內容無法有效組合在一起,此時就容易產生一些0.0.0.0地址。
依照上述理論分析,網路管理員推斷0.0.0.0地址很可能來自內網,並且該地址很可能是由於區域網中的交換機或路由器記憶體容量不夠引起的。由於上網不穩定故障在各個部門都存在,網路管理員估計問題多半出在與個工作子網都有關的路由器裝置上,於是這一次準備透過遠端連線方式登入進入區域網路由器後臺系統,在遠端登入過程中,網路管理員感覺到登入速度明顯遲鈍,看來路由器裝置真的出現問題了。之後,他使用Console控制線直接連線到路由器後臺系統,檢視其記憶體的使用狀態時,發現該裝置的記憶體容量確實不足了,很明顯在上網高峰期間,路由器的記憶體容量就更顯不足了,如此一來路由器自然就無法正常轉發資料資訊了,這也正是各個部門上網不穩定的原因。
找到了故障原因後,網路管理員立即重新啟動了一次路由器系統,發現各個部門的上網狀態立即又恢復正常了,此時再次監控路由器的記憶體容量時,發現該記憶體佔用率也在不斷變大,看來要真正解決問題,還得需要升級路由器裝置,要不然過一段時間,又要重新啟動路由器系統了。
有關路由器系統故障問題解決技巧論文2
關鍵字:路由器
對於網路管理員來說,熟悉與掌握路由排錯的思路和技巧是非常必要的。小編將透過三例典型的路由故障排錯案例進行分析。
案例1 不堪重負,路由器外網口關閉
1、網路環境
某單位使用的是Cisco路由器,租用電信30MB做本地接入和l0MB教育網雙線路上網,兩年來網路執行穩定,路由器也沒有發生故障。隨著網路使用者數量增加,原來電信30MB已不能滿足需要,於是決定租用電信100MB來解決頻寬問題。電信採用光纖接入到單位機房後,使用百兆光電轉換器經轉換後透過雙絞線接到路由器外網口上面,該路由器使用是千兆電口作為外網口,由於光電轉換器只有100MB,該埠連線後速度顯示100MB。
2、外網埠流量為零
經過幾天的執行,管理員發現每天當路由器外網口流量超過50Mbps/s後,該埠就會出現“Receive Errors” ,流量超大,錯誤資訊很多。突然有一天,出現外網不能上了,Telnet到路由器上面,發現電信對應的外網口沒有流量,顯示狀態為UP,路由器上其他埠工作正常。第一反映是電信的那邊出現問題了,是電話通知電信那邊查檢一下,對方很快回應說沒有什麼問題,並詢問是否光電轉換器宕機了。
於是管理員將光電轉換器重啟後,故障依然。沒有辦法,只好將路由器重啟一下,故障排除。誰知,過了不到一個小時,故障又重現。Telnet到路由器後將該外網口執行shutdown和undo shutdown後,故障排除。誰知,將所有有關病毒的安全策略應用到該埠,將tcp mss修改為2o48(廠商預設1460),故障依然出現。
3、故障分析
管理員發現在故障發生時,CPU顯示23%,Memory為33%,不算太高,關鍵是其他介面都正常工作,看樣子問題還是出現在這個埠上面。可這個埠已用了兩年了,升級擴容以前沒有出現埠不能正常通訊的情況,埠硬體應該是有什麼問題。
透過網管軟體對埠關閉前的流量檢測,發現該埠關閉前有很大的流量透過(超過80Mbps/s) ,顯示埠的錯誤資訊也比較多。透過分析得知應該是網路流量太大,利用率過高所致。
流量超過80%後,造成埠不能正常。如果該埠能工作千兆模式下,100MB頻寬僅利用該埠10%,這樣埠可以輕鬆處理。
4、解決方案
在找到癥結後,推薦的解決方案是購買千兆光電轉換器代替原來的百兆裝置,而且價格也比較便宜。但為了保證網路執行的穩定性,該單位決定直接購買一個千兆光口路由模組,直接利用光纖進行通訊,減少網路延時。電信則透過埠限速來控制保證提供百兆頻寬。透過一段時間執行,發現該埠除了有少量錯誤資訊外,再沒有出現過埠無故關閉情況。
案例2 路由器為何發包失敗
在路由器的配置過程中,經常會碰到這樣的問題:網路通訊正常,路由器可以成功路由資料包到目標網路,但是從路由器發的資料包卻傳送失敗,故障表現為路由器ping目標網路失敗,下面就是一個典型的案例。
(1)現象描述
某單位的網路配置完成後,管理員在測試網路連通性時發現:從PC機(6.159.245.195) 向目標網路(6.159.245.65/26)傳送Ping時,路由器R1可以成功轉發資料包,然而從R1向目標網路(6.159.245.65/26) 傳送ping時,出現ping失敗。
(2)排錯過程
首先,跟蹤ping所經過的路徑。檢查R1的路由表,目標地址6.159.245.65可以與路由表中0.0.0.0/0相匹配。檢查R2、R3、R4的路由表,均可以發現與目標地址匹配的路由表項。
然後,跟蹤ICMP回應應答資料包所經過的路徑。為完成這一步驟,要明確回應資料包的源地址,PC傳送ping時,回應應答資料包的目標地址就是6.159.245.195。而路由器R1傳送ping時,回應應答資料包的目標地址就是71.170.0.146。
對照R4的路由表,發現與 6.159.245.195匹配的路由表項,而未發現與目標地址71.170.0.146相匹配的路由表項。
看來,ICMP的回應應答資料包在R4處理時被丟棄了,所以從R1向目標網路R4(6.159.245.65/26) 傳送ping時,出現pmg失敗。
解決辦法是:在路由器R4上增加一條指向71.170.0.144/30的靜態路由,下一跳的地址為71.170.0.214。完成後,在R1向R4傳送ping時,發現一切正常了。
此類網路故障儘管不會影響網路的正常通訊,排除的過程也很簡單,但網路故障的分析與排除時,我們要考慮完整的通訊過程。
案例3 艱難的Cisco路由器IOS升級之旅
某學校從2003年開始建設校園網,近年來上網人數不斷增加,使原來的Cisco 2621已經遠遠不能滿足網路的需求。而且最近要上0A辦公系統,需要增加一臺VPN裝置,用於校外使用者對校內0A系統的訪問。
出於經濟上的考慮,他們想透過升級閒置的Cisco 2621路由器來做VPN。不過,在升級IOS的過程中遇到一些問題。
1、超級終端登入出現亂碼
從機房的倉庫裡拿出路由器,通電。透過Console口連上去,發現超級螢幕出現了一些亂碼。會不會是Consol口壞了?分析認為Cisco裝置如果出現Console口壞了,一般會在超級終端螢幕上不斷輸出很多的亂碼。
但是這回出現的卻是輸入回車鍵後,才在螢幕上出現亂碼,可能是每秒傳輸速率不對。
管理員將預設值9600更換為l15200。路由器啟動成功。路由器啟動完後,用show run確實發現Console的速率為l15200。
2、記憶體不夠升級失敗
要升級的這臺Cisco2621路由器帶有VPN的功能。原來的IOS版本為C2600-i-mz.122-8.T4.bin。從網上得知 Cisco 2621只有K8、K9系列的IOS才能支援VPN。於是管理員從網上下載新的IOS c2600-ik9o3s3-mz.123-22.bin,大小為15MB。升級過程如下:
(1)配置路由器Interfast 0/0的IP地址,先用“copy flash:tftp”把原來的IOS備份出來,並透過“copy tftpd flash” 命令上傳。
(2)重新啟動路由器,發現如下的提示錯誤,大意是沒有足夠的記憶體執行IOS:
Error:memory requirements exceed available memory Memory required:0x0284A0BC
在Cisco官方網上查詢,發現c2600-ik9o3s3-mz.123-22.bin這個10s映象要求路由器的記憶體為 64MB,Flash為16MB。從上面的啟動資訊可以看出,這臺路由器的記憶體為32MB,當然啟動不起來了。後來在網上購買了一條l28MB的記憶體換上去,加大記憶體後,啟動路由器成功。
3、在ROM模式下透過TFTP上傳IOS效驗失敗
由於路由器IOS升級失敗,所以想恢復原來的IOS。Cisco IOS升級失敗後,恢復IOS的方式有兩種:FTP和Xmodem。TFTP的傳輸速度快一些,Xmodem的傳輸速度比較慢。在R0M模式下,用TFTP上傳IOS,過程如下:
(1)在interfast 0/0配置IP地址,配置完後用set命令檢視。預設情況下,在R0M模式下配置的IP地址是在interfast 0/0下的,所配置的IP地址應該要與TFTP伺服器在同一個網段內。
(2)用tftpdnld方式下載,TFTP ServerMg開始時用Cisco的TFTP,但傳輸一半就超時。用3Cdaemon傳輸完後,發現如下的警告:
TFTP flash C0PY:Warning,ChecksSum comparison failed.
重啟路由器,路由器無法啟動,提示IOS效驗錯誤。原想可能是IOS下載時出現錯誤,但是重新下載了c2600-ipbase-mz.123-6c.bin還是不行,看來不是IOS的問題。後來更換了網線TFTP軟體還是不行。
解決辦法:用Xmodem來傳。為了使傳輸速度快點,我們應該修改Xmodem的傳輸速度為ll5200。IOS透過Xmodem傳輸完後,重啟路由器,路由器已經可啟動。
4、經驗總結
(1)在用TFTP上傳IOS時,如果提示效驗錯誤,就應該考慮採用Xmodem方式上傳。
(2)TFTP伺服器的IP的地址要和路由器的乙太網口在一個網段上。
(3)在用Xmodem上傳IOS時,最好採用Windows自帶的超級終端。
(4)TFTP (Trivial File Transfer Protoco1)檔案傳輸協議最大就支援傳輸32MB的檔案。如果IOS大於32MB時,可以考慮採用第三方的TFTP軟體,如3Cdaemon。還有一種辦法就是可以採用FTP傳輸命令。
總結:
路由器故障紛繁複雜,排錯方法也不盡相同,但排錯思路和技巧還是有共同之處。遭遇路由故障,冷靜分析、大膽實踐、善於總結,這樣才會提高排錯能力。