關於硬盤故障的分析與排除方法總結

硬盤故障分析與排除

關於硬盤故障的分析與排除方法總結

在實際工作中,硬盤並不是經常出現問題的配件,正常使用中的硬盤一般能夠保持五年的工作時間。而大部分的硬盤故障都是由於出現壞道所引起的,解決的方法是利用特殊的軟件查找出硬盤的壞道並將期隱藏屏蔽。很多情況下檢查出的機器硬盤故障,往往是由於設置不正確或其它的因素所造成的,這裏筆者爲大家介紹兩例比較常見的硬盤故障及排除方法。

一、都是數據線惹的禍接觸不良導致無法識別硬盤故障排除實例

故障現象:學校網絡教室的一臺學生用機,近期經常出現不能開機或開機後提示找不到硬盤的情況,通過仔細檢查,在開機後能夠聽到硬盤盤片的轉動聲音,系統檢測啓動設備時提示無法找到硬盤。機器的型號是:英特爾810主板,英特爾賽揚1.1GHz處理器,256MDDR266內存,硬盤爲希捷酷魚7200.740GB。

重新啓動機器時或者進入CMOS重新設置一下就一切正常,但在使用過程中還是經常會重新啓動,重新啓動後則又無法找到硬盤。剛開始故障並不算嚴重,還能夠將就使用,但隨着使用次數的增多,故障越來越頻繁,於是決定徹底解決。

故障分析與解決:按照正常的檢修順序,先對硬盤進行徹底殺毒,用最新版的江民和瑞星查殺後卻一無所獲,基本上排除了病毒破壞引導區和分區表的可能。於是又開始懷疑是CMOS電池老化導致硬盤有時無法識別,更換了一個新電池以後故障還是依舊。根據故障現象來看,如果軟件沒有問題,那麼看到故障出自硬盤本身,是不是硬盤的質量出了問題,由於是在機房裏,每一臺機器的配置基本上都是相同的,這就給替換法帶來了方便,把硬盤和另一臺電腦互換以後,結果兩臺電腦竟然都沒有出現問題!這就奇怪了,難道硬盤和主板之間還有兼容性的問題不成?絕對不可能呀,這兩臺機器的主板可都是一個型號的,均爲英特爾的原裝810芯片組的主板呀。

排除了硬盤自身的故障以後,因爲網絡教室裏每一臺計算機都有自己的名字,而且IP地址也不同,爲了便於管理,把硬盤又換了回來,結果故障又來找了。

百思不得其解,怎麼又出現故障了呢?想來想去,除了互換硬盤的時候插拔了數據線,其它地方都沒有動,難道是數據線存在接觸不良的現象?於是趕緊把一根新的80芯數據線換上,結果一切正常。經過一個星期的測試,證實故障徹底排除。

故障總結:這起故障的主要原因是80芯數據線在多次的插拔以後,由於線徑較細,存在接觸不良的現象,而在檢修的時候兩臺電腦互換硬盤,把接觸不良的地方接上了,等到再換回來的時候又斷開了,導致了故障的重演。

爲此提醒各位讀者,如果你使用是仍然是IDE的硬盤,那麼你在拔數據線的時候動作一定要輕,要小心,不能很隨意的一下子就把數據線拔下來,遇到硬盤的IDE口和數據線插頭很緊的情況,很容易造成數據線的插頭和芯線之間的接觸不良現象。

二、硬盤散熱不良引起電腦反覆重啓或藍屏故障排除

故障現象:朋友反應,他的一臺購買了兩年多的HP筆記本,最近總是莫名其妙的反覆重啓或藍屏死機現象。故障的具體表現是:開啓電腦後,大約正常使用三、四個小時後,電腦便會莫名其妙的重新啓動,啓動後再次連續使用一個小時的時間,電腦便會再次自動重啓。重啓現象還算不錯,有時在使用中直接出現藍屏死機的現象,讓朋友感到非常的惱火,由於過了免費的維修期,於是找筆者幫助解決。

故障分析與排除:朋友的這檯筆記本保養的不錯,雖然有兩個年頭,但看起來還相當的好。朋友介紹:本本使用相當仔細,故障出現是在兩週前,根據朋友介紹的故障,基本判斷是由於散熱不良所引起的。打開朋友的電腦,讓其工作一個小時後(運行簡單的應用軟件),用手觸摸機身表面,當手接觸到安放硬盤的部位時,發現此處特別的熱。筆記本硬盤安裝的部位應該比其它的部位要明顯的熱,但像朋友這樣熱的還是頭次見到,何況這才工作了一個小時。

於是將筆記本打開,仔細觀察用於硬盤的散熱風扇,發現這個風扇居然沒有轉動。如此之高的溫度風扇都沒有反映,難怪經常重啓和死機呢。找到問題的根源後,去市場中購買了一個新的同型號的散熱器換上,打開筆記本檢測七八個小時,均沒有出現問題,至此故障解決。

故障總結:大家都知道,筆記本對散熱的要求相當的高,特別是硬盤,發熱量明顯比其它的部件要大,由於體積受限,因此在散熱方面做得一般都不太好。朋友以前用機器時從沒有連續用過四個小時,而那時也在冬天,最近由於比較忙才經常使用電腦,卻無意中發現了此故障,相信這也不是偶然吧。因此提醒各位朋友,如果遇到經常重啓和藍屏死機的現象,不妨從散熱處多思考一下。

真內存故障造成的假硬盤故障

一客戶的電腦出了問題,原用Win98操作系統,內存是KingMaxSDRAM128MBPC150,硬盤是金鑽七代40GB。

故障現象:在一次非法關機後重新開機就無法進入Win98系統,每次開機磁盤自檢運行到D盤的80%左右就停止了。

故障處理:筆者根據上面的現象進行了如下操作:進入Dos運行SCANDISK掃描磁盤,提示D盤有壞道,接着順利地格式化了D盤,滿以爲壞道已修復,重啓,可是問題依舊。又反覆高級格式化幾次,甚至重新分區,但檢測依舊提示D盤有壞道。當然重裝系統也是不行的。

由於該硬盤還在保修期內,筆者便把它發回代理商那裏返修。

過了一個星期那個硬盤返回來了。光盤啓動直接進入DOS,對其分區、高級格式化準備裝系統。但是檢測到D盤時又被卡住了,根本無法裝Windows系統。沒有辦法,只好找硬盤代理商把一塊新硬盤發過來。來回折騰了足足有兩個星期,滿以爲這下可以給客戶一個滿意的交待了。可是結果令人吃驚,還是提示有壞道?而且在D盤同一位置。可以肯定這是一個全新的硬盤,怎麼會出現同樣的問題呢。

重新開機,硬盤自檢到D盤的84%就停止了。仔細看提示,發現前三行就有內存檢測錯誤的相關提示。問題可能就出在內存上。換了條內存一試果然一切正常。將該內存插到正常的機上又出現同樣問題。

經驗總結:這是一例表面是硬盤錯誤實際上卻是內存錯誤的問題。根據筆者的經驗,這樣的故障在實際工作中也並不少見,所以筆者建議大家在碰到硬件故障的時候要多注意系統提示,問題可能就會很快明朗。筆者想,如果早使用替換法來檢測,就可以很快判定不是硬盤的問題,不必花費大量的時間進行格式化和重裝系統了,也不會發生硬盤歷時兩個星期的返修和退換事情了。

硬盤診斷要領

1.檢查電源部是否供電

1)與硬盤相連的電源接頭(Connector)的中間的2插頭是接地(ground)頭,兩邊的接頭各位+5VDC和+12VDC。

2)可通過spindleMotor是否轉動來判斷電源供應與否,如果轉動就說明電源供電正常。

2.連線(Cable)是否連接正確

1)RibornCable有顏色的部分一般時1所在的部分,第20pin是key.,因此沒有pin。

2)有電源的一邊一般爲1所在的一邊。

3)經常移動的硬盤或使用時間較長的計算機而言,更換連線(cable)來測試也是較好的方法,因爲雖然連接部和外觀上沒有異常,但也可能因爲接觸阻力,noixe,連接不良(poorconnection)等問題而不能正常工作的情況也時有發生。

3.檢查設置(setting)

1)檢查是否根據使用數量和使用目的而正確設定DiskSelectJumper(Master/Slave)。

4.檢查安裝(setup)是否正確

-有自動檢測(AutoDetection)功能的,打開電源後用自動檢測(AutoDetection)來識別硬盤。

1)如自動檢測(AutoDetection)和硬盤初始化一切正常,可以認爲除壞扇區等表面損傷外硬盤硬件基本正常。

2)找不到硬盤(自動檢測(AutoDetection)不到)時,按照5以下步驟找到後,按照各自的要領分區(partition),格式化(format),SurfaceAnalysis,NDD依次檢查硬盤狀況。

5.檢查spidlemotor是否轉動

1)檢查spindlemotor是否轉動時,供應電源並用手輕觸磁盤得上蓋(topcover),可感覺到轉動震動。大部分硬盤驅動器發出轉動聲音。

2)SpindleMotor不轉動的原因有

-沒有供應電源

-Board有損

-spindleMotor自身有損

-Stictiontiction

_"的提示我哭!!於是我用啓動盤(軟盤)啓動機器,到是能引導,出現A:>輸入C:後再輸入dir命令,又出現了"Notready

readingdrivec"abort,retry,fail?_"提示,不能進系統。我再哭!!而且其他分區不見了。

處理:用“三茗硬盤醫生”中的修復硬盤功能修復硬盤,點一下回車問題解決了。

教你判斷硬盤是哪裏出現了問題

①首先檢查CMOSSETUP是否丟失了硬盤配置信息。測量主板上COMSRAM電路是否爲電池有故障,或元器件(如二極管、三極管、電阻、電容等)損壞能原因而CMOS中的硬盤配置參數出錯。

②通過加電自測,若屏幕顯示錯誤信息“1701”或“HardDiskError”,說明硬盤確實有故障。但也可能是硬盤適配卡未插好、或者硬盤與硬盤適配器的插接處未插好、或者硬盤適配器有故障等。

③關機,拆開機蓋,測+5V、+12V電源是否正常,電源盒風機是否轉動。以此來判斷是否外電路缺電。

④檢查信號電纜線,插頭與硬盤適配卡是否插好,有無插反或接觸不良。可嘗試交換一些電纜插頭試一下。

⑤採用“替代法”來確定故障部件。找一塊好硬盤適配卡(或多功能卡)與該硬盤適配卡比較,判斷是硬盤適配卡還是硬盤驅動器本身有問題。

⑥觀察步進電機端止檔銷是否卡死,如卡死,用手撥回起始位置。

以上幾個步驟,用戶需要仔細檢查、測試、分析,找出壞的元器件進行修理,或者更換硬盤適配卡。

經以上的處理後,只要不是硬盤盤體本身損壞,僅僅是一般性的接插件的接觸不良或外電路故障則多數能夠迅速排除。

測電阻法

該測量方法一般是用萬用表的電阻檔測量部件或元件的內阻,根據其阻值的大小或通斷情況,分析電路中的故障原因。一般元器件或部件的輸入引腳和輸出引腳對地或對電源都有一定的內阻,用普通萬用表測量,有很多情況都會出現正抽電阻小,反向電阻大的情況。一般正向阻值在幾十歐姆至100歐姆左右,而反向電阻多在數百歐姆以上。但正向電阻決不會等於0或接近0,反向電阻也不會無窮大,否則就應懷疑管腳是否有短路或開路的情況。當斷定硬盤子系統的故障是在某一板卡或幾塊芯片時,則可用電阻法進行查找。關機停電,然後測量器件或板卡的通斷、開路短路、阻值大小等,以此來判斷故障點。若測量硬盤的步進電機繞組的直流電阻爲24歐,則符合標稱值爲正常;10歐左右爲局部短路;0歐或幾歐爲繞組短路燒燬。

硬盤驅動器的扁平電纜信號線常用通斷法進行測量。硬盤的電源線既可拔下單測也可在線並測其對地阻;如果無窮大,則爲斷路;如果阻值小於10歐,則應懷疑局部。

測電壓法

該測量方法是在加是怕情況下,用萬用表測量部件或元件的各管腳之間對地的電壓大小,並將其與邏輯圖或其它參考點的政黨電壓值進行比較。若電壓值與正常參考值之間相差較大,則青蛙該部件或元件有故障;若電壓正常,說明該部分完好,可轉入對其它部件或元件的測試。

一般硬盤電源與軟盤插線一樣,四個線頭分別爲+12V、+5V、-5V和地線。硬盤步進電機額定電壓爲+12V。硬盤啓動時電流大,當電源穩壓不良時(電壓從12V下降到10.5V),會造成轉速不穩或啓動困難。

Ⅰ/O通道系統板擴展槽上的電源電壓爲+12V、-12V、+5V和-5V。板上信號電壓的高電平應大於2.5V,低電平應小於0.5V。硬盤驅動器插頭、插座按照引腳的排列都有一份電壓表,高電平在2.5-3.0V之間。若高電平輸出小於3V,低電平輸出大於0.6V即爲故障電平。邏輯是怦的測量可用試波器測量或者用邏輯筆估算。

測電流法

如果有局部短路現象,則短路元件會升溫發熱並可能引起保險絲熔斷。將萬用表串入故障線路,覈對電流是否超過正常值。硬盤驅動器適配卡上的芯片短路會導致系統析負載電流加大,驅動電機短路或驅動器短路會導致主機電源故障。硬盤電源+12V的工作電流應爲1.1A左右。當硬盤驅動器負載電流加大時,會使硬盤啓動時好時壞。電機短路或負載過流輕則保險熔斷,重則導致電源塊、開關調整管損壞。在加大電流回路中可串入流假負載進行測量。如有保險的線路,則可斷開保險管一頭將表串入進行測量。在印刷板上的某芯片的電源線,可用刻刀或鋼鋸條割斷銅泊引線串入萬用表測量。電機插頭、電源插頭可從卡口裏將電源線起出來串入表測量。

硬盤故障提示信息的含義

(1)Dateerror(數據錯誤)

從軟盤或硬盤上讀取的數據存在不可修復錯誤,磁盤上有壞扇區和壞的文件分配表。

(2)Harddiskconfigurationerror(硬盤配置錯誤)

硬盤配置不正確,跳線不對,硬盤參數設置不正確等。

(3)Harddiskcontrollerfailure(硬盤控制器失效)

控制器卡(多功能卡)鬆動,連線不對,硬盤參數設置不正確等。

(4)Harddiskfailure(硬盤失效故障)

控制器卡(多功能卡)故障,硬盤配置不正確,跳線不對,硬盤物理故障。

(5)Harddiskdrivereadfailure(硬盤驅動器讀取失效)

控制器卡(多功能卡)鬆動,硬盤配置不正確,硬盤參數設置不正確,硬盤記錄數據破壞等。

(6)Nobootdeviceavailable(無引導設備)

系統找不到作爲引導設備的軟盤或者硬盤。

(7)Nobootsectoronharddiskdrive(硬盤上無引導扇區)

硬盤上引導扇區丟失,感染有病毒或者配置參數不正確。

(8)Nonsystemdiskordiskerror(非系統盤或者磁盤錯誤)

作爲引導盤的磁盤不是系統盤,不含有系統引導和核心文件,或者磁盤片本身故障。

(9)Sectornotfound(扇區未找到)

系統盤在軟盤和硬盤上不能定位給定扇區。

(10)Seekerror(搜索錯誤)

系統在軟盤和硬盤上不能定位給定扇區、磁道或磁頭。

(11)ResetFailed(硬盤復位失敗)

硬盤或硬盤接口的電路故障。

(12)FatalErrorBadHardDisk(硬盤致命錯誤)

硬盤或硬盤接口故障。

(13)NoHardDiskInstalled(沒有安裝硬盤)

沒有安裝硬盤,但是CMOS參數中設置了硬盤。

硬盤驅動器號沒有接好,硬盤卡(多功能卡)沒有接插好。

硬盤驅動器或硬盤卡故障。

硬盤故障的代碼見表

代碼代碼含義

1700硬盤系統通過(正常)

1701不可識別的硬盤系統

1702硬盤操作超時

1703硬盤驅動器選擇失敗

1704硬盤控制器失敗

1705要找的記錄未找到

1706寫操作失敗

1707道信號錯

1708磁頭選擇信號有錯

1709ECC檢驗錯

1710讀數據時扇區緩衝器溢出

1711壞的地址標誌

1712不可識別的錯誤

1713數據比較錯

1780硬盤驅動器C故障

1781D盤故障

1782硬盤控制器錯

1790C盤測試錯

1791D盤測試錯

硬盤故障怎麼檢查呢

在電腦各種硬件設備所發生的故障中,硬盤故障所佔的比例還是比較高的。由於硬盤在電腦配件中佔有極其特殊的地位,當它出現故障時輕則主機不能啓動,重則還可能會使重要的數據資料丟失。硬盤故障的具體表現是多種多樣的,在本文裏則主要講解兩個方面的故障,上篇爲大家介紹硬盤不能啓動的故障的解決。下篇則爲大家介紹邏輯和物理壞道的處理。

啓動故障

在電腦的使用過程中,我們都有可能會遇到電腦無法啓動的問題。引起系統啓動故障的原因有很多種,其中很多都與硬盤有關。一般情況下,當硬盤出現故障的時候,BIOS會給出一些英文提示信息。由於不同廠家主板或不同版本的BIOS,其給出的提示信息可能會存在一些差異,但基本上都是大同小異的。下面我們就以使用較爲常見的AwardBIOS爲例,探討一下如何利用其給出的提示信息,判斷並處理硬盤不能啓動故障的方法。

diskcontrollerfailure(硬盤控制器失效)。這是最爲常見的錯誤提示之一,當出現這種情況的時候,應仔細檢查數據線的連接插頭是否存在着鬆動、連線是否正確或者是硬盤參數設置是否正確。

error(數據錯誤)。發生這種情況時,系統從硬盤上讀取的數據存在有不可修復性錯誤或者磁盤上存在有壞扇區。此時可以嘗試啓動磁盤掃描程序,掃描並糾正扇區的邏輯性錯誤,假如壞扇區出現的是物理壞道,則需要使用專門的工具嘗試修復。

otsectoronharddiskdrive(硬盤上無引導扇區)。這種情況可能是硬盤上的引導扇區被破壞,一般是因爲硬盤系統引導區已感染了病毒。遇到這種情況必須先用最新版本的殺毒軟件徹底查殺系統中存在的病毒,然後,用諸如KV3000等帶有引導扇區恢復功能的軟件,嘗試恢復引導記錄。如果使用WinXP系統,可啓動“故障恢復控制檯”並調用FIXMBR命令來恢復主引導扇區。

tFailed(硬盤復位失敗)、FatalErrorBadHardDisk(硬盤致命性錯誤)、DDNotDetected(沒有檢測到硬盤)和HDDControlError(硬盤控制錯誤)。當出現以上任意一個提示時,一般都是硬盤控制電路板、主板上硬盤接口電路或者是盤體內部的機械部位出現了故障,對於這種情況只能請專業人員檢修相應的控制電路或直接更換硬盤。

壞道故障

通過上面的學習,阿King對硬盤不能啓動故障的`解決有所瞭解了,接下來阿King想知道的當然是如何對付自己那已經有壞道的硬盤了。

老師這期就爲阿King介紹一下邏輯壞道和物理壞道的故障和相應的維修。但在開講之前,老師就提醒阿King,做這項工作一定要慎重仔細。

邏輯壞道

出現邏輯壞道是在電腦的日常使用中容易出現的一種硬盤故障,邏輯壞道實際上就是磁盤磁道上面的校驗信息(ECC)與磁道的數據和伺服信息不匹配。出現這種故障的主要原因通常都是因爲一些程序的錯誤操作,或者是該處扇區的磁性介質開始出現不穩定現象的先兆。邏輯壞道在一般電腦使用中的表現,就是文件存取時出錯或做硬盤克隆時,當到達出錯部位後,因彈出出錯信息窗口而不能繼續下去。

消除這種邏輯壞道的方法比較簡單,很多專用軟件如:DM、NORTON的DISKDOCTOR等都能做到,但最常用的還是Windows自帶的“磁盤掃描”功能。對於FATl6或FAT32分區來說,可以在DOS實模式下用Scandisk掃描磁盤,此時系統可將邏輯出錯的扇區標註出來,以後在進行存取操作時就會避開這些扇區。由於這些軟件的使用方法較爲簡單且也多有介紹,在這裏也就不過多地講解了。

但是,假如採用的是NTFS分區且安裝WindowsXP系統,由於它沒有Scandisk這個工具,故只能使用Chkdsk這個工具了。Chkdsk工具會基於所用的文件系統,創建和顯示磁盤的狀態報告。另外Chkdsk還能夠列出並糾正磁盤上的錯誤。不過如果不帶任何參數的話,chkdsk將只顯示當前驅動器中磁盤的狀態,而不會修正任何的錯誤,要修正錯誤則必須包括/f參數。

物理壞道

硬盤物理壞道是比較常見的硬盤故障。實際上它是因爲震盪、劃傷等“硬”原因,導致—些扇區的磁介質失去了磁記憶能力而造成的。

通常情況下,這樣的損壞修復起來都比較麻煩。因爲,在硬盤內部的磁道列表中,這個扇區是被標記爲正常的,而壞道也是物理性存在的。

所以,它無法通過掃描、格式化、低格或者激活扇區的方法來加以消除,必須將這個扇區加入到設置在硬盤內部的系統保留區,告訴磁盤這些磁道已經不能使用了,才能在硬盤控制系統的可見範圍內消除這個壞道。當然,這樣做需要使用一些專用軟件,對普通用戶來講維修有些困難。

不過有些硬盤廠商會提供原廠的工具軟件,如IBM/日立的DFT和西部數據的DataLifeGuardDiagnostics。這些原廠的工具軟件不但掃描速度快,而且辨別準確率也很高,能夠對付較爲普遍的硬盤物理壞道故障。因此對硬盤內部進行操作還是原廠的軟件較爲可靠,除非原廠工具不能解決問題,否則不推薦使用第三方的工具軟件。

相對於上面這種比較高級的隱藏方式,對於那些要求不高的用戶來說,則可以通過“壞盤分區器”FBDISK和

DiskGenius這一對軟件的組合,完成將壞道所在位置做成分區隱藏起來的任務。其具體的操作簡要介紹如下:

首先,將下載來的軟件複製到一臺正常使用的電腦的C盤根目錄下,再把出現物理壞道的硬盤作爲第2硬盤掛接在該電腦上。接着啓動到DOS的實模式下,並運行DiskGenius的可執行程序Diskgen,然後按“Ctrl+Alt”組合鍵,選擇“硬盤”菜單下的“第2硬盤”。這時就可以看到第2硬盤的具體分區情況了。假如要重新規劃這塊硬盤,就可以把所有分區都刪除掉,隨後存盤退出。

接着運行FBDisk,選擇要檢測的硬盤後按“Y”開始掃描。如果硬盤存在壞道,則FBDisk會自動顯示出它在哪個扇區和磁道。掃描完成後它可以把所有的壞道都羅列出來,並詢問是否要寫入硬盤。如果按“Y”將會自動將壞道隱藏起來,最後按Esc鍵退出。

隨後再次運行Diskgen,這時就可以看出經過FBDisk處理後的磁盤情況,此時壞道處會呈現—種灰白色。通過Diskgen再稍微將隱藏物理壞道的分區擴大一些。最後,將這些壞道全部隱藏在一個分區裏,修復工作即告結束。

兩款軟件配合使用是因爲,經過FBDisk處理後的硬盤可能會有很多分區,而受軟件自身最多4個主分區的限制,會導致硬盤利用率不高的後果。而通過Diskgen的配合,就可以很好地解決這個問題。