硬盤确實是現在服務器或者電腦中雖容易損壞的部件了,我們的Linux服務器上安裝了比較多的硬盤,每台上面有8顆硬盤,使用的頭1、2年還好,到3、4年就逐步出現問題了,常見的是:
- 硬盤變為隻讀,需要重啟;
- 數據庫報錯,需要修複;
- 數據庫報錯,無法修複,換文件重建;
- 徹底無法使用。
幾個月前讓同事把國内外服務器上的硬盤全部檢查了一遍,将通電時間、報錯次數、壞道數量等列出來,對損壞嚴重的硬盤棄用。
随着硬盤損
這是 硬盤 分類的頁面,點擊下面标題查看詳細文章内容:
硬盤确實是現在服務器或者電腦中雖容易損壞的部件了,我們的Linux服務器上安裝了比較多的硬盤,每台上面有8顆硬盤,使用的頭1、2年還好,到3、4年就逐步出現問題了,常見的是:
幾個月前讓同事把國内外服務器上的硬盤全部檢查了一遍,将通電時間、報錯次數、壞道數量等列出來,對損壞嚴重的硬盤棄用。
随着硬盤損
最近在增加新的國外服務器以及對國内服務器進行硬盤的替換升級,國内服務器的硬盤經過幾年的使用後逐步損壞,去年讓同事進行過詳細和全面的磁盤檢查和掃描,都進行了記錄:
今年新購入的服務器上的硬盤時常有些毛病,在導入數據的時候就多次出現故障,用了2、3個月的時間導入數據後,算是穩定了幾個月,但最近随着我們添加手機版工作的開展,硬盤又開始忙起來,服務器負載明顯增加。兩周前出現了幾次服務器死機情況,每次重啟後都會導緻數據庫保存,需要檢查、修複,這樣的情況持續出現後,終于有一次服務器重啟不了了,好在數據都已經備份、複制出來了。這些備份數據就直接在新購的美國服務器上恢複,站點啟用後,發現普通内頁可以打開,但數據量大網站的分類頁卻頻頻出現報錯,服務器8核CPU長期都被占用100%,而硬盤IO看上去還不是那麼滿,問題原因還在查找中。我們把情況向服務商反映後,他們
在我們一些用Drupal搭建的大數據量網站中,Boost模塊産生的緩存文件數量非常多,以至于運行cron期間無法更新完畢,我們後來就采用了不自動更新緩存文件,而是人工根據需要在服務器上直接删除緩存文件的辦法。
但當緩存文件數量達到數十、上百萬的時候,需要很長時間删除,在這個過程中如果還有用戶訪問、産生新的緩存文件,将導緻硬盤占用達到100%,長期這樣的話,可能讓服務器硬盤不堪重負、服務器出現負載上升、網站無法訪問的情況。
這個問題一直困擾了我們好長時間,以前都是采取人工每次删除少量文件,逐步試着來進行,這導緻要花費好些時間精力。昨天在網上查找了
因為我們一些網站的數據量都很大,所以在發現硬盤io過高後,增加了多塊硬盤,有萬轉的機械硬盤,也嘗試過現在逐步流行的固态硬盤。
經過這幾個月的試用,我們發現隻要是負載不太高,機械硬盤、固态硬盤都工作良好,但如果負載很高的話,無論是機械硬盤和固态硬盤,都容易出故障。
我們先以為固态硬盤的io吞吐量可以比機械硬盤高很多,但實際使用中,用iostat觀察,發現在高負載情況下,一些參數甚至比機械硬盤都不如,用的幾塊固态硬盤已經出過幾次問題了,現在已經不敢再過度使用固态硬盤,隻當作普通硬盤使用還行。
最近在新服務器上有大量數據需要導入,
為了趕上元旦前拿到購買的硬盤,我們都采用了快遞到付的方式,順豐速遞還算給力,12月28日中午在淘寶上下的單,12月30日早上2塊固态硬盤送到了,12月31日早上6塊迅猛龍硬盤也送到了,同事馬上趕去機房添加到服務器上,讓我可以利用元旦期間的時間來遷移數據、調配硬盤的使用。
現在3台服務器上每台都是8塊硬盤,加上4顆4核CPU、64G或48G内存,真是擴充到了極緻,這3台服務器的配置來做網站算是超強了。下面把3台服務器上硬盤的配置和用途進行記錄:
服務器一