名錄集網站包含的數據量極大,用MediaWiki來處理這上千萬數據确實不是很容易,不過已經導入的數據隻有就在現有的平台上保留、處理,未來新增的數據再用Drupal。
前期經過數輪的版面修改、模闆更新以及補充索引,這些數據基本上穩定下來,本周前幾天就對使用的MediaWiki平台實施從1.15到1.16的升級。
中文站的個數多、總數據量大,不過運行update.php和rebuildtextindex.php的時間比我想象的還是要快一些,一般幾十萬條數據的網站,運行升級、重建文本索引的時間都在幾十分鐘以内,完成升級、重建文本索引後,與以前最大的不同除了界面以外就是實現了中文的内部搜索功能,這對浏覽用戶來說更方便了。
英文站的升級更簡單一些,隻需要運行update.php,因為英文的内部搜索功能以前就打開了,是正常的。
我怕這麼多網站升級後,全部數據都需要重新生成緩存讓負載太高,先用以前1.15下的文件緩存,以後逐步更新,這個過渡應該是個不錯的辦法,基本不影響用戶的正常使用。負載方面還需要觀察一陣子,主要是擔心中文站的内部搜索打開後,在進行内部搜索以及搜索框預先提示搜索詞的過程中,是否會有讓負載過高的情況。
名錄集的MediaWiki平台都升級到1.16以後,就剩下查号吧、郵編庫這兩個網站還在用1.15版本了,按照數據量來說,在保持老緩存文件的前提下,升級應該不會對服務器負載有特别影響,不過是否繁體克隆網站能完全正常現在還沒有驗證,等過一陣子名錄集網站升級都觀察一切正常後,再來處理這兩個關鍵性的網站。
评论