除了剛推出新工商名錄網站以外,我們也整理了以前的行業數據,做成了行業名錄網站,把原始數據中幾百個行業、幾千個文件分為幾十個大類,這個行業名錄網站沒有做成新工商名錄那樣幾十個子網站,而是統一在一個網站中,用分類來分開:
行業名錄網站,行業名稱、包含的企業數量如下:
- 安全: 29,039
- 辦公文教: 24,695
- 保健: 38,659
- 包裝: 136,605
- 财務: 18,741
- 餐飲娛樂: 15,779
- 電池: 27,799
- 電工電氣: 52,468
- 電器家電: 7,876
- 電子通信: 35,645
- 紡織皮革: 60,508
- 服務業: 75,505
- 服裝服飾: 77,238
- 工程設備: 8,677
- 工具: 29,286
- 工藝飾品: 90,710
- 廣告: 53,548
- 環保: 28,297
- 化學化工: 14,180
- 家具: 16,104
- 家居用品: 15,923
- 建築建材: 60,288
- 教育培訓: 25,232
- 進出口: 2,080
- 金融投資: 13,862
- 金屬: 51,004
- 禮品玩具: 64,476
- 旅遊: 17,502
- 能源電子: 12,243
- 批發零售: 20,415
- 汽車摩托: 7,959
- 器械醫藥: 22,211
- 軟件: 40,653
- 設備安裝維修: 18,436
- 設備制造: 132,481
- 食品飲料: 26,570
- 文化藝術: 7,158
- 五金: 53,214
- 造紙: 96,097
- 裝飾裝修: 23,628
因為單條字段多、信息豐富,所以數據量很大,遠超過預期,數據導入時間已經有兩周了,目前仍然在繼續中。而在數據導入完成前,網站的架構基本都搭建起來了,包括手機版,後面隻要繼續導入數據,進行一些緩存更新、網站地圖更新工作就可以。
评论1
數據量太大,已經進行了分站處理
這個站的數據量實在太大了,導入數據幾周時間還沒有做完,這樣即使再導入幾周後可以全部都導入完成,以後的使用上也會遇到負載性能方面的問題,後來痛下決心重新按照分類來設置了獨立的子站點,每個分類都是一個Drupal站點,鍊接如下:
分開後,可以幾個站同時導入數據,40個站總共隻需要1-2天就可以全部導入完成了,效率得到極大提高,隻是設置稍微麻煩一點,不過以後的用戶使用起來也會感覺速度更快。