去年上半年在名錄集網站中搭建31個省份的中國工商企業名錄子網站已經過去一年了,原計劃在第一批數據添加完不久就增加第二批數據的,但因為服務器負載的問題以及我們的工作安排問題,一拖再拖,直到上個月更新了服務器、這個月才抽出時間來進行。
第二批數據其實也不是很新,稍微比第一批新一點,數量大約有100多萬,平均到每個省有幾萬,為了避免重複,我們還專門用VB做了個程序來進行分揀,把重複的剔除。這個程序先運行效率不高,幾萬*幾十萬=上百億次的循環,電腦連續運行幾天都分揀不完一個省份的數據,後來改了程序,隻要幾萬次循環,幾個小時就可以分揀一個省份的數據。
第二批數據的格式與第一批也不太一樣,需要修改模闆再導入,特别是經濟行業沒有代碼,直接是文字,需要重新判斷、歸類。不過搞順了也還方便,隻是31個省份都要修改、導入,工作量大些,服務器雖然配置不錯了,但同時導入上十個省份數據還是會出現一些問題,因此需要降低一些速度,預計到下周初才能導入完成。
這裡做個第二批數據的列表鍊接:
==華北地區==
==華東地區==
==華南地區==
==華中地區==
==東北地區==
==西北地區==
==西南地區==
時隔差不多10個月後添加這第2批數據,希望能有些用,後面還要設法添加更新的第3批數據,以及其他類型的數據。
自由标簽
评论