去年上半年在名錄集網站中搭建31個省份的中國工商企業名錄子網站已經過去一年了,原計劃在第一批數據添加完不久就增加第二批數據的,但因為服務器負載的問題以及我們的工作安排問題,一拖再拖,直到上個月更新了服務器、這個月才抽出時間來進行。
第二批數據其實也不是很新,稍微比第一批新一點,數量大約有100多萬,平均到每個省有幾萬,為了避免重複,我們還專門用VB做了個程序來進行分揀,把重複的剔除。這個程序先運行效率不高,幾萬*幾十萬=上百億次的循環,電腦連續運行幾天都分揀不完一個省份的數據,後來改了程序,隻要幾萬次循環,幾個小時就可以分揀一個省份的數據。