去年上半年在名录集网站中搭建31个省份的中国工商企业名录子网站已经过去一年了,原计划在第一批数据添加完不久就增加第二批数据的,但因为服务器负载的问题以及我们的工作安排问题,一拖再拖,直到上个月更新了服务器、这个月才抽出时间来进行。
第二批数据其实也不是很新,稍微比第一批新一点,数量大约有100多万,平均到每个省有几万,为了避免重复,我们还专门用VB做了个程序来进行分拣,把重复的剔除。这个程序先运行效率不高,几万*几十万=上百亿次的循环,电脑连续运行几天都分拣不完一个省份的数据,后来改了程序,只要几万次循环,几个小时就可以分拣一个省份的数据。