除了刚推出新工商名录网站以外,我们也整理了以前的行业数据,做成了行业名录网站,把原始数据中几百个行业、几千个文件分为几十个大类,这个行业名录网站没有做成新工商名录那样几十个子网站,而是统一在一个网站中,用分类来分开:
行业名录网站,行业名称、包含的企业数量如下:
- 安全: 29,039
- 办公文教: 24,695
- 保健: 38,659
- 包装: 136,605
- 财务: 18,741
- 餐饮娱乐: 15,779
- 电池: 27,799
- 电工电气: 52,468
- 电器家电: 7,876
- 电子通信: 35,645
- 纺织皮革: 60,508
- 服务业: 75,505
- 服装服饰: 77,238
- 工程设备: 8,677
- 工具: 29,286
- 工艺饰品: 90,710
- 广告: 53,548
- 环保: 28,297
- 化学化工: 14,180
- 家具: 16,104
- 家居用品: 15,923
- 建筑建材: 60,288
- 教育培训: 25,232
- 进出口: 2,080
- 金融投资: 13,862
- 金属: 51,004
- 礼品玩具: 64,476
- 旅游: 17,502
- 能源电子: 12,243
- 批发零售: 20,415
- 汽车摩托: 7,959
- 器械医药: 22,211
- 软件: 40,653
- 设备安装维修: 18,436
- 设备制造: 132,481
- 食品饮料: 26,570
- 文化艺术: 7,158
- 五金: 53,214
- 造纸: 96,097
- 装饰装修: 23,628
因为单条字段多、信息丰富,所以数据量很大,远超过预期,数据导入时间已经有两周了,目前仍然在继续中。而在数据导入完成前,网站的架构基本都搭建起来了,包括手机版,后面只要继续导入数据,进行一些缓存更新、网站地图更新工作就可以。
评论1
数据量太大,已经进行了分站处理
这个站的数据量实在太大了,导入数据几周时间还没有做完,这样即使再导入几周后可以全部都导入完成,以后的使用上也会遇到负载性能方面的问题,后来痛下决心重新按照分类来设置了独立的子站点,每个分类都是一个Drupal站点,链接如下:
分开后,可以几个站同时导入数据,40个站总共只需要1-2天就可以全部导入完成了,效率得到极大提高,只是设置稍微麻烦一点,不过以后的用户使用起来也会感觉速度更快。