你在这里


2011

2011下半年的计划就是狂增外文的世界各国数据网站

James Qi 2011年7月4日 - 16:51 发布

  我们做外文的网站很早就开始了,大约是在2006年,当时就想着把实用查询的内容做成英文版,不过因为平台、内容策略、时间精力、方法等各方面的原因,进展不大。从去年春节过后,倒是加强了外文方面的内容力度,尝试了英文以外的多语言网站,增加了批量的工商名录外文数据,做成了多个中英文双语的网站。上半年又采用了Drupal平台,在海量信息、多语言网站方面又做了更多尝试,效果还不错。

  前年以及更早的网站数据页面量都是千、万级别的,最多就是几十万了,去年单个子网站开始增加到百万页面级别,全年总量达到千万的数量级。今年上半年将以前的一些老数据进行了一些个性化处理,以不同以前的方式呈现出来,内容、主题的侧重点不一样,也增加了上千万条的数据,到目前为止看上去效果都还不错。

  上周和同事一起商量了下半年的工作计划,决定工作重心就放在海量外文数据网站方面。在内容来源上不仅仅是在国内、中文站找到的外文数据,而是直接从国外、外文网站获得数据,数量上不仅仅是增加,而是狂增很多倍,总量上要上亿这个新数量级。目前已经准备增加几个上千万的数据来源,下半年处理数据上会花费很多时间,上半年更换的新服务器也还会继续增加硬盘、内存等硬件。

自由标签:

订阅 RSS - 2011