你在这里


外文

“囤积”外文数据,注册新域名,准备做更多网站信息

James Qi 2011年7月21日 - 22:06 发布

  前一阵子购买了两套国外的企业名录数据,数据量都是千万级别的,其中一套数据已经开始导入,要等全部导入、处理好,至少要到本月底了,不过这也比先前规划的到下个月底要提前不少,多出来的时候可以抓紧做更多的新数据网站。

  前几年做的网站都是中文信息,域名采用了拼音方式,例如查号吧(ChaHaoBa.com)、邮编库(YouBianKu.com)、名录集(MingLuJi.com)、问版主(WenBanZhu.com)等,去年开始加大了外文方面的网站建设力度,今年以来更是将主要力量都集中在外文方面,以前的拼音域名对于老外来说就看不懂了,虽然不是很想换域名(免得新域名要重新积累可信度和权重),但从长远来看,还是有必要的。

自由标签:

2011下半年的计划就是狂增外文的世界各国数据网站

James Qi 2011年7月4日 - 16:51 发布

  我们做外文的网站很早就开始了,大约是在2006年,当时就想着把实用查询的内容做成英文版,不过因为平台、内容策略、时间精力、方法等各方面的原因,进展不大。从去年春节过后,倒是加强了外文方面的内容力度,尝试了英文以外的多语言网站,增加了批量的工商名录外文数据,做成了多个中英文双语的网站。上半年又采用了Drupal平台,在海量信息、多语言网站方面又做了更多尝试,效果还不错。

  前年以及更早的网站数据页面量都是千、万级别的,最多就是几十万了,去年单个子网站开始增加到百万页面级别,全年总量达到千万的数量级。今年上半年将以前的一些老数据进行了一些个性化处理,以不同以前的方式呈现出来,内容、主题的侧重点不一样,也增加了上千万条的数据,到目前为止看上去效果都还不错。

  上周和同事一起商量了下半年的工作计划,决定工作重心就放在海量外文数据网站方面。在内容来源上不仅仅是在国内、中文站找到的外文数据,而是直接从国外、外文网站获得数据,数量上不仅仅是增加,而是狂增很多倍,总量上要上亿这个新数量级。目前已经准备增加几个上千万的数据来源,下半年处理数据上会花费很多时间,上半年更换的新服务器也还会继续增加硬盘、内存等硬件。

自由标签:

订阅 RSS - 外文