前一阵子购买了两套国外的企业名录数据,数据量都是千万级别的,其中一套数据已经开始导入,要等全部导入、处理好,至少要到本月底了,不过这也比先前规划的到下个月底要提前不少,多出来的时候可以抓紧做更多的新数据网站。
前几年做的网站都是中文信息,域名采用了拼音方式,例如查号吧(ChaHaoBa.com)、邮编库(YouBianKu.com)、名录集(MingLuJi.com)、问版主(WenBanZhu.com)等,去年开始加大了外文方面的网站建设力度,今年以来更是将主要力量都集中在外文方面,以前的拼音域名对于老外来说就看不懂了,虽然不是很想换域名(免得新域名要重新积累可信度和权重),但从长远来看,还是有必要的。
本周初注册了两个新的域名:与邮编库(YouBianKu.com)对应的PostCodeBase.com、与名录集(MingLuJi.com)对应的BizDirLib.com,这两个英文域名都是采用三段词来组成,类似中文三个拼音,而且意义上中英文对照得不错,也都是.com的,自己觉得还比较满意。👍
在GoDaddy.com注册几分钟就可以搞定,不过因为初期准备放置在国内的现成服务器上,还需要办理备案,让同事帮忙询问了一下,因为我们以前有个域名正在办理备案中,必须等以前的审核通过后才能提交新的域名申请,也就是8月中旬以后才能提交,要等审批下来至少是9月中旬了,几分钟注册的域名,要等几个月去申请备案才能放网站,如此荒唐的事真是中国特色。👎
不过这也没有办法,我们先积累素材吧,除了月初购买的两套数据中的第二套可以供导入以外,这两天去geonames.org下载了几百万条的世界各国地理信息数据,要仔细研究后再决定是否可用。今天又去购买了几百美元的外国详细邮编数据,也是为后面做准备。下半年还会根据进展情况,购买数千美元的数据。好在网站的收入也在提升,这些支出还是可以承受的,也是很值得的。
评论2
做大数据量网站,网站伤不起
每次访问你的网站,都速度非常慢,整个白天基本上开不了。你采用的drupa cms和wiki系统基本上是基于php+mysql的,流量一大,基本上服务器都顶不起。
大数据量网站速度慢的问题
谢谢这位朋友的关注和留言。
近段时间确实因为我们正在导入数据的原因,导致服务器负载比较高,甚至出现一阵子访问慢和困难的情况。随着导入的接近完成,应该速度上会好一些。
我这里既然选择走大数据量网站这条路,还是有一些准备的,例如硬件上选用多台高配置服务器,软件上尽量多采用各种方式的缓存,让网站服务器的负载保持在可用的水平上。如果有需要,还可以采用更多硬件投入的方式。目前软件暂用开源的,不会自行定制开发。
不过应该也不至于整个白天基本上打不开,我从后台看我们网站每天的流量还是基本正常的。可能还存在目前国内接入商dns等技术调整的问题(配合gfw的调整已经搞了几个月了),也会让我们网站在部分地区、部分时段难以访问。
php+mysql的网站做得好的话,流量还是可以支撑到很可观的,我们这边也在不断观察服务器的情况,设法解决遇到的各种问题。欢迎继续交流!