前一陣子購買了兩套國外的企業名錄數據,數據量都是千萬級别的,其中一套數據已經開始導入,要等全部導入、處理好,至少要到本月底了,不過這也比先前規劃的到下個月底要提前不少,多出來的時候可以抓緊做更多的新數據網站。
前幾年做的網站都是中文信息,域名采用了拼音方式,例如查号吧(ChaHaoBa.com)、郵編庫(YouBianKu.com)、名錄集(MingLuJi.com)、問版主(WenBanZhu.com)等,去年開始加大了外文方面的網站建設力度,今年以來更是将主要力量都集中在外文方面,以前的拼音域名對于老外來說就看不懂了,雖然不是很想換域名(免得新域名要重新積累可信度和權重),但從長遠來看,還是有必要的。
本周初注冊了兩個新的域名:與郵編庫(YouBianKu.com)對應的PostCodeBase.com、與名錄集(MingLuJi.com)對應的BizDirLib.com,這兩個英文域名都是采用三段詞來組成,類似中文三個拼音,而且意義上中英文對照得不錯,也都是.com的,自己覺得還比較滿意。👍
在GoDaddy.com注冊幾分鐘就可以搞定,不過因為初期準備放置在國内的現成服務器上,還需要辦理備案,讓同事幫忙詢問了一下,因為我們以前有個域名正在辦理備案中,必須等以前的審核通過後才能提交新的域名申請,也就是8月中旬以後才能提交,要等審批下來至少是9月中旬了,幾分鐘注冊的域名,要等幾個月去申請備案才能放網站,如此荒唐的事真是中國特色。👎
不過這也沒有辦法,我們先積累素材吧,除了月初購買的兩套數據中的第二套可以供導入以外,這兩天去geonames.org下載了幾百萬條的世界各國地理信息數據,要仔細研究後再決定是否可用。今天又去購買了幾百美元的外國詳細郵編數據,也是為後面做準備。下半年還會根據進展情況,購買數千美元的數據。好在網站的收入也在提升,這些支出還是可以承受的,也是很值得的。
评论2
做大數據量網站,網站傷不起
每次訪問你的網站,都速度非常慢,整個白天基本上開不了。你采用的drupa cms和wiki系統基本上是基于php+mysql的,流量一大,基本上服務器都頂不起。
大數據量網站速度慢的問題
謝謝這位朋友的關注和留言。
近段時間确實因為我們正在導入數據的原因,導緻服務器負載比較高,甚至出現一陣子訪問慢和困難的情況。随着導入的接近完成,應該速度上會好一些。
我這裡既然選擇走大數據量網站這條路,還是有一些準備的,例如硬件上選用多台高配置服務器,軟件上盡量多采用各種方式的緩存,讓網站服務器的負載保持在可用的水平上。如果有需要,還可以采用更多硬件投入的方式。目前軟件暫用開源的,不會自行定制開發。
不過應該也不至于整個白天基本上打不開,我從後台看我們網站每天的流量還是基本正常的。可能還存在目前國内接入商dns等技術調整的問題(配合gfw的調整已經搞了幾個月了),也會讓我們網站在部分地區、部分時段難以訪問。
php+mysql的網站做得好的話,流量還是可以支撐到很可觀的,我們這邊也在不斷觀察服務器的情況,設法解決遇到的各種問題。歡迎繼續交流!