- 主題:本站内容主要是本人關注的互聯網行業及個人愛好方面的主題,包括AdSense💲、MediaWiki👨💻、Drupal💻、馬拉松🏃、架子鼓🥁等。
- 書訊:本人新書2018年12月出版《Google AdSense實戰寶典 - 第二版📘》,歡迎關注。
大約從上個月起,我們就發現Google的各種服務開始出現訪問困難的情況,老問題是google搜索總是被重置,新問題包括并且不限于:
- AdSense後台無法直接訪問;
- 包含AdSense代碼的頁面打開極慢或者無法打開;
- 包含Google Maps API代碼的頁面無法正常打開;
名錄集去年中期用MediaWiki導入大量數據,做成數十個子網站後,一直都在不斷調整模闆、檢查錯誤、修改完善,并推出名錄銷售,今年到4月份為止,也隻是用Drupal搭建了兩個中英文的供求信息、Trade Message網站,并沒有再導入大量數據來增加子網站了。
不過從上個月開始,我們重新啟動了新增子網站的工作,昨天除了推出435萬數據量的114電話查詢名錄以外,還有一個廣交會中國參展商名錄也公布出來。
以前的廣交會名錄以英文的國外買家為主,這次是中文的中國參展商名錄,數量也少一些,隻有1萬多,因此我們處理起來也比較快,前後也就
更新了服務器硬件後,我們繼續向着大數據量網站擴展,前段時間在Drupal系統中導入了多達435萬的114電話查詢名錄數據,算是創造了我們單個網站數據量的新紀錄,此前最多也是100多萬,沒有到200萬的。
114的數據包含了全國29個省份的電話查詢名錄,主要按照地區、類型和區号三種方式進行分類,其中地區的信息原始數據中有缺少和錯誤的情況,費了好些力氣來進行判斷、處理。另外,435萬中有小部分(數十萬)是完全重複的,還有一個單位幾個号碼的情況,實際獨立單位數量大約是279萬。
這個站開啟了留言功能、未開啟注冊功能,也因為數據量巨大
郵編庫網站去年開始嘗試多語言網站,推出10種語言的子網站,花了不少時間精力用MediaWiki搭建了框架,200多個國家有了獨立頁面,其中中國做得仔細一些。不過因為内容還不夠豐富,難以滿足浏覽者用各種語言查詢各國郵編的需求,所以整體浏覽量還不夠大。
有了去年的嘗試,我們還是積累了不少經驗教訓。今年以來加大了多語言方面的力度,同事先是将10種語言中的中國郵編内容從300多城市擴展到約3000區縣,現在又在将200多個國家的頁面内容進行豐富完善。
不過人工來做多語言内容确實很費勁,一個一個頁面創建、修改太麻煩,上個月開始我将170
很早就通過修改MediaWiki的MySQL數據庫來添加Wiki的站間鍊接,用PHPMyAdmin來在相關網站的interwiki表中插入一行就可以,例如:
INSERT INTO `postcode`.`jingleinterwiki` (
`iw_prefix` ,
`iw_url` ,
`iw_local` ,
`iw_trans`
)
VALUES (
'chn', '
前一陣子修改了MediaWiki中的一個PHP程序,去掉了全文檢索結果中的文件大小、更新時間等信息,另外在Drupal中也是可以實現的,現在補充在Drupal中實現内部搜索結果頁面中去掉發布者、發布時間等信息的辦法。
辦法很簡單,就是在Drupal目錄中找到這個文件:
drupal_root/modules/search/search-result.tpl.php
将其中第57行(Drupal 6.20)注釋掉就可以:
在換用16核CPU、16G内存的服務器後,發現7200轉硬盤不給力,就增加了多塊10000轉的迅猛龍硬盤,一台服務器上的4塊硬盤分别放置系統及備份文件、Squid緩存文件、MySQL文件、Apache和HTML緩存文件,這樣一般訪問都不會有什麼壓力。
但在我們持續導入數據、批量修改模闆的過程中,發現放置Squid緩存文件的硬盤有時占用達到100%,影響正常訪問,于是我們修改Squid設置文件,隻使用幾個G内存作為Web反向加速的緩存,關閉了幾十G、上百G的Squid磁盤緩存,這樣可以避免大量小文件的尋道操作。
接下來又發現系統
擺弄MediaWiki好幾年了,都盡量避免碰PHP程序,在不得已的情況下,對皮膚文件、少數配置參數等地方進行過有限的修改。去年底開始嘗試改用Drupal系統,不可避免遇到需要修改PHP程序的地方,經過一段時間的摸索,發現PHP也不是想象中的那麼難,不過是另一種程序語言而已,要精通不容易,但上手還是不太難的。
在Drupal中調用PHP程序摸出
為了有利于搜索引擎優化(SEO),有時修改頁面标題(Title)是很必要的,在MediaWiki中我一般是修改新建頁面的标題來實現,但無法修改已經存在頁面的标題,在Drupal中前一陣子找到一個第三方模塊“Page Title”可以實現在Title中插入Node參數、CCK字段等信息,還算是方便,但無法插入需要變換的内容。為了實現插入沒有的CCK字段内容,我還嘗試過專門設立幾個Computed字段作為過渡,不過這樣還是有些麻煩。
前兩天找了叫“drupal_set_title”的函數,既然是直接調用php函數,那
以前用MediaWiki的時候,為了實現面包屑導航條的功能,我采用在Wiki頁面中插入HTML代碼的方式來實現,效果看上去還不錯,遇到過一些站長找我問是如何實現的,其實自己看頁面代碼就可以知道,Wiki的源代碼都是公開的,照着複制或者稍微改改就可以用了。
改用Drupal後,找到一個叫“Custom Breadcrumbs”的第三方模塊,可以比較簡單地調用CCK中的字段或者Node的一些屬性參數來實現導航功能,不過感覺不太靈活,例如CCK、Node中沒有的參數就無法插入。
今天找了一個叫“d