- 主题:本站内容主要是本人关注的互联网行业及个人爱好方面的主题,包括AdSense💲、MediaWiki👨💻、Drupal💻、马拉松🏃、架子鼓🥁等。
- 书讯:本人新书2018年12月出版《Google AdSense实战宝典 - 第二版📘》,欢迎关注。
大约从上个月起,我们就发现Google的各种服务开始出现访问困难的情况,老问题是google搜索总是被重置,新问题包括并且不限于:
- AdSense后台无法直接访问;
- 包含AdSense代码的页面打开极慢或者无法打开;
- 包含Google Maps API代码的页面无法正常打开;
名录集去年中期用MediaWiki导入大量数据,做成数十个子网站后,一直都在不断调整模板、检查错误、修改完善,并推出名录销售,今年到4月份为止,也只是用Drupal搭建了两个中英文的供求信息、Trade Message网站,并没有再导入大量数据来增加子网站了。
不过从上个月开始,我们重新启动了新增子网站的工作,昨天除了推出435万数据量的114电话查询名录以外,还有一个广交会中国参展商名录也公布出来。
以前的广交会名录以英文的国外买家为主,这次是中文的中国参展商名录,数量也少一些,只有1万多,因此我们处理起来也比较快,前后也就
更新了服务器硬件后,我们继续向着大数据量网站扩展,前段时间在Drupal系统中导入了多达435万的114电话查询名录数据,算是创造了我们单个网站数据量的新纪录,此前最多也是100多万,没有到200万的。
114的数据包含了全国29个省份的电话查询名录,主要按照地区、类型和区号三种方式进行分类,其中地区的信息原始数据中有缺少和错误的情况,费了好些力气来进行判断、处理。另外,435万中有小部分(数十万)是完全重复的,还有一个单位几个号码的情况,实际独立单位数量大约是279万。
这个站开启了留言功能、未开启注册功能,也因为数据量巨大
邮编库网站去年开始尝试多语言网站,推出10种语言的子网站,花了不少时间精力用MediaWiki搭建了框架,200多个国家有了独立页面,其中中国做得仔细一些。不过因为内容还不够丰富,难以满足浏览者用各种语言查询各国邮编的需求,所以整体浏览量还不够大。
有了去年的尝试,我们还是积累了不少经验教训。今年以来加大了多语言方面的力度,同事先是将10种语言中的中国邮编内容从300多城市扩展到约3000区县,现在又在将200多个国家的页面内容进行丰富完善。
不过人工来做多语言内容确实很费劲,一个一个页面创建、修改太麻烦,上个月开始我将170
很早就通过修改MediaWiki的MySQL数据库来添加Wiki的站间链接,用PHPMyAdmin来在相关网站的interwiki表中插入一行就可以,例如:
INSERT INTO `postcode`.`jingleinterwiki` (
`iw_prefix` ,
`iw_url` ,
`iw_local` ,
`iw_trans`
)
VALUES (
'chn', '
前一阵子修改了MediaWiki中的一个PHP程序,去掉了全文检索结果中的文件大小、更新时间等信息,另外在Drupal中也是可以实现的,现在补充在Drupal中实现内部搜索结果页面中去掉发布者、发布时间等信息的办法。
办法很简单,就是在Drupal目录中找到这个文件:
drupal_root/modules/search/search-result.tpl.php
将其中第57行(Drupal 6.20)注释掉就可以:
在换用16核CPU、16G内存的服务器后,发现7200转硬盘不给力,就增加了多块10000转的迅猛龙硬盘,一台服务器上的4块硬盘分别放置系统及备份文件、Squid缓存文件、MySQL文件、Apache和HTML缓存文件,这样一般访问都不会有什么压力。
但在我们持续导入数据、批量修改模板的过程中,发现放置Squid缓存文件的硬盘有时占用达到100%,影响正常访问,于是我们修改Squid设置文件,只使用几个G内存作为Web反向加速的缓存,关闭了几十G、上百G的Squid磁盘缓存,这样可以避免大量小文件的寻道操作。
接下来又发现系统
摆弄MediaWiki好几年了,都尽量避免碰PHP程序,在不得已的情况下,对皮肤文件、少数配置参数等地方进行过有限的修改。去年底开始尝试改用Drupal系统,不可避免遇到需要修改PHP程序的地方,经过一段时间的摸索,发现PHP也不是想象中的那么难,不过是另一种程序语言而已,要精通不容易,但上手还是不太难的。
在Drupal中调用PHP程序摸出
为了有利于搜索引擎优化(SEO),有时修改页面标题(Title)是很必要的,在MediaWiki中我一般是修改新建页面的标题来实现,但无法修改已经存在页面的标题,在Drupal中前一阵子找到一个第三方模块“Page Title”可以实现在Title中插入Node参数、CCK字段等信息,还算是方便,但无法插入需要变换的内容。为了实现插入没有的CCK字段内容,我还尝试过专门设立几个Computed字段作为过渡,不过这样还是有些麻烦。
前两天找了叫“drupal_set_title”的函数,既然是直接调用php函数,那
以前用MediaWiki的时候,为了实现面包屑导航条的功能,我采用在Wiki页面中插入HTML代码的方式来实现,效果看上去还不错,遇到过一些站长找我问是如何实现的,其实自己看页面代码就可以知道,Wiki的源代码都是公开的,照着复制或者稍微改改就可以用了。
改用Drupal后,找到一个叫“Custom Breadcrumbs”的第三方模块,可以比较简单地调用CCK中的字段或者Node的一些属性参数来实现导航功能,不过感觉不太灵活,例如CCK、Node中没有的参数就无法插入。
今天找了一个叫“d