- 主题:本站内容主要是本人关注的互联网行业及个人爱好方面的主题,包括AdSense💲、MediaWiki👨💻、Drupal💻、马拉松🏃、架子鼓🥁等。
- 书讯:本人新书2018年12月出版《Google AdSense实战宝典 - 第二版📘》,欢迎关注。
Drupal的Views是一个强大的工具,其中的FILTER CRITERIA用于设置过滤条件。最近在创建一个中文成语英文解释词典的时候,原始数据包含了英文和中文字词,但我们在列表的时候只希望出现4字以上中文成语,就需要设置过滤条件,用正则表达式更方便来设置条件,我们试了一阵子,最后这样设置:
过滤条件设置了两条:
我们使用LAMP结构搭建网站已经有12年了,前面很多年PHP都是没有加缓存优化,CPU很吃力,只能拿硬件扛,16核CPU算是一般的配置。2014年我们才安装了PHP代码缓存的APC模块,还在Drupal单服务器设置Memcache缓存,APC对Web服务器CPU的压力降低了很多,Memcache对于MySQL的压力降低了很多。
再后来服务器搬迁到阿里云,系统安装的PHP版本是5.6.x,自带了OPCache,只需要在php.ini中开启就可以,使用起来效果也不错。
安装和配置办法我就不复制过来了。我们自己最近遇到CPU占比持续达到100
Memcache几年前我们就开始在Drupal站上启用,对于降低数据库负载的作用很明显,偶尔会出现Memcache自己停了需要重启Memcache服务的情况,但很少很少,几个月也难得一次。
6月底开始申请熊掌号后,重新提交URL、提交MIP版本/AMP版本,带来大量百度爬虫,服务器负载明显增高,另外其它采集者也多起来了,导致我们网站有一阵子总是卡住,甚至随机出现白屏打不开的情况,这种白屏故障会一直持续,直到用drush cc all清理缓存后恢复。
这对网站的访问影响太大了,如果没有及时发现,可能几个小时、半天都打不开,仔细查看RDS的
الصفحة الرئيسية
تم إنشاء الموقع في عام 1998. وهو يوفر بشكل رئيسي رمز منطقة هاتفية دولية ومحلية للمسافات البعيدة وإحالة للهاتف المحمول وخدمة الاستفسار عن رقم الهاتف الخاص. بعد التحسين المستمر والتوسع ، قدمت خدمة رمز المنطقة ورقم الاستعلام ذات الصلة لمئات الدول والمناطق ب
反采集一直都是我们需要进行的工作,特殊是国内互联网行业抄袭风气太盛,其实我们不介意这些采集者把我们原创内容采过去,反正采集者也影响不了我们自己多少,但老是导致我们服务器资源过载就很烦了。
以前一般用“Apache中设置屏蔽IP地址和URL网址来禁止采集”,高级一些的用法记录在“识别User Agent屏蔽一些Web爬虫防采集”,中途还专门“自己编写网站防采集程序”,但用起来也有些不完善。
这两个月提交百度熊掌号、MIP/AMP后,正常的爬虫多起来,流量也多一些,跟着
我们的百度联盟账号被封后,申诉解封了,就还是继续投放,也有一定的收益,一直说还要再详细对比一下的,拖了一段时间,今天花时间专门去进行了多项对比,下面记录分享要点。
1、比较国内站adsense和baidu联盟三个广告位的eCPM结果:
- 顶部链接:
- 百度 - 手机版 20:2 ¥4.16
- adsense - responsive link ¥0.28
- 结论:相差很大,百度多10倍以上
- 中部广告:
我们有个数据量很大的美国5+4位邮政编码系列网站,一共4千5百多万数据,分散到51个州的子网站,每个站少的几万,多的数百万,平均大几十万,搭建的时候用的Drupal 6,好像有个Import模块来进行导入成为node,导入就花了好长时间,后来要升级到Drupal 7的时候更是痛苦,经常因为数据量太大无法使用常规的升级方式迁移成功,中途总是中断,后来一个一个站、甚至逐个字段编程进行转移,前后进行了好几个月。
数年后购买了新的来源数据,又进行比对、补充导入,也是花了几个月时间,今年进行了重新分析改版处理,仅重新生成网站地图就需要好些天。而这样大数据量的网站也常常造
我们很早前就做了部分阿拉伯语网站,主要都是靠Google翻译进行的,找翻译工作帮我们矫正过一次,到现在也积累了一些用户和流量,这次专门找了阿拉伯语专业学生来实习帮我们校对。
因为以前我们自己完全看不懂阿拉伯文,都是直接复制粘贴到网站中、模板程序中,所以一些错误在所难免,而我们自己也无法发现。这次实习生来了用户,除了阿拉伯语方面发现的问题以外,在阿拉伯语网站中存在英文、数字、标点符合顺序混乱是发现的又一大类问题。
例如这个美国5+4位邮编站还有一些阿拉伯语用户:
- نيويورك الولايات الم
2016年11月为了宣传我们的IP查询网站,添加了“Drupal网站中显示留言者的IP地址”功能,MediaWiki站也通过修改相关程序来实现,但有用户反映不希望自己的IP地址暴露出来,特别是在查号吧这个网站,一些曝光骗子号码的匿名用户更是不愿IP暴露、引起可能的打击报复麻烦。
今天去进行了两个修改,一个是正常的页面显示中把IP地址后两位数字屏蔽,这是通过修改includes/OutputPage.php来实现的:
public function addHTML( $text ) { //jamesqi 2
《Google AdSense实战宝典》第二版(副标题:用谷歌广告联盟出海赚美元)的初稿已经出来,明天交给出版社去,预计10月下旬可以出版发行。从第一版到第二版的8年时间里我也接触了很多AdSense发布商或者想做AdSense的朋友,少部分踏实做的赚到了钱,大部分想走捷径的没有赚到钱,所以我要在这本书一翻开的地方用一整页来强调:
扉页:
作者看到太多想走捷径做Google AdSense的国人了,太多人都是尝试各种作弊手法,一段时间后账号被封,一分钱没有赚到,网站内容、网络技术没有一点沉淀