以前我们网站去获取IP地址相关Whois信息都是在Linux命令行下运行Whois命令,到这种方式获取的是文本信息,很难解析成结构化数据,今天去查了一下,2019年开始RDAP(Registration Data Access Protocol)注册数据访问协议已经在使用了,可以获取json数据,这就太方便了,下面做一些笔记。
概念:
- 维基百科:Registration Data Access Protocol
- ICANN:Registration Data Access Protocol
以前我们网站去获取IP地址相关Whois信息都是在Linux命令行下运行Whois命令,到这种方式获取的是文本信息,很难解析成结构化数据,今天去查了一下,2019年开始RDAP(Registration Data Access Protocol)注册数据访问协议已经在使用了,可以获取json数据,这就太方便了,下面做一些笔记。
概念:
去年底我们就规划了EmojiAll网站以后要做数据分析和可视化,2月份我们逐步推出了《Emoji排行榜》、《Emoji关系图》、《Emoji标签云》几个重要功能,这些在内容、设计等方面都有自己独特的东西,其中SVG图形技术运用也是为我们网站增色不少。✌️
而此后还有一项更“高端”的功能:Emoji情绪分析,我们一直在做。去年曾经有一位武汉大学在读博士生与我们见面交流了Emoji方面的信息,她们是对Emoji的社会应用有研究,发表过相关学术论文。我们通过网上搜到国外一些大学也有类似研究和成果,通过大数据分析、人工智能来对社交媒体中的Emoji进行
邮编库这个网站的历史够长了,前后超过20年,可以查看网站上的“关于我们”了解详情。2006年以前采用FrontPage来制作的网页,2007年开始改用MediaWiki至今,这个Wiki软件的采用也是阴差阳错,现在看来不是很合适,因为我们网站并不是像维基百科那样主要是由网友编辑,但使用了很多年后,其方便我们自己人员编辑、方便用户留言等方面也还是有一定好处,我们自己以及老用户也已经习惯。
但有一点一直是个问题,就是页面太简陋、陈旧,甚至会给新同事和新用户留下粗糙、丑陋的不良印象。因为人少事多,一直没有下决心来进行大的改版,拖了好些年。去年我们的e
做AdSense联盟十多年了,遇到过几次恶意点击的情况,但没有因此被误封号过,只是月底的收入中扣除了无效流量,说明Google的判断还是很精准的,站长用AdSense起来放心,只要不是自己作弊,不用担心被封号。
做百度联盟也有十多年了,中途被封号过
好些年前,我们的网站就用PHP程序来动态生成robots.txt和sitemap.xml,其中网站地图用php来动态生成而没有保存成文件,因为有些站网址太多,怕sitemap文件过多、过大而占用磁盘空间。虽然动态生成会对数据量很大的数据库有一定影响,但经过一些优化还是可以承受的。但URL很多的网站还存在另外一个问题,就是sitemap被大量爬取,占用带宽,这个问题因为不是很普遍、很迫切,所以就一直放着没有动,只是把有一个站的php程序中添加了延时来让爬虫慢一点。
去年就开始使用CloudFlare为网站加速,因为当时那个网站与访问者IP地址关系不大,所以没有特别处理CDN代理IP和访问者真实IP。今年添加的一个网站在做爬虫屏蔽的时候与用户真实IP有关,临时可以用简易的方式在PHP程序中获取:
if (isset($_SERVER['HTTP_CF_CONNECTING_IP'])) { $_SERVER['REMOTE_ADDR'] = $_SERVER['HTTP_CF_CONNECTING_IP']; } elseif (isset($_SERVER['
前几天写了一篇《关闭MediaWiki网站上的AMP版本、MIP版本》,其实我们的Drupal网站最近也在清理,去掉了一些AMP和MIP版本,去掉的考虑和标准有几条:
有些站虽然AMP、MIP还有一定流量和收入,但如果取消后301跳转到对应的手机版或者响应式版本后,流量和收入应该也没有特别影响,甚至还有可能提高。
以前为了在MediaWiki网站上实现AMP版本和MIP版本可是费了不少力气,更早是用Vector做电脑版、WPtouch做手机版,然后用一个简单的Modern皮肤改为了AMP的皮肤,再后面又复制到MIP皮肤。
应该来说我们做AMP、MIP版本算是很快的,也找住了一波流量红利,但百度在把重点转向熊掌号后(再之后熊掌号也被放弃了,重点转向智能小程序),MIP慢慢淡化了,后来又取消了MIP的CDN缓存,沦为可有可无的东西。再就是我们网站自己开始采用免费或付费的CDN后,AMP的搜索引擎缓存优势也不明显了,反而是限制了我们网站的一些功能、维持一个版本增多了开发工作量。
去年我们将EmojiAll网站接入了CloudFlare,这个网站是用Drupal来搭建的,也遇到一些清除缓存等小问题,都是同事们逐步发现、逐步解决。最近陆续接入了其它一些域名,我也多花了一些时间来了解,下面记录一些要点。
先去网上搜了相关关键词,发现Drupal有一个专门的CloudFlare模块,其主要功能是:
去年10月我们在 www.emojiall.com 开启了CloudFlare的缓存和防护功能,当时用的免费到,直到今年才改为了付费的专业版,中间也摸索了很多地方。对我们来说最大的问题是不支持中国节点,也就是说中国浏览者还是需要访问放在国外的服务器上缓存内容。
于是我们也在寻找合适的国内CDN服务商,以前曾经尝试过阿里云的CDN、全站加速,这次从CloudFlare网站中的帮助文件看到百度云加速是他们在中国的合作伙伴,也提供免费套餐,于是就去看了看,发现百度云加速与CloudFlare有很多相似之处。
首先那我的个人博客作为接入百度云加速的首个尝试
2002-2023 v11.7 a-j-e-0