以前我們網站去獲取IP地址相關Whois信息都是在Linux命令行下運行Whois命令,到這種方式獲取的是文本信息,很難解析成結構化數據,今天去查了一下,2019年開始RDAP(Registration Data Access Protocol)注冊數據訪問協議已經在使用了,可以獲取json數據,這就太方便了,下面做一些筆記。
概念:
- 維基百科:Registration Data Access Protocol
- ICANN:Registration Data Access Protocol
以前我們網站去獲取IP地址相關Whois信息都是在Linux命令行下運行Whois命令,到這種方式獲取的是文本信息,很難解析成結構化數據,今天去查了一下,2019年開始RDAP(Registration Data Access Protocol)注冊數據訪問協議已經在使用了,可以獲取json數據,這就太方便了,下面做一些筆記。
概念:
去年底我們就規劃了EmojiAll網站以後要做數據分析和可視化,2月份我們逐步推出了《Emoji排行榜》、《Emoji關系圖》、《Emoji标簽雲》幾個重要功能,這些在内容、設計等方面都有自己獨特的東西,其中SVG圖形技術運用也是為我們網站增色不少。✌️
而此後還有一項更“高端”的功能:Emoji情緒分析,我們一直在做。去年曾經有一位武漢大學在讀博士生與我們見面交流了Emoji方面的信息,她們是對Emoji的社會應用有研究,發表過相關學術論文。我們通過網上搜到國外一些大學也有類似研究和成果,通過大數據分析、人工智能來對社交媒體中的Emoji進行
郵編庫這個網站的曆史夠長了,前後超過20年,可以查看網站上的“關于我們”了解詳情。2006年以前采用FrontPage來制作的網頁,2007年開始改用MediaWiki至今,這個Wiki軟件的采用也是陰差陽錯,現在看來不是很合适,因為我們網站并不是像維基百科那樣主要是由網友編輯,但使用了很多年後,其方便我們自己人員編輯、方便用戶留言等方面也還是有一定好處,我們自己以及老用戶也已經習慣。
但有一點一直是個問題,就是頁面太簡陋、陳舊,甚至會給新同事和新用戶留下粗糙、醜陋的不良印象。因為人少事多,一直沒有下決心來進行大的改版,拖了好些年。去年我們的e
做AdSense聯盟十多年了,遇到過幾次惡意點擊的情況,但沒有因此被誤封号過,隻是月底的收入中扣除了無效流量,說明Google的判斷還是很精準的,站長用AdSense起來放心,隻要不是自己作弊,不用擔心被封号。
做百度聯盟也有十多年了,中途被封号過
好些年前,我們的網站就用PHP程序來動态生成robots.txt和sitemap.xml,其中網站地圖用php來動态生成而沒有保存成文件,因為有些站網址太多,怕sitemap文件過多、過大而占用磁盤空間。雖然動态生成會對數據量很大的數據庫有一定影響,但經過一些優化還是可以承受的。但URL很多的網站還存在另外一個問題,就是sitemap被大量爬取,占用帶寬,這個問題因為不是很普遍、很迫切,所以就一直放着沒有動,隻是把有一個站的php程序中添加了延時來讓爬蟲慢一點。
去年就開始使用CloudFlare為網站加速,因為當時那個網站與訪問者IP地址關系不大,所以沒有特别處理CDN代理IP和訪問者真實IP。今年添加的一個網站在做爬蟲屏蔽的時候與用戶真實IP有關,臨時可以用簡易的方式在PHP程序中獲取:
if (isset($_SERVER['HTTP_CF_CONNECTING_IP'])) { $_SERVER['REMOTE_ADDR'] = $_SERVER['HTTP_CF_CONNECTING_IP']; } elseif (isset($_SERVER['
前幾天寫了一篇《關閉MediaWiki網站上的AMP版本、MIP版本》,其實我們的Drupal網站最近也在清理,去掉了一些AMP和MIP版本,去掉的考慮和标準有幾條:
有些站雖然AMP、MIP還有一定流量和收入,但如果取消後301跳轉到對應的手機版或者響應式版本後,流量和收入應該也沒有特别影響,甚至還有可能提高。
以前為了在MediaWiki網站上實現AMP版本和MIP版本可是費了不少力氣,更早是用Vector做電腦版、WPtouch做手機版,然後用一個簡單的Modern皮膚改為了AMP的皮膚,再後面又複制到MIP皮膚。
應該來說我們做AMP、MIP版本算是很快的,也找住了一波流量紅利,但百度在把重點轉向熊掌号後(再之後熊掌号也被放棄了,重點轉向智能小程序),MIP慢慢淡化了,後來又取消了MIP的CDN緩存,淪為可有可無的東西。再就是我們網站自己開始采用免費或付費的CDN後,AMP的搜索引擎緩存優勢也不明顯了,反而是限制了我們網站的一些功能、維持一個版本增多了開發工作量。
去年我們将EmojiAll網站接入了CloudFlare,這個網站是用Drupal來搭建的,也遇到一些清除緩存等小問題,都是同事們逐步發現、逐步解決。最近陸續接入了其它一些域名,我也多花了一些時間來了解,下面記錄一些要點。
先去網上搜了相關關鍵詞,發現Drupal有一個專門的CloudFlare模塊,其主要功能是:
去年10月我們在 www.emojiall.com 開啟了CloudFlare的緩存和防護功能,當時用的免費到,直到今年才改為了付費的專業版,中間也摸索了很多地方。對我們來說最大的問題是不支持中國節點,也就是說中國浏覽者還是需要訪問放在國外的服務器上緩存内容。
于是我們也在尋找合适的國内CDN服務商,以前曾經嘗試過阿裡雲的CDN、全站加速,這次從CloudFlare網站中的幫助文件看到百度雲加速是他們在中國的合作夥伴,也提供免費套餐,于是就去看了看,發現百度雲加速與CloudFlare有很多相似之處。
首先那我的個人博客作為接入百度雲加速的首個嘗試
2002-2023 v11.7 a-j-e-0