互聯網上的垃圾制造者層出不窮,總在設法搞些破壞,我們2019年開始在Drupal網站啟用Google_Recaptcha屏蔽垃圾,起到一定作用,但也還是有漏網之魚,通過Drupal的“聯系我們”表單發送垃圾郵件或者在留言的地方發布垃圾廣告。
更有甚者還發來垃圾郵件,推薦他們的反屏蔽手段:
互聯網上的垃圾制造者層出不窮,總在設法搞些破壞,我們2019年開始在Drupal網站啟用Google_Recaptcha屏蔽垃圾,起到一定作用,但也還是有漏網之魚,通過Drupal的“聯系我們”表單發送垃圾郵件或者在留言的地方發布垃圾廣告。
更有甚者還發來垃圾郵件,推薦他們的反屏蔽手段:
6月份開始在公司内部培訓、提倡做一些結構化數據和Google富媒體搜索結果的深入研究。前些天記錄了一篇《Google富媒體搜索結果之站點鍊接搜索框 Sitelinks searchbox》,今天再記錄一下FAQ常見問答:
先來看看官方的Google搜索中心的文檔:使用結構化數據标記 FAQ。
schema.org 上提供了 
EmojiAll.com這個網站是2019年開始創辦的,從一開始就在原創性方面下了的我們最大的力氣,專門人員在各種語言撰寫Emoji相關内容,也看到有人模仿或者抄襲我們。
2021年我們EmojiAll網站申請、辦理了軟件著作權登記和作品登記,并且也開始申請注冊商标。™️
而在申請注冊商标的時候,居然在商标局網站上搜索到另外一個廈門的公司申請emojiall的商标,而這個公司也正是模仿或者跟風我們做emoji相關内容的網站之一,模仿、跟風也就罷了,還要申請我們的域名emojiall作為他們的商标就過分了。😠
我們咨詢
6月份在做IPSHU網站頁面改版的時候,使用了常見問答FAQ的結構化數據,并且對Google富媒體搜索結果進行了進一步的研究,當時給同事們還進行了一次名為“高級SEO及結構化數據”的培訓交流,目錄如下:
同事在使用工具對網站進行檢查的時候遇到這種報錯:
查看對應網頁的html代碼類似如下:
<!DOCTYPE html> <html lang="zh-hant" dir="ltr"> <head> <meta http-equiv="Content-Type" content="text/html; c
最近用Google Search Console中的URL檢測查看我們的網站,發現一些問題,一些站的首頁使用的是Drupal中的node/1,在沒有設置别名網址(alias path)或者别名網址不是/的情況(例如下圖中的/page/首頁_(Home))下,規範網址(canonical url)就成了node/1本身或者其它别名網址(例如/page/首頁_(Home)),而Google選擇的是真正的首頁。
近期我們發現Apache日志中2a06:98c0:3600::103這個IPv6地址出現非常多,User Agent一般都是顯示的googlebot,我們剛開始以為是Google爬蟲使用了IPv6地址,但有些User Agent又不是googlebot,所以有點迷惑,因為這是來自Cloudflare的訪問,所以我們想可能是一個反向代理IP,想獲取其背後真實訪問者的IP地址。🤔️
查看以前博文《Apache安裝mod_remoteip獲取CDN背後訪問者真實IP》,我們的httpd.conf中設置了:
RemoteIPHeader CF-Connecting-I
去年以來我們的Apache日志中總看到一個奇怪的IP地址:253.102.157.193,查詢歸屬地是一個E類保留地址,查詢Whois是預留未來使用,而User Agent一般都是顯示的googlebot,我們還以為Google有什麼特權可以使用保留地址。
最近發現這個地址訪問的頁面越來越多,可以導緻服務器不堪重負,就花時間仔細去了解,才發現這不是訪問者的真實IP,而是Cloudflare對IPv6地址轉換的一個僞IPv4地址,Cloudflare的面闆中在這裡設置:
上一篇博客《有人惡意刷百度關鍵詞陷害我們網站》寫的是百度對一些黑帽SEO手段判斷的不準确,導緻我們網站被陷害。百度的作弊識别算法還不夠完善,需要人工去發現、處理。我們覺得Google的作弊識别算法應該更好,但最近我們網站上發生的問題讓我們看到Google的算法也是有漏洞可以鑽的。😒
去年6月我們有一個站在Google的核心算法更新後就遇到流量下降,直到11月核心算法再次更新後流量才恢複,但核心算法的更新為什麼會影響我們網站流量、具體問題出在甚麼地方?這些問題一直沒有搞懂。
今年5月Google的核心算法更新後,我們這個站的流量再次
去年11月份的時候,我們陸續有幾個網站發現流量大幅減少,一開始還以為是正常波動或其它常規原因而沒有引起重視,直到幾周後來自百度搜索的流量持續大幅下降、好幾個網站都情況類似,才去深入檢查原因。🕵️
結果在百度資源平台中發現"流量與關鍵詞"的熱門關鍵詞裡面有些明顯異常的數據,例如:
紅框中的一些關鍵
2002-2023 v11.7 a-j-e-0