当前位置

屏蔽

这是屏蔽分类的页面,点击下面标题查看详细文章内容:

不要误屏蔽百度MIP的爬虫

James Qi 在 2018年12月18日 - 22:03 提交

  我们很早前就开始做百度MIP版本页面了,通过这种方式也获得了流量的增长和比较好的用户体验。但最近流量不太稳定,有的站MIP流量曾经很高,但后来跌落很厉害。还有的站MIP流量下降后,对应的普通WEB版流量上升。

  我们做了各种推测和试验,今天发现了一条重要线索:百度的MIP爬虫曾经被我们屏蔽。

自由标签:

反查主机域名来屏蔽爬虫采集

James Qi 在 2018年12月14日 - 15:56 提交

  最近新增了一些网站内容,结果正常的访问者还没有开始来,采集的爬虫就来了,真像是嗜血的鲨鱼,发现哪里有美味马上就盯上了😰。

  近期也看了一些关于反采集的文章,世上没有完美、一劳永逸的反采集办法,成了与采集者的对峙,双方不断变换对抗办法,成了一种体力活。

Apache中设置屏蔽IP地址和URL网址来禁止采集

James Qi 在 2012年11月23日 - 11:31 提交

  只要是建有数据量比较多的网站,几乎不可避免采集的情况,这方面我们已经有多年的对付经验,主要是通过分析Web访问日志,找到采集的规律,相应来设置屏蔽IP地址或者URL网址来解决。

订阅 RSS - 屏蔽