首页网页制作网络编程脚本专栏数据库网站运营网络安全平面设计 CMS教程

利用php抓取蜘蛛爬虫痕迹的示例代码

所属分类：网络编程 / PHP编程阅读数： 860

收藏 0赞 0分享

前言

相信许多的站长、博主可能最关心的无非就是自己网站的收录情况，一般情况下我们可以通过查看空间服务器的日志文件来查看搜索引擎到底爬取了我们哪些个页面，不过，如果用php代码分析web日志中蜘蛛爬虫痕迹，是比较好又比较直观方便操作的！下面是示例代码，有需要的朋友们下面来一起看看吧。

示例代码

<?php
//获取蜘蛛爬虫名或防采集
function isSpider(){
  $bots = array(
          'Google'  => 'googlebot',
          'Baidu'    => 'baiduspider',
          'Yahoo'    => 'yahoo slurp',
          'Soso'    => 'sosospider',
          'Msn'    => 'msnbot',
          'Altavista'  => 'scooter ',
          'Sogou'    => 'sogou spider',
          'Yodao'    => 'yodaobot'
      );
  $userAgent = strtolower($_SERVER['HTTP_USER_AGENT']);
  foreach ($bots as $k => $v){
    if (strstr($v,$userAgent)){
      return $k;
      break;
    }
  }
  return false;
} 
//获取哪种蜘蛛爬虫后保存蜘蛛痕迹。
//根据采集时HTTP_USER_AGENT是否为空来防止采集
//抓蜘蛛爬虫
$spi  = isSpider();
if($spi){
  $tlc_thispage  = addslashes($_SERVER['HTTP_USER_AGENT']);
  $file      = 'robot.txt';
  $time      = date('Y-m-d H:i:s',mktime());
  $handle      = fopen($file,'a+');
  $PR        = $_SERVER['REQUEST_URI'];
  fwrite($handle, "Time:{$time} ROBOT:{$spi} AGENT:{$tlc_thispage} URL:{$PR} \n\r");
  fclose($handle);
}
?>

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作能带来一定的帮助，如果有问题大家可以留言交流。

更多精彩内容其他人还在看

利用Fix Rss Feeds插件修复WordPress的Feed显示错误

这篇文章主要介绍了利用Fix Rss Feeds插件修复WordPress的Feed显示错误的方法,需要的朋友可以参考下

收藏 0赞 0分享

WordPress中给文章添加自定义字段及后台编辑功能区域

这篇文章主要介绍了WordPress中给文章添加自定义字段及后台编辑区域的相关函数,分别简单讲了add_post_meta和add_meta_box 的用法,需要的朋友可以参考下

收藏 0赞 0分享

学习php设计模式 php实现模板方法模式

这篇文章主要介绍了php设计模式中的模板方法模式，使用php实现模板方法模式，感兴趣的小伙伴们可以参考一下

收藏 0赞 0分享

UPUPW 更新 64 位 Apache 系列 PHP 7.0 正式版

这篇文章主要介绍了UPUPW 更新 64 位 Apache 系列 PHP 7.0 正式版的相关资料,需要的朋友可以参考下

收藏 0赞 0分享

详解PHP的Yii框架中日志的相关配置及使用

这篇文章主要介绍了PHP的Yii框架中日志的相关配置及使用,包括bug追踪以及数据库查询耗时记录等,需要的朋友可以参考下

收藏 0赞 0分享

thinkPHP中create方法与令牌验证实例浅析

这篇文章主要介绍了thinkPHP中create方法与令牌验证,以一个简单实例形式分析了thinkPHP中create方法与令牌验证增加表单安全性的相关技巧,代码备有详尽注释说明,需要的朋友可以参考下

收藏 0赞 0分享

Linux系统下使用XHProf和XHGui分析PHP运行性能

这篇文章主要介绍了Linux系统下使用XHProf和XHGui分析PHP运行性能的方法,该方案支持Apache与Nginx服务器及多种数据库环境,需要的朋友可以参考下

收藏 0赞 0分享

PHP的Yii框架的常用日志操作总结

这篇文章主要介绍了PHP的Yii框架的常用日志操作总结,包括消息的过略和格式化等基本内容,需要的朋友可以参考下

收藏 0赞 0分享

PHP判断手机是IOS还是Android

这篇文章主要介绍了PHP判断手机是IOS还是Android的三个示例，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下

收藏 0赞 0分享

学习php设计模式 php实现观察者模式(Observer)

这篇文章主要介绍了php设计模式中的观察者模式，使用php实现观察者模式，感兴趣的小伙伴们可以参考一下

收藏 0赞 0分享

查看更多

网络赚钱

更多

站长故事

更多

建站极客

合作伙伴

外卖点餐小程序

QCMS建站系统

小程序SAAS平台

松江网站建设

站长素材网

合同模板网

好听名字网

在线工具

网站地图

建站极客移动版

聚合全网技术文章，根据你的阅读喜好进行个性推荐

© 2012 - 2020 www.zhanzhang360.cn Some Rights Reserved.

沪ICP备13040166号-22