php IIS日志分析搜索引擎爬虫记录程序第1/2页

所属分类: 网络编程 / PHP编程 阅读数: 1835
收藏 0 赞 0 分享
使用注意:
  修改iis.php文件中iis日志的绝对路径
  例如:$folder=”c:/windows/system32/logfiles/站点日志目录/”; //后面记得一定要带斜杠(/)。
  ( 用虚拟空间的不懂查看你的站点绝对路径?上传个探针查看!
  直接查看法:http://站点域名/iis.php
  本地查看法:把日志下载到本地 http://127.0.0.1/iis.php )
  注意:
  //站点日志目录,注意该目录必须要有站点用户读取权限!
  //如果把日志下载到本地请修改143行的网址为您网站的网址,此操作不是必要操作,不影响分析结果。
  //修改文件名称iis.php 需要同时修改对应代码 ctrl+h 把 iis.php全部替换成您要修改的文件名 否则程序运行出错。
  //如果iis日志文件过大,可能会导致程序超时!同时也不建议大家使用! 
以下是PHP源代码:
[code]
<?php
 /*
  牛仔IIS日志蜘蛛爬行记录分析器 V1.1(PHP GB2312 版)
  作者:牛仔
  QQ:172379201
  Email:17gd@163.com
 */
 //===================================================
  header("content-type:text/html; charset=gb2312");
 //站点日志目录,注意该目录必须要有站点用户读取权限!
 $folder="C:/WINDOWS/system32/LogFiles/W3SVC1155699908/";//后面记得一定要带斜杠!
 $pagesize = 25;//设置分页显示条数!
 //=========================
$type = addslashes($_GET['type']);
if ($type)$type = base64_decode($type);
$showfile = addslashes($_GET['showfile']);
$page = addslashes($_GET['page']);
if (!$page)$page=1;
//============================
 //打开目录
 if (!$type){
    if (file_exists($folder))
    {
        $fp=opendir($folder);
        while(false!=$file=readdir($fp))
        {
        if($file!='.' &&$file!='..')
        {
            $file="$file";
            $arr_file[]=$file;
        }
        }
     if(is_array($arr_file))
     {
         for ($i=count($arr_file)-1;$i>=0;$i--)
         {
             $indexstr.="<tr><td height=\"25\" width=\"25%\">".date("Y-m-d",filectime($folder.$arr_file[$i]))."</td>
        <td height=\"25\" width=\"25%\" align=\"center\"><a href=\"iisfile.php?type=".base64_encode(Baiduspider)."&showfile=".$arr_file[$i]."\">百度(Baidu)</a></td>
        <td height=\"25\" width=\"25%\" align=\"center\"><a href=\"iisfile.php?type=".base64_encode(Googlebot)."&showfile=".$arr_file[$i]."\">谷歌(Google)</a></td>
        <td height=\"25\" width=\"25%\" align=\"center\"><a href=\"iisfile.php?type=".base64_encode(yahoo)."&showfile=".$arr_file[$i]."\">雅虎(yahoo)</a></td></tr>";
         }

   }
    closedir($fp);
    $html = indexhtml();
    $copy = mycopy();
    $html = str_replace("[showlog]",$indexstr,$html);
    $html = str_replace("[copy]",$copy,$html);
    echo $html;
}else{
        echo "该日志目录不存在或权限不足,请检查设置!";
        exit();
    }
 }elseif ($type=='Baiduspider'){
     echo show($type,$folder,$showfile,$page,$pagesize);
 }elseif ($type=='Googlebot'){
     echo show($type,$folder,$showfile,$page,$pagesize);
 }elseif ($type=='yahoo'){
     echo show($type,$folder,$showfile,$page,$pagesize);
 }

function show($type,$folder,$showfile,$page,$pagesize)
{
    if ($type=='Baiduspider')
    {
        $title='百度';
    }elseif ($type=='Googlebot'){
        $title='谷歌';
    }elseif ($type=='yahoo'){
        $title='雅虎';
    }
    if ($type&&$folder&&$showfile)
    {
        if(file_exists($folder.$showfile))
        {
        $fp= fopen($folder.$showfile,"r");
        }else{
            echo "该日志文件不存在,请检查设置!";
            exit;
        }
        $j=0;
        $y=0;
        $t=0;
        $h=0;
        while (!feof($fp))
        {
            $str = fgets($fp);
                $str =iconv("UTF-8","GB2312//IGNORE",$str);
            if(strpos($str,$type))
            {
                $j++;
                $temp[].=$str;
                $tmpcount = explode(" ",$str);
                if ($tmpcount[11]==200)$t++;
                if ($tmpcount[11]==304)$h++;
                if ($tmpcount[11]==404)$y++;
            }
        }
        fclose($fp);
        $count = count($temp);
        if ($page==1)
        {
            $countshow=$count;
            $mynum = $count-$pagesize;
        }else{
            $countshow =$count-($page*$pagesize-$pagesize);
            $mynum = $count-$page*$pagesize;
        }
        $pagecount =ceil(count($temp) / $pagesize);
        if ($page>=$pagecount)
        {
            $mynum = $pagecount;
        }
        $m=0;
        for ($i=$countshow-1;$i>=$mynum;$i--)
        {
            $num = explode(" ",$temp[$i]);
                $show.="
                    <tr>
                    <td heigth\"20\">".$num[0]." ".$num[1]."</td>
                    <td>".$num[9]."</td>
                    <td><a href=\"".rawurlencode($num[5])."\" target=\"_blank\">".$num[5]."</a></td>
                    <td>".$num[11]."</td>
                    </tr>";
        }
        unset($temp);
        $showpage = "<td colspan=\"4\" height=\"30\" align=\"center\">每页 ".$pagesize." 条 当前".$page."/$pagecount";
        $showpage.="  <a href=\"?type=".base64_encode($type)."&showfile=".$showfile."\">首页</a>";
        if ($page!=1)
        {
            $showpage.="  <a href=\"?type=".base64_encode($type)."&showfile=".$showfile."&page=".($page-1)."\">上一页</a>";
        }
        if ($page!=$pagecount)
        {
        $showpage.="  <a href=\"?type=".base64_encode($type)."&showfile=".$showfile."&page=".($page+1)."\">下一页</a>";
        $weei = "  <a href=\"?type=".base64_encode($type)."&showfile=".$showfile."&page=".($pagecount)."\">尾页</a>";
        }
        $showpage.=$weei."</td>";
        if ($show)
        {
        $html = pagehtml();
        $copy = mycopy();
        $htmltitle = "牛仔IIS日志蜘蛛爬行记录分析器-";//请保留,谢谢!
        $html = str_replace("[title]",$title,$html);
        $html = str_replace("[htmltitle]",$htmltitle,$html);
        $html = str_replace("[show]",$show,$html);
        $html = str_replace("[count]",$j,$html);
        $html = str_replace("
更多精彩内容其他人还在看

PHP setTime 设置当前时间的代码

在用JAVA中有个 Calendar 可设置当前时间,在PHP中找了半天,终于给我找到了这个函数,嘎嘎
收藏 0 赞 0 分享

PHP 图片水印类代码

这个类功能很强大,细节很棒!希望大家喜欢,并积极指点
收藏 0 赞 0 分享

PHP实现手机归属地查询API接口实现代码

主要使用curl实现,需要开启php对curl的支持
收藏 0 赞 0 分享

php 解决旧系统 查出所有数据分页的类

不同之处在于 没有实现分页的系统, 默认全部查出来 现在就要不能动后台的基础上进行操作 可以采用 相应的 如下 代码
收藏 0 赞 0 分享

PHP的简易冒泡法代码分享

基础的东西,感觉代码还不够简洁,希望高手指导修改,脚本之家特为大家多准备了几个,方便测试学习
收藏 0 赞 0 分享

PHP 利用AJAX获取网页并输出的实现代码(Zjmainstay)

PHP 利用AJAX获取网页并输出的实现代码,需要的朋友可以参考下
收藏 0 赞 0 分享

php数组一对一替换实现代码

以下方法能实现匹配关键词并分别对关键词做特殊处理的功能,需要的朋友可以参考下
收藏 0 赞 0 分享

关于UEditor编辑器远程图片上传失败的解决办法

因为单纯喜欢 UEditor 的界面,于是把项目中原先的编辑器进行的替换,但在后续操作中发现一些问题,就是远程图片上传
收藏 0 赞 0 分享

Windows下部署Apache+PHP+MySQL运行环境实战

本来嘛,部署PHP没什么复杂,找各种版本着实头疼了一下。
收藏 0 赞 0 分享

比较discuz和ecshop的截取字符串函数php版

网上看到一篇文章 discuz和ecshop截取字符串的两个函数,比较了一下两个版本的函数,都各有局限,只能在特定的前提下使用,但是学习一下有利于拓宽思路,了解PHP的扩展功能
收藏 0 赞 0 分享
查看更多