当前位置:首页 > 资讯 > 正文

什么是网站日志_如何分析网站日志_发现恶意IP如何屏蔽拉黑

什么是网站日志_如何分析网站日志_发现恶意IP如何屏蔽拉黑

  • 新建网站发布后一段时间没看到搜索引擎收录,这个时候需要下载网站日志分析搜索引擎是否抓取过内容,是不是我们自己的原因屏蔽了蜘蛛抓取等;
  • 原来网站排名还不错后来发现异常了,就要下载网站日志志看看搜索引擎这段时间过来抓取网站情况是否正常;
  • 发现网站被攻击或入侵,下载网站日志分析攻击IP的详细情况,攻击时间,攻击方式,攻击特征等;
网站日志去哪里下载?
  • 虚拟主机一般都去查找 /wwwlogs/ 这一类的目录,名气差不多都有 logs 字样;
  • 服务器、主机会在 /www/wwwlogs/这一类的目录中看到网站日志,比如宝塔面板就是这个目录下,在宝塔面板>安全,右侧的上方看到 Web日志就是了;
  • 虚拟主机和服务器要下载网站日志到本地,我们一般使用 ftp软件,宝塔面板也可以直接在上面提到的路径中下载;
  • 如果遇到网站日志尺寸过大,几百M甚至超过 1G了,可以用宝塔面板的日志切割功能分成小尺寸文件再下载;

要想分下网站日志,我们还需要一款日志分析软件。找了几款软件都不太好用,最后搜索到了一款 logviewer pro的小软件,用起来还不错。

以上信息我们不用全都分析,只取自己需要的那部分内容综合分析就行了。

再举个例子 ,还是上图中的一行拿过来

  • 203.208.60.98 – – [06/Sep/2020:16:42:09 +0800] “GET /21283.html HTTP/1.1” 200 9337 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”
  • 在2020年9月6日16:42:09秒的时候 IP为 203.208.60.98的google蜘蛛抓取了 /21283.html页面,抓取成功,页面大小9KB

同样的百度蜘蛛,360蜘蛛,头条蜘蛛都会留下类似的日志痕迹。每一家蜘蛛留下的记号都不相同,但是都有自己品牌的名字。

当然了有很多是假的搜索引擎蜘蛛,所以我们要学会分析真假蜘蛛。

Windows系统按下键盘 视窗+R,在弹窗输入 cmd命令。在如下图的命令行中输入

命令和IP地址之间有空格。

这样就得到了下图所示的服务器名称,里面有 googlebot字样,再结合网络上搜索到的这个 IP段是google蜘蛛的结果,综合判断这是真的google蜘蛛。

  • 200代表抓取成功;
  • 304自从上次请求后,请求的网页未修改过。服务器返回此响应时,不会返回网页内容;
  • 404代表抓取时这个链接不存在,所以给访问者就返回404;

Http状态码特别多,200,300,400或500都可以细分出很多常见状态码数字。我们只要大概的知道这几个常见数字代表什么含义:200代表成功抓取,404代表错误链接,500代表服务器出错。大体知道这几个数字含义就行了,不用记住所有的。而如果想要了解更多http状态码含义可以问度娘搜索一下。

如果你的网站日志中总是出现 404错误代码,就要去查查这些页面都发生什么情况了,为什么总是提示 404,这样就有助于我们改进网站问题。

遇到恶意 IP可以添加到服务器防火墙IP黑名单中,比如使用安全狗等软件。你也可以在宝塔面板防火墙中屏蔽恶意IP。

宝塔防火墙有系统防火墙(网络层面)和付费防火墙(软件层面),网络层面大于软件层面,可以这么理解:网络层面是在外层最先接触到访问流量,如果你在这里限制了那么这些IP是无法访问服务器的。软件层面是服务器中的某个web应用,付费防火墙仅限制对这个web应用的访问与否。

拉黑IP难免会遇到“误伤”的时候,从IP黑名单中删除就行了。

最新文章