要想分下网站日志,我们还需要一款日志分析软件。找了几款软件都不太好用,最后搜索到了一款 logviewer pro的小软件,用起来还不错。
以上信息我们不用全都分析,只取自己需要的那部分内容综合分析就行了。
再举个例子 ,还是上图中的一行拿过来
同样的百度蜘蛛,360蜘蛛,头条蜘蛛都会留下类似的日志痕迹。每一家蜘蛛留下的记号都不相同,但是都有自己品牌的名字。
当然了有很多是假的搜索引擎蜘蛛,所以我们要学会分析真假蜘蛛。
Windows系统按下键盘 视窗+R,在弹窗输入 cmd命令。在如下图的命令行中输入
命令和IP地址之间有空格。
这样就得到了下图所示的服务器名称,里面有 googlebot字样,再结合网络上搜索到的这个 IP段是google蜘蛛的结果,综合判断这是真的google蜘蛛。
Http状态码特别多,200,300,400或500都可以细分出很多常见状态码数字。我们只要大概的知道这几个常见数字代表什么含义:200代表成功抓取,404代表错误链接,500代表服务器出错。大体知道这几个数字含义就行了,不用记住所有的。而如果想要了解更多http状态码含义可以问度娘搜索一下。
如果你的网站日志中总是出现 404错误代码,就要去查查这些页面都发生什么情况了,为什么总是提示 404,这样就有助于我们改进网站问题。
遇到恶意 IP可以添加到服务器防火墙IP黑名单中,比如使用安全狗等软件。你也可以在宝塔面板防火墙中屏蔽恶意IP。
宝塔防火墙有系统防火墙(网络层面)和付费防火墙(软件层面),网络层面大于软件层面,可以这么理解:网络层面是在外层最先接触到访问流量,如果你在这里限制了那么这些IP是无法访问服务器的。软件层面是服务器中的某个web应用,付费防火墙仅限制对这个web应用的访问与否。
拉黑IP难免会遇到“误伤”的时候,从IP黑名单中删除就行了。
本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕,E-mail:xinmeigg88@163.com
本文链接:http://www.dbeile.cn/news/209.html