当前位置:首页 > 网站入侵 > 正文内容

什么是网站日志?什么样的场景下需要网站日志分析

访客3年前 (2022-04-14)网站入侵630

什么是网站日志什么是网站日志

网站日志对于网站建设的作用相当于监控摄像头对我们的房间,它可以记录下来,这一段时间里面所有的访客到我们家来访问的这个记录。

那我们一个网站每天有很多的用户来访问,同时每天还有很多的搜索引擎的蜘蛛来抓取日志,网站日志就能够把所有访客访问的情况,它用什么浏览器,什么操作系统,什么时间点来访问,访问了哪些页面?日志能够把这些数据全部记录下来。

同时呢搜索引擎的蜘蛛过来抓取,它是百度的搜索引擎的蜘蛛,还是google的还是360的?他们过来抓取,分别是什么时间点抓取的哪些页面,抓取的时候返回值是什么?是正常打开还是打不开,所有这些数据都能够记录到一个叫做日志的一个文件里。网站日志怎么分析1.网站日志下载及数据解读

分析网站日志,我们可以了解搜索引擎蜘蛛来到我们网站访问的时候,它获取到的信息是什么?网站跟搜索引擎之间它是什么样的一个对话,那网站日志怎么进行分析,从哪里下载到这个数据?

通过FTP访问网站的根目录。可以看到一个包含log的文件夹,这是存放日志的地方。

如何查看网站日志

下载、解压、打开日志文件,日志文件内容如:

61.135.168.22 – – [11/Jan/2009:04:02:45 +0800] “GET /bbs/thread-7303-1-1.html HTTP/1.1” 200 8450 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)” (注:百度,这部分为本文添加)

203.208.60.43 – – [11/Jan/2009:04:02:43 +0800] “GET /sns/space-13563-do-friend-view-me.html HTTP/1.1” 200 5162 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)” (注:Google)

202.160.178.21 – – [11/Jan/2009:04:02:44 +0800] “GET /sns/space.php?uid=323 HTTP/1.0” 200 7535 “-” “Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)” (注:雅虎)

65.55.220.217 – – [11/Jan/2009:04:02:57 +0800] “GET /ucenter/avatar.php?uid=12373&size= *** all&type=virtual HTTP/1.1” 301 – “-” “msnbot-media/1.1 (+http://search.msn.com/msnbot.htm)” (注:MSN)

65.55.109.46 – – [11/Jan/2009:04:02:57 +0800] “GET /sns/source/script_menu.js HTTP/1.0” 200 7219 “http:/sns/space-5755-do-blog-view-me.html” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)

大概就是上面这样密密麻麻的代码,但是这些代码怎么理解呢。比较好理解,我们看一下这一串日志的内容。前面这个ip代表今天来访问我们的网站,它是什么ip?是用户呢还是搜索引擎蜘蛛它都有一个ip,就是把他的ip记录下来。后面这个是一个时间点,什么时间来访问我们的网站?然后呢get就是抓取,抓取的哪一个文件呢?抓取了这个文件。

就是我们的域名下面的www.xxx.com/BBS什么什么,把这个文件抓取回去。抓取回去之后呢200,这是http状态码,它代表抓取成功,然后后面这个数字代表抓取了多少个字节?那200,然后这个8000多就是代表成功抓取了8000多个字节,也就是我们一个网页的大概的大小。那后面这一段就是代表蜘蛛,Baidu Spider就代表百度的蜘蛛,那这一句就代表这个内容是百度蜘蛛过来抓取,成功抓取了这么多个字节。

好,那我们再看这个上面就可以看出这个是谁的蜘蛛,yahuspider这是雅虎的它是这个时间点。然后这上面是谁的呢?google的,对吧?最下面看一下,里面没有看到这是哪一个具体的搜索引擎。那它是谁?你看这个有MSIE6.0。这就说明微软的ie6.0,这是一个用户在来抓取和访问的一个页面。

所以日志它就这样的一个文件,把每天每时每刻用户和蜘蛛来抓取我们网站的所有的情况,把它记录下来。

2.分析网站日志工具是什么?

这个日志文件,里面看起来密密麻麻的,非常的费劲。一般人是没法看明白的。而且如果我们的网站的访问量非常大的话,那这个日志往往会有几十兆几百兆甚至几个G的这个大小。那我们在电脑上打开的时候,有的时候电脑都会卡死掉。那么就会用到网站日志分析工具。

一般分析网站日志我们用光年日志工具分析.关于这个工具的使用,大家可以看一下这篇https://jingyan.baidu.com/article/15622f240a2e6afdfcbea58a.html百度经验了解一下,也可以去搜外的网站上看一下有免费的教程。

3.网站日志分析http状态码的解读

那刚才我们看这个日志的时候,看到里面有一些刚才提到一个词叫做http状态码,有看到200或者404,这个叫做HTTP状态码。

那这个http状态码,就是代表搜索引擎蜘蛛或者用户来访问我们网站的时候,它是什么样的一个状态?什么样的一个情况?200就代表成功抓取了,如果是404就代表过来抓取这个链接, 但是这个链接不存在,所以它就返回404。那状态码一般有200或者404,或者500等等这样的几个常见的数字,

我们不用了解特别多,只要大概的知道这么几个数字代表什么?200代表成功抓取,404代表错误链接,500代表服务器出问题了,大概了解这么几个数据就可以了,不需要把所有的都记住。那如果想要了解更多http状态码的这个知识的话,可以在百度上搜索一下,就可以查询到所有这些代码分别代表什么意思?什么样的场景下需要网站日志分析那么对于一个职业网站优化人员日志分析的能力是必须要掌握的。那什么样的场景下需要日志分析%2c下面我们看一下.

1.比如说我们创建了一个网站,提交给搜索引擎,后来很长时间没看到搜索引擎的收录,那这个时候我们就需要下载日志来分析一下,看搜索引擎到底有没有过来抓取。

2.我们网站原来可能排名很好, 后来突然间发现异常了,那我们就需要把日志下载下来看一下搜索引擎这段时间过来抓取我们网站的时候, 它是不是有一些异常情况。

3.网站如果被人攻击或者入侵,那也要下载一下网站日志来分析我们这个问题出在什么时间点,什么地方?

做网站日志分析,我们采用的一个 *** 一般是对比法, 就是我们网站和排名都正常的情况的日志, 和现在出问题的时候的日志,拿出来进行对比, 采用光年日志分析,把这个数据拿出来看一下,看问题出在哪一个目录,或者说哪一些页面, 然后再去针对性的去研究一下。

扫描二维码推送至手机访问。

版权声明:本文由黑客技术发布,如需转载请注明出处。

本文链接:https://w-123.com/43517.html

标签: 阅历杂谈

“什么是网站日志?什么样的场景下需要网站日志分析” 的相关文章

哥斯达黎加政府部分网络系统因遭黑客攻击 仍处于关闭状态

截至当地时间4月22日,因遭到国际黑客攻击,哥斯达黎加部分政府公共服务网络仍处于关闭状态。哥斯达黎加总统阿尔瓦拉多此前一天对此表示谴责。他表示,哥斯达黎加不会向国际黑客组织妥协,目前有关部门正在加紧网络管理技术升级,加固网络安全,同时评估泄漏数据的规模和损失,与国际组织和公司合作,加紧恢复受损系统。...

DLL 反制:安全研究人员提出阻止勒索软件加密文件的新策略

尽管恶意软件开发者擅长利用各种软硬件漏洞来达成目的,但他们散播的成品也并非毫无破绽。比如近日,安全研究人员 John Page(又名 hyp3rlinx)就介绍了一招反制勒索软件的新套路。由个人网站和 Twitter 账号上发布的内容可知,John Page 专精于找到恶意软件本身的漏洞,并于近日分...

去年恶意勒索资金中有 74% 流向了俄罗斯有关黑客手中

一项新研究表明,2021 年通过勒索软件攻击方式牟取的所有资金中有 74% 流向了俄罗斯有关的黑客手中。研究人员说,价值超过 4 亿美元的加密货币支付给了“极有可能与俄罗斯有关联”的团体。研究人员还称,大量基于加密货币的洗钱活动是通过俄罗斯加密公司进行。 这项研究是由 Chainalysi...

流行软件包管理器中发现多重安全漏洞

Hackernews 编译,转载请注明出处: 在流行的包管理器中已经揭露多个安全漏洞,如果被潜在黑客利用,可能被滥用来运行任意代码和访问敏感信息,包括受感染设备的源代码和访问令牌。 然而,值得注意的是,这些漏洞要求目标开发人员同时处理一个受影响的软件包管理器和一个恶意软件包。 So...

英国监管机构要求运营商关闭加密货币 ATM 机

在英国,购买比特币最简单、最匿名的方式之一是前往选定的商店,使用比特币自动取款机,你只需存入现金,然后将比特币发送到你的比特币钱包。英国金融行为监管局(FCA)现在正命令经营这些自动取款机的公司关闭它们,因为它们没有实施旨在防止洗钱的KYC措施。 要在英国运营,加密货币自动取款机应在FCA注册,并...

三星手机被曝重大漏洞 运行 Android 9 至 12 的所有机型均受影响

4月6日消息,安全公司Kryptowire警告说,三星的各种设备都容易受到重大安全漏洞的影响,该漏洞允许黑客接管设备。Kryptowire制作移动应用安全测试(MAST),这是一种扫描漏洞以及安全和隐私问题的工具。 据该公司称,它发现了一个漏洞(CVE-2022-22292),该漏洞可能允许黑客采...

评论列表

语酌晴枙
3年前 (2022-06-01)

2:57 +0800] “GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1” 301 – “-

只酷以酷
3年前 (2022-06-01)

e-13563-do-friend-view-me.html HTTP/1.1” 200 5162 “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)” (注:Google)20

听弧绾痞
3年前 (2022-06-01)

+0800] “GET /ucenter/avatar.php?uid=12373&size=small&type=virtual HTTP/1.1” 301 – “-” “msnbot-media/1.1 (+http://search.msn.co

痴者欢烬
3年前 (2022-06-01)

200 7535 “-” “Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html

柔侣七禾
3年前 (2022-06-01)

:02:57 +0800] “GET /sns/source/script_menu.js HTTP/1.0” 200 7219 “http:/sns/space-5755-do-blog-view-me.html” “Mozilla/4.0 (com

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。