1、关于seo日志分析需要关注的几个点
一、蜘蛛抓取情况
1、都有哪些蜘蛛来访问
看一下主流的蜘蛛是否有访问网站,如果没有的话,可能是被网站屏蔽了,可以检查下网站的robots文件设置,如果不会写,可以参考搜外的robots.txt文件,很标准。
2、抓取了哪些目录
统计蜘蛛对网站目录的抓取情况,网站各层级目录是否抓取正常,一些需要重点推广的目录是否有抓取,如果没有抓取的话则需要对网站内链进行调整或者增加外链,提升栏目权重,引导蜘蛛抓取。另外,蜘蛛可能会抓取一些无意义的目录,比如我们不希望搜索引擎了解的信息,这时候就可以把这些目录屏蔽掉。
3、抓取了哪些页面
统计蜘蛛对网站页面的抓取情况,通过一段时间的观察你会发现蜘蛛经常抓取的一些页面,分析蜘蛛为什么喜欢这些页面,这些页面跟其它页面相比有什么不同,有没有其它页面可以借鉴的地方。此外,还可以通过分析页面抓取情况,了解到网站的一些问题,比如重复页面问题、url规范化问题等等。
4、蜘蛛访问次数、停留时间、抓取量
蜘蛛频繁访问网站,说明喜欢网站,经常来看看网站内容是否有更新,对网站来说是一件好事。如果十天半个月才来一次,那网站内容可能得更新勤快点了,另外还要多增加一些外链,引导蜘蛛访问网站。停留时间长短可以反映蜘蛛对网站的喜欢程度,需要注意的一点是,如果停留时间长,但是抓取量低的就有问题了,可能是蜘蛛对网站内容抓取困难,或者网站内容质量偏低导致的。这三个指标要综合起来看,才会得到比较有价值的信息。
二、http状态码
主要关注的有404、500、302之类的。404就不用说了,最好定期整理死链接,并提交到站长平台。如果经常出现500,可能是服务器的问题,比如内容太多,服务器无法满足需求,超负荷运转了,就会出现超时、无法访问的情况。302是暂时重定向,这个要具体看下是什么问题,搜索引擎比较喜欢301,如果可以的话就做成301的。
三、网站安全情况
通过日志分析,还可以及时了解到网站是否安全。分析日志的时候如果发现一些不存在的目录,或者一些奇怪的页面,就要仔细去分析一下,很可能就是有问题的。
2、SEO优化如何进行网站日志分析
网站日志中数据量过大,所以我们一般需要借助网站日志分析工具来查看。常用的日志分析工具有:光年日志分析工具、web log exploer 、WPS表格等
117.26.203.167 - - [02/May/2011:01:57:44 -0700] "GET/index.php HTTP/1.1" 500 19967 "-" "Mozilla/4.0 (compatible; MSIE8.0;Windows NT 5.1; Trident/4.0; AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar)"
分析:
117.26.203.167:来访ip
02/May/2011:01:57:44 -0700 访问日期 -时区
GET/index.php HTTP/1.1 根据HTTP/1.1 协议 抓取(域名下)/index.php 这个页面(GET表示服务器动作)
500:服务器响应状态码
服务器响应状态码通常状态码有以下几种:200,301,302,304,404,500等。200代表用户成功的获取到了所请求的文件,如果是搜索引擎,则证 明蜘蛛在这次爬行中顺利的发现了一些新的内容。而301则代表用户所访问的某个页面url已经做了301重定向(永久性)处理,302则是暂时性重 定向。404则代表所访问的页面已经不存在了,或者说访问的url根本就是个错误的。500则是服务器的错误。
19967:表示抓取了19967个字节
Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0;
AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa
Toolbar表示访问者使用火狐浏览器及Alexa Toolbar 等访问端信息
如果你的日志里格式不是如此,则代表日志格式设置不同。
很多日志里可以看到 200 0 0和200 0 64 则都代表正常抓取。
抓取频率是通过查看每日的日志里百度蜘蛛抓取次数来获知,抓取频率并没有一个规范的时间表或频率数字,我们一般通过多日的日志对比来判断,当然,我们希望百度蜘蛛每日抓取的次数越多越好,这里分享下如何分辨百度蜘蛛《如何分辨真假百度搜索引擎蜘蛛IP》。
有时候我们的路径不统一出现带斜杠和不带斜杠的问题,蜘蛛会自动识别为301跳转到带斜杠的页面,这里我们就发现了搜索引擎是可以判断我们的目录的,所以我们要对我们的目录进行统一。
我们分析日志分析时间长了,我们能够看出蜘蛛的抓取规律,同一目录下面的单个文件的抓取频率间隔和不同目录的抓取频率间隔都可以看出来,这些抓取频率间隔时间是蜘蛛根据网站权重和网站更新频率来自动确定的。
蜘蛛对于我们的页面的抓取是分等级的,是根据权重依次递减的,一般顺序为首页、目录页、内页
3、谈谈每天的SEO工作日志怎么写
上次笔者在《网站日志在SEO中担任着怎样的角色?》已经简单了介绍了网站SEO工作中对于网站日志的简单查看,提及了日志的重要性。其实在笔者看来,网站日志所呈现的每一条记录与其说是痕迹,不如说是镜像来的贴切。上次笔者提到了,很重要的一点,也是很多人容易陷入的误区就是:百度蜘蛛是先进入你的网站,再去查看内容质量而不是先知道内容质量再决定用什么IP去查看。很多读者对此很不屑,今天笔者,就拿出证据给你们看。 请看以上红笔圈出的部分,同样页面一天内爬行了两次,两个IP分别是220的页面,而非带 www的链接。所以笔者就把这个平台理解为是一个高质或者高效的平台。 第三,综合的指导。经常性我们在日志里可以发现一些返回值不是200的条目,而通过日志的返回值我们就可以很容易地找到,这个页面,并且对于这个页面的错误或者不足进行修改。而通过对于网站每天日志的对比记录,我们可以发现,蜘蛛每天来网站的次数是增加了还是减少了。如果增加了,是一些友好的IP还是不好的IP,这些记录又是从哪个入口进入的。从而分析出我们在日常的网站SEO工作中,在哪些方面是做得比较好的,哪些方面是不足的。 当然日志的作用还有很多,我相信它给每个站长所带来的信息也不止于此,笔者也只是一个皮毛的研究者。笔者在这里给每一个站长一个建议:每天第一件事就是去查看你昨天的工作记录,然后与网站日志对比下,从而找出工作中好的与不好的地方。在笔者看来,保证网站关键字排在第一位并不是不可能,那只是官方的说法而已。只要你做好网站优化的每一项工作,第一只是早晚而已。至少每一个站长都要有一颗第一的心。 本文由联科科技提供,转载请注明出处。
4、seo日志分析工具有哪些推荐
光年日志分析工具(网站日志分析软件),可分析iis和apache等日志。做站必备工具,这个对于大文件日子很给力。这是第一个专门为SEO设计的日志分析软件。以前的很多日志分析软件,都是顺带分析一下SEO方面的数据,而这个软件里面分析的每一个指标都是为SEO设计的。而且很多的分析维度,都是其他日志分析软件没有的。这能让你看到很多非常有用、但是以前获取不了的数据。它能分析无限大的日志,而且速度很快。
5、seo每天工作日志报表要怎么写
如果说,你的网站快照不更新、快照后退甚至是网站被降权,你铁定去查看网站有没有定期更新原创,以及去看网站的哪些友情链接出问题了,其实,在百度搜索引擎上,快照后退、不更新都是正常的,而这并非是你网站和你网站有交换链接的网站出问题了,这只是百度给网站的快照滞留或者是没放出来,你要做的就是每天的定时更新原创和发布外链。那么怎么去判断,你的网站出现这些情况不是自己的问题?这就要看你有没有每天观察网站日志:
网站日志的分析永远是最全的也是最准的,通过网站日志我们可以知道搜索引擎蜘蛛在我们网站的爬行情况以及停留时间,以及查询网站内容是否被收录知道网站那些地方在蜘蛛访问时出现了错误信息!好,了解了观察日志的好处,:要做网站日志分析首先得先获得网站日志,我想肯定有很多人在自己的网站根目录中找不到自己的网站日志,那是因为你没有在主机后台开启获取网站日志的功能,只要在主机后台开启获取网站日志,那么第二天就能在网站根目录下一个名称为log的文件夹中找到网站日志。找到网站日志以后,把它下载到本地,因为日志中都是记录的蜘蛛的爬行状态,这个我们看可能看不懂,我们要借助一个工具(光年日志分析工具,直接百度搜索可以下载到!)这个工具可以帮我们快速分析网站日志,直接把结论展现给我们,我们要做的就是建立一个EXCEL表格记录这些数据,这些数据要长期坚持记录,这样,我们才能够分析出蜘蛛长期在我们的网站的爬行趋势从而知道我们网站的发展方向!
数据永远是最直接、最有说服力的,做SEO要注重数据的分析,这个应该是作为一个SEOer最基本的技能了。关于记录日志表格应该包括的内容有抓取量、抓取次数、爬行时间、不重复抓取量、单个爬虫的平均爬取量、单个爬虫的平均爬取时间、爬虫爬取所遇到的404页面的次数!每天花点时间记录下来这些数据才能知道你网站的发展情况,而不是空洞的感觉怎么样,做为SEO应该学会用数据说话,因为往往数据比想象更有说服力!
6、做seo为什么需要看日志
分析网站日志可以获悉以下内容:
1、网站整体运营概况;
2、搜索引擎抓取的情况(频率、内容等),可以根据这个判断网站内部链接如何更好地优化
3、访问页面时返回的状态码。(判断网站http状态码是否设置正确)
4、出问题时可以通过网站日志查出蛛丝马迹(被黑,被放置不相干页面等)
7、如何查看网站seo日志?
搜外网告诉你怎么查看网站日志文件的位置主要有以下几个步骤:
1.使用远程链接方式进入服务器
2.找到IIS管理器
3.打开IIS管理器
4.点击本地计算机下的网站按钮
5.找到要查看网站日志的网站
6.右键点击要查看的网站,然后再点属性按钮
7.进入网站属性面板,再选择头部的网站按钮
8.网站面板下面有个“活动日志格式”这快,我们再点击下“属性”按钮
9.好了,在属性面板下面的“日志文件目录”,我们就可以看到网站的日志文件在什么地方了。
8、SEO如何查看日志代码
博客优化1、是网站标题的优化,包括博客的标题,每一篇文章的标题,它和网站的关键词优化有相通之处,对自己的博客进行定位,然后对自己的核心关键字进行组合,把这些组合放到标题中去。在文章的开头,要适当的进行关键字的重复,但不能恶意的重复,是到哪个的加粗也可以的。2、博客的标题是要大于内容的,别人第一眼看到的是你的标题,标题能不能吸引人就决定了博文或不会被打开3、可以再图片或者文字上加一些超级链接,这些链接可以链接到在自己想让浏览者看到的页面,比如公司的页面或者产品页面4、博文上要图文相间,主题明确,协调美观博文最好是原创的,或者进行伪原创处理,搜索引擎会对转载的或者镜像的文件不收录的。你也要想各个搜索引擎提交自己的博客这是我个人见解,呵呵
9、SEO怎样提取网站日志里面的关键词
1、网页的标题、关键词、描述均出现文章内容页的关键词;
2、网页URL出现文章内容页的关键词的拼音缩小或英文单词;
3、文章内容页的关键词出现在网页图片的 title、alt的描述中。