当前位置:首页 > seo资讯 > 正文内容

日志文件分析:8种可能的SEO技术

ant1周前 (02-22)seo资讯18

日志文件分析:8种可能的SEO技术  济南seo培训 湖北seo seo电子书 第1张

在这篇文章中,我们会告诉你 什么是日志文件他们为什么如此重要寻找什么以及使用什么工具。最后,我将提供8种可能的分析方法SEO优化.

服务器日志是一个日志文件(或多个文件), 由服务器自动生成和维护,它由要执行的操作列表组成。

出于SEO的目的,我们专注于Web服务器日志,它包含来自人类和机器人的网站页面请求的历史记录。有时称为访问日志。初始数据如下:

搜索引擎联盟

日志文件分析:8种可能的SEO技术  济南seo培训 湖北seo seo电子书 第2张

是,刚开始的时候,数据似乎有些不堪一击,令人困惑,所以, 让我们弄清楚仔细看看吗?击中?.

每个服务器在命中记录方面都有很大的不同。但通常他们提供类似的信息,此信息分为几个字段。

这是一个调用Apache Web服务器的示例(这已简化-一些字段已删除):

5056。92。47 – – [25 / 5 / 2020:12:21:17 +0100]“ GET” –“ /wp-content/themes/esp/help.PHP“-” 404“”-“” Mozilla / 5。0(兼容; Googlebot / 2。1; + http:// www。谷歌com / bot。html)“-www。例。com-

如你看到的,每次比赛我们都会获得关键信息例如, 日期和时间,请求的URI(在这种情况下为404)和用户代理的响应代码, 请求的来源(在本例中为Googlebot)。

首尔歌 )。如你所知日志文件每天包含数千次匹配,当用户或机器人访问您的网站时,将为每个请求的页面记录许多点击, 包括图片,CSS和其他文件 呈现文件所需。

所以, 你懂, 什么是日志文件但是,为什么值得花时间分析它们呢?

为了,事情是,只有一个真实记录可以说明 搜索引擎(例如Googlebot)如何处理您的网站。也就是说,通过查看网站服务器日志文件。

网站管理员工具,第三方扫描仪和搜索操作员不完全了解 搜索引擎如何与网站互动。只有访问日志文件才能为我们提供此信息。

对日志文件的分析为我们提供了许多有用的信息,这包括以下功能:

  • 准确检查 您可以扫描或无法扫描的内容。
  • 看, 搜索过程中搜索引擎收到了什么答案,例如302,404, G。软404。
  • 显示扫描缺陷这些缺陷对于站点可能具有更广泛的含义(例如, 等级或内部连结组成)。
  • 看, 搜索引擎优先考虑哪些页面,他可以将其视为最重要的页面。
  • 寻找地区 搜索预算用在其中

    seo专业培训广场。

我会告诉你一些任务, 这可以在解析日志文件时完成,他们将展示 他们如何为您提供有关网站的有用信息。

对于这种类型的分析,您需要来自您域中所有Web服务器的原始访问日志,没有应用过滤或修改。完善,为了使分析有价值, 您将需要大量数据。需要多少天/周 取决于网站的大小和分辨率, 以及产生的流量。对于某些网站,一个星期可能就足够了。对于某些站点,您可能需要一个月或更长时间的数据。

您的Web开发人员应该能够为您提交这些文件。值得一问在将它们发送给您之前,日志中是否包含来自多个域和协议的请求,以及这些查询是否包含在此日志中。因为否则会阻止您正确识别请求。您不会注意到与http:// www的区别。例。com /和://例。com /请求之间的差异。在这些情况下,您必须要求开发人员更新日志配置,将来包括此信息。

如果您是Excel专家,那么本指南将非常有帮助, 帮助您使用Excel格式化和分析日志文件。我们使用Screaming Frog日志文件分析器其友好的用户界面使您可以快速,他们很容易发现任何问题(尽管我们可以说 自由的深度或程度是多少, 你得到的, 不是这样的 就像在Excel中一样)。所有例子 我将介绍给您, 使用“尖叫青蛙日志文件分析器”执行。 其他一些工具是Splunk和GamutLogViewer。

首先,爬行预算是多少?全面的扫描和扫描速度要求,我们将扫描预算定义为 搜索引擎蜘蛛或机器人可以并且希望抓取的内容。网址量。

事实上,这是页数 哪些搜索引擎每次都会抓取, 当他们访问您的网站时。与域的权重有关,它与站点上的链接资源成比例。

要解析日志文件,重要, 因此,有时抓取预算会浪费在不相关的页面上。如果您要编入新内容,但是没有预算然后,搜索引擎将不会为新内容建立索引。这就是为什么您需要通过分析日志文件来跟踪抓取预算支出。

因素 影响搜寻预算

有许多低附加值的网址, 这会对网站的抓取和编制索引产生负面影响。低附加值URL可以分类如下:

  • 多面导航生成动态URL和会话ID(通常由电子商务网站使用)

    SEO关键词排名软件

  • 网站上的重复内容
  • 被入侵的网页
  • 软错误页面
  • 质量差和垃圾邮件

此类页面上服务器资源的合理浪费将导致真正有价值的页面上的爬网活动丢失。这可能会导致在网站上找到优质内容的时间大大延迟。

例如,检查这些日志文件,我们发现 错误的话题经常被访问,问题很明显!

如果您查看事件数, 在每一页上收到问你自己 搜索引擎应该爬网这些URL-通常您会得到答案吗?没有?.因此,优化抓取预算将有助于搜索引擎抓取和索引您网站上最重要的页面。您可以用不同的方式来做,例如在机器人。文本文件阻止包含具有某些模式的URL,这样可以避免URL爬网。

我们考虑过 为什么对搜索引擎来说重要的是不要在低价值网页上浪费抓取预算。硬币的另一面是检查 您对有价值的网页有多少重视?如果您按事件数量对日志文件进行排序,并按HTML进行过滤,您可以看到访问量最大的页面。

日志文件分析:8种可能的SEO技术  济南seo培训 湖北seo seo电子书 第3张

如果最重要的网址需要进行最多的爬网,可能太简单了 但,如果您是潜在的客户网站,希望 您的主页,关键服务页面和文章内容将显示在其中。

作为电子商务网站,您要主页吗?它显示类别页面和关键产品页面。如果您看到旧的产品页面, 不再销售 这些结果中最重要类别的页面为零,然后出现了问题。

坚持使用日志分析工具,易于实现。我们知道, Google是外贸的主要搜索引擎,因此,确保Googlebot智能手机和Googlebot定期访问您的网站是您的重中之重。

我们可以通过搜索引擎bot过滤日志文件数据。

日志文件分析:8种可能的SEO技术  济南seo培训 湖北seo seo电子书 第4张

过滤后,您可以查看事件数 由每个所需的搜索引擎机器人编写。希望 你会看见, Googlebot智能手机或Googlebot最多访问您的网站。

使用Screaming Frog日志文件分析器,您可以通过以下方式快速找到错误状态代码:由于它们是按扫描率排序的,通过这种方式, 您还可以检查是否 什么网址, 大概, 将被修复。

要查看此数据,您可以在标签中过滤此信息吗?答案代码?.

日志文件分析:8种可能的SEO技术  济南seo培训 湖北seo seo电子书 第5张

找到3xx,HTTP 4xx和5xx状态页

  • 他们经常去吗?
  • 访问3xx。第4xx和5xx页的访问频率更高, 比您的重要页面?
  • 有响应代码模板吗?

在前15页中,重定向的流量最高,无效的302(临时)重定向,每页上没有内容的页面以及一些404和程序化404。

通过分析日志文件,发现问题后,您可以通过更新不正确的重定向和编程性404开始解决问题。

虽然解析最后的响应代码很重要, 搜索引擎将面对的,但是突出显示不兼容的响应代码也可以为您提供更深入的见解。

如果您仅查看最后一个响应代码,并且在4xx和5xx中未检测到异常错误或突发,可以在那里进行技术检查。但,您可以在日志文件解析器中使用过滤器仅用于详细查看吗?不一致? 答案。

日志文件分析:8种可能的SEO技术  济南seo培训 湖北seo seo电子书 第6张

原因很多您的网址可能遇到不兼容的响应代码。例如:

  • 5xx和2xx混合-当它们负载很重时,这可能表明服务器有问题。
  • 混合使用4xx和2xx-这可能表示链接断开, 出现或已修复。

之后, 您是如何消化日志文件分析中的信息的?您可以制定行动计划来更正这些错误。

我们知道第一个字节(TTFB)的时间,到达最后一个字节(TTLB)的时间和加载整个页面的时间将影响您的网站的爬网方式。特别是TTFB,这是快速高效地爬网站点的关键。页面速度也是排名因素,我们看, 快速的网站对您的生产力至关重要。

使用日志文件,我们可以快速查看您网站上最大的页面,和最慢的页面。

要查看最大的页面,别客气, 对列进行排序?平均字节数?.

日志文件分析:8种可能的SEO技术  济南seo培训 湖北seo seo电子书 第7张

它在这里,我们看, PDF构成了网站上最大的页面。优化和减小它们的大小是一个很好的起点。如果您在此处看到特定页面,也许, 您将需要分别查看它们。

  • 它们覆盖有高分辨率图像吗?
  • 他们有自动视频播放功能吗?
  • 它们是否有不必要的自定义字体?
  • 是否启用了文本压缩?

尽管页面大小可以很好地指示页面变慢,但这还不是全部。您的页面可能很大,但是它仍然可以快速加载。对列进行排序?平均响应时间?,您可以看到响应时间最慢的网址。

像所有数据一样 你在这里看到的您可以单击HTML,JavaScript,形成,CSS等 D. 为了过滤,这对于审核非常有用。

也许, 您的目标是减少网站对JavaScript的依赖,我希望找到罪魁祸首。还是你知道 可以简化CSS,而且我们需要数据来备份它。您的网站可以以蜗牛般的速度加载,并在图片上显示过滤 优先考虑提供下一代格式。

日志文件分析器的另一个重要功能是能够导入网站扫描。真的很容易做并为您提供更多从日志文件进行分析的选项。只需将扫描拖到?导入的URL数据?, 如下所示。

日志文件分析:8种可能的SEO技术  济南seo培训 湖北seo seo电子书 第8张

完成后,您可以做进一步的分析。

日志文件分析:8种可能的SEO技术  济南seo培训 湖北seo seo电子书 第9张

请确保从下拉菜单中选择“匹配给定的URL”,然后将适当的列拖动到视图中。它在这里,我们可以对爬网深度和链接对您网站的爬网速率的影响进行批量分析。

例如,如果您不经常抓取“重要”页面,并发现 他们只有很少的链接,并且捕获深度大于3,大概, 因此,您的网页不会经常抓取。比较,如果有页面, 经常扫描我不知道为什么别客气, 检查页面在您网站上的位置。链接在哪里?根到底有多远?分析这个可以告诉你 什么样的搜索引擎喜欢您网站结构.最后,该技术可以帮助您确定站点的层次结构中的任何问题。

最后,通过导入扫描数据,查找丢失的页面很容易。可以将孤立页面定义为页面 哪些搜索引擎知道并爬行, 但未链接到您的网站。

日志文件分析:8种可能的SEO技术  济南seo培训 湖北seo seo电子书 第10张

选择下拉菜单时?不在网址数据中? 显示网址, 在杂志上,代替网址, 存在于您的扫描数据中。因此,此处显示的网址将是该页面, 哪些搜索引擎机器人仍然认为有价值。但是他不再在该站点上。网址丢失的原因很多,它们包括:

  • 网站结构的变化
  • 内容更新
  • 旧的重定向网址
  • 内部链接无效
  • 外部参考错误

最后,您需要查看找到的孤立网址,并做出判断 与他们打交道。

这是我们对日志文件分析和8个实际任务的快速介绍,您可以立即开始使用Screaming Frog日志分析器。在Excel和其他工具中, 以上(和其他工具),您可以更加努力。

您如何解析日志文件?您认为哪种工具最有效?我们的SEO团队想知道在下面发表评论!

相关文章

网络营销培训:如何优化微信索引如何使用微信SEO?

网络营销培训:如何优化微信索引如何使用微信SEO?

?如何优化微信索引如何使用微信SEO?作为微信公众号的运营商,当然, 您希望您的官方微信帐户拥有更高的索引,如果您想改善微信指数,您需要进行索引优化,?如何做索引优化?影响微信指数的因素很多,如果您想...

?代理IP如何帮助网站SEO优化?

?代理IP如何帮助网站SEO优化?

互联网营销人员或多或少了解SEO优化,为了达到更好的沟通效果, 公司每天 我们需要在各种渠道上重复做很多广告,?包括使用代理IP发布吗?柔软的物品 回复论坛, 转发评论, 等等如果您想做好SEO, 注...

袁一鸣:百度SEO中关于关键字流行度的一些准确的客户参与经验!

袁一鸣:百度SEO中关于关键字流行度的一些准确的客户参与经验!

你好,搜索引擎优化望道 我是袁一鸣每天写一篇文章。这是袁一鸣的第612条文章:袁一鸣:关于百度SEO关键字流行的一些思考!周末,一些SEO朋友聚在一起喝茶聊天。袁一鸣:关于百度SEO关键字流行的一些...

网站创建的世界方法和技术的报道

网站创建的世界方法和技术的报道

关于网站创建的方法和技巧因为我给你一个框架在里面你会发现 建立一个网站并不是真的那么困难。许多人发现困难和困难 因为他们看不到框架和方向。 搜索引擎优化关键字 1。 网站组成服务器, 域名, 程序,...

?搜索引擎优化的SEO方法有哪些?

?搜索引擎优化的SEO方法有哪些?

很多小白SEO新手经常问我什么是SEO优化方法,我最想说的是这个问题就像一个大洋葱,从表面上看,这似乎是一个问题看里面的心百度搜索引擎优化排名排名 得到答案您必须将它一层一层地剥下来您知道SEO的本...

课程蠕虫:搜索字符串在哪里,有SEO!

课程蠕虫:搜索字符串在哪里,有SEO!

可以提到SEO。第一, 你在想什么, 这是百度但实际上,只要有搜索栏,SEO存在!例如:微博,微信公众号,视频网站电子商务网站,即使是媒体还有短视频平台这也是SEO的存在!什么是SEO?简单的说,值得...

揭开黑帽SEO神秘面纱!

揭开黑帽SEO神秘面纱!

至于seo行业一切, 自然, 考虑快速排队 黑色SEO,很少有人有耐心去爱白手SEO。使用黑帽SEO也是SEO的工作方式。 人们爱与恨。由于许多人想学习黑帽SEO,我想在短时间内提高网站的排名。所以,...

百度SEO如何识别网站用户组?

百度SEO如何识别网站用户组?

SEO策略行业响应:互联网在不断变化。一组站的定义在每个时期都不同。不用担心概念建议认真思考为什么要一堆网站呢?这些网站对用户有价值吗?如果没有搜索引擎,还会做吗?提醒大家 您真正需要重视“用户价...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。