当前位置:首页 > 谷歌SEO培训 > 正文内容

谷歌对于robots文件设置要求是什么?

平哥SEO2024-05-13谷歌SEO培训1054

今天是平哥SEO主讲robots.txt日志文件设置。在上节课我们就了解到,robots文件规定了Googlebot要抓取一个网站页面,首先就要先访问robots文件,而且必须按robots.txt文件里的规矩办事,那么今天我们就来详细了解下如何设置robots日志文件。

一、robots.txt文件基础理论

1、robots.txt工作原理

robots.txt是一个文件,主要是给各个搜索引擎抓取工具看的,里面用来设置一些规则,目的是告诉它们,哪些搜索引擎抓取工具能来抓取,哪些搜索引擎抓取工具不能来抓取,哪些页面可以访问,哪些页面不能访问。

2、robots.txt的好处

①、控制抓取工具预算

如果不了解抓取工具预算的朋友,这里大概解释下,抓取工具预算就是抓取你网站所花费的时间和资源,也就是在有限的时间内,Googlebot抓取网站的页面数量,并且这个预算值是可以变动的,所以有些seo,为了让Googlebot抓取更多的重要页面,他们会从而利用robots.txt来控制。

②、控制部分页面和文件不被抓取

每个网站都有一些页面不想被Googlebot抓取并索引。例如网站的管理后台登录及管理页面、一些暂时性的内容页面、PDF文件、视频、图片等等。

谷歌对于robots文件设置要求是什么?

二、制作robots.txt文件

1、制作方法

①、如果你用的是一些CMS客户管理系统,类似WordPress,shopify等建站工具,那么你就不需要制作这个文件,因为系统会默认生成这个文件,并且把相应的规则填写好,如果你需要添加规则,直接点击修改即可。

②、如果你网站的根目录下面没有这个文件,那请新建一个文件,文件名为:robots.txt的文本文档,然后根据你网站的实际情况,添加相应的规则命令后,用ftp上传到服务器网站根目录就完成了。

备注:如果你想研究学习参考别人网站的robots.txt文件,也可以直接输入他们的域名,加上文件名,例如:www.c-sz.com/robots.txt

需要注意的是,robots.txt文件和网站地图不一样,robots.txt只能以这个名字命名,同时一个站点有且只有一个robots.txt文件。

2、使用方法

个人觉得常用的就三大板块和两个通用符,下面我们通过一个例子来了解吧。

User-agent: Googlebot

allow: /

User-agent: Baiduspider

Disallow: /example1/

Disallow: /example2.html

Disallow: /*.jpg$

Sitemap: https://www.c-sz.com/sitemap.xml

I、“user-agent” :指的用户代理,也就是各大搜索引擎抓取工具。

例如上面的案例中Googlebot和Baiduspider,分别为Google和百度的抓取工具。

不同的搜索引擎,不同的名称,如果有特定要求可以查询相关名称。另外,如果需要区分开不同类型的抓取工具,可以参考上节课的内容。

II、“allow” ,“disallow” :指令是“允许抓取”和“不允许抓取”某些页面路径的意思。

通配符“*”表示匹配0或多个任意字符。

通配符“$”表示字符串的结束,用于结尾。

如上面案例中的,

·允许Googlebot抓取所有页面

·不允许百度蜘蛛抓取example1栏目

·不允许百度蜘蛛抓取example2.html页面

·不允许百度蜘蛛抓取网站所有jpg类型的图片,包括图片为example.jpg?p=12345的类型

III、Sitemap:这个是站点地图的指令,类似提交网站地图的效果,之前的第十课网站地图全面解析课程里面有讲,这里我们只需把所有的站点地图加上就好。

今天就分享到这里,期待能帮助你!

扫描二维码推送至手机访问。

版权声明:本文由【平哥SEO学堂】整理发布,如需转载请注明出处。

本文链接:https://www.c-sz.com/post/13.html

分享给朋友:

“谷歌对于robots文件设置要求是什么?” 的相关文章

谷歌核心更新的后果是什么?

谷歌核心更新的后果是什么?

谷歌的John Mueller表示,搜索团队正在"明确评估"如何在下一次核心更新推出时奖励那些提供有用、高质量内容的网站。这些评论是对X上关于3月份核心更新和9月份有用内容更新的影响的讨论的回应。Mueller在一系列推文中承认了这些担忧,并表示:“I imagine for most sites strongly affected,the effects will be si…

谷歌SEO:什么是301重定向呢?

谷歌SEO:什么是301重定向呢?

重定向是一种在用户和机器人请求旧URL但页面位置已更改时将其发送到新URL的方法。当您搬到美国的新地址时,您可以通过美国邮政服务(USPS)设置邮件转发。如果有人向您的旧地址发送邮件,USPS将查看他们的邮件转发规则并意识到您不再居住在旧地址。他们会收取邮件并将其递送到您的新位置而不是旧位置。这也是重定向的工作原理。用户或机器人请求旧位置,然后他们会被转发到新位置。何时使用重定向?您需要使用重定向…

谷歌SEO中产品属性怎么写合适呢?

谷歌SEO中产品属性怎么写合适呢?

有小伙伴问到产品属性的问题,今天平哥SEO就给大家详细分享一下:产品属性~一、什么是产品属性?产品属性是描述商品的详细信息和功能,并提供消费者决定购买所需的信息。产品属性可以包括设计特征、技术规格、价格和制造中使用的材料。产品属性分为两类:有形和无形。有形属性是感官可以感知的物理属性,例如颜色、形状、大小和纹理。无形属性是无法通过看到或持有产品来感知的特征。例如,看看这个Victrola电唱机系统…

2024年10大Google排名影响因素是什么?

2024年10大Google排名影响因素是什么?

当人们需要答案、想法、产品或服务时,他们首先去的地方是什么?不是黄页。不进城。在这一点上,甚至对家人和朋友都没有。他们去谷歌。而且他们中的大多数不会滚动到前几个结果之前太远。这就是为什么SEO,或搜索引擎优化,是一个价值数十亿美元的行业。搜索引擎优化是让网站与谷歌的排名因素保持一致的做法,因此你的网站内容排名更高,获得更多的流量。那么这些排名因素是什么,你如何为它们优化你的网站呢?请继续阅读平哥S…

网站在重新设计怎么操作不影响谷歌SEO流量流失呢?

网站在重新设计怎么操作不影响谷歌SEO流量流失呢?

在网站重新设计期间很容易损害您的搜索引擎优化。以下是可能出现问题的预演:排名和流量的损失。链接资产损失。破损的页面。页面加载缓慢。移动体验不好。内部链接损坏。重复内容。例如,该网站在重新设计期间删除了约15%的自然页面,导致近50%的自然流量损失。有趣的是,即使随后引用域的增长也无助于恢复流量。幸运的是,避免这些和其他常见问题并不难——只需遵循六个简单的规则。1.保留旧站点的备份很容易被忽视,但可…

Google 检索、索引、排名的原理规则是什么?

Google 检索、索引、排名的原理规则是什么?

Google SEO中的爬取、索引跟搜索引擎排名,分别是什么意思呢?在学习SEO之前,必定要先了解一下谷歌搜索引擎的运作方式。从你的网站文章发布的那一瞬间,你的文章网址会经历:被找到、被爬取(检索)、被索引,然后才能出现在Google搜索引擎里面并且加入Google搜索结果的排名。上面的这个过程,从网址被找到,一直到被爬取跟索引,然后再到开始在Google搜索引擎排名,这就是Google搜索引擎的…