当前位置:首页 > 谷歌SEO培训 > 谷歌对于robots文件设置要求是什么?

谷歌对于robots文件设置要求是什么?

平哥SEO2024-05-13 14:33谷歌SEO培训696

今天是平哥SEO主讲robots.txt日志文件设置。在上节课我们就了解到,robots文件规定了Googlebot要抓取一个网站页面,首先就要先访问robots文件,而且必须按robots.txt文件里的规矩办事,那么今天我们就来详细了解下如何设置robots日志文件。

一、robots.txt文件基础理论

1、robots.txt工作原理

robots.txt是一个文件,主要是给各个搜索引擎抓取工具看的,里面用来设置一些规则,目的是告诉它们,哪些搜索引擎抓取工具能来抓取,哪些搜索引擎抓取工具不能来抓取,哪些页面可以访问,哪些页面不能访问。

2、robots.txt的好处

①、控制抓取工具预算

如果不了解抓取工具预算的朋友,这里大概解释下,抓取工具预算就是抓取你网站所花费的时间和资源,也就是在有限的时间内,Googlebot抓取网站的页面数量,并且这个预算值是可以变动的,所以有些seo,为了让Googlebot抓取更多的重要页面,他们会从而利用robots.txt来控制。

②、控制部分页面和文件不被抓取

每个网站都有一些页面不想被Googlebot抓取并索引。例如网站的管理后台登录及管理页面、一些暂时性的内容页面、PDF文件、视频、图片等等。

谷歌对于robots文件设置要求是什么?

二、制作robots.txt文件

1、制作方法

①、如果你用的是一些CMS客户管理系统,类似WordPress,shopify等建站工具,那么你就不需要制作这个文件,因为系统会默认生成这个文件,并且把相应的规则填写好,如果你需要添加规则,直接点击修改即可。

②、如果你网站的根目录下面没有这个文件,那请新建一个文件,文件名为:robots.txt的文本文档,然后根据你网站的实际情况,添加相应的规则命令后,用ftp上传到服务器网站根目录就完成了。

备注:如果你想研究学习参考别人网站的robots.txt文件,也可以直接输入他们的域名,加上文件名,例如:www.c-sz.com/robots.txt

需要注意的是,robots.txt文件和网站地图不一样,robots.txt只能以这个名字命名,同时一个站点有且只有一个robots.txt文件。

2、使用方法

个人觉得常用的就三大板块和两个通用符,下面我们通过一个例子来了解吧。

User-agent: Googlebot

allow: /

User-agent: Baiduspider

Disallow: /example1/

Disallow: /example2.html

Disallow: /*.jpg$

Sitemap: https://www.c-sz.com/sitemap.xml

I、“user-agent” :指的用户代理,也就是各大搜索引擎抓取工具。

例如上面的案例中Googlebot和Baiduspider,分别为Google和百度的抓取工具。

不同的搜索引擎,不同的名称,如果有特定要求可以查询相关名称。另外,如果需要区分开不同类型的抓取工具,可以参考上节课的内容。

II、“allow” ,“disallow” :指令是“允许抓取”和“不允许抓取”某些页面路径的意思。

通配符“*”表示匹配0或多个任意字符。

通配符“$”表示字符串的结束,用于结尾。

如上面案例中的,

·允许Googlebot抓取所有页面

·不允许百度蜘蛛抓取example1栏目

·不允许百度蜘蛛抓取example2.html页面

·不允许百度蜘蛛抓取网站所有jpg类型的图片,包括图片为example.jpg?p=12345的类型

III、Sitemap:这个是站点地图的指令,类似提交网站地图的效果,之前的第十课网站地图全面解析课程里面有讲,这里我们只需把所有的站点地图加上就好。

今天就分享到这里,期待能帮助你!

扫描二维码推送至手机访问。

版权声明:本文由【平哥SEO学堂】整理发布,如需转载请注明出处。

本文链接:https://www.c-sz.com/post/13.html

分享给朋友:

“谷歌对于robots文件设置要求是什么?” 的相关文章

Noindex标签是什么意思?谷歌对于Noindex标签用法

Noindex标签是什么意思?谷歌对于Noindex标签用法

今天是平哥SEO学堂主讲巧用Noindex。在上节课我们就了解到robots.txt文件的使用可以有效的防止Googlebot抓取一些不想被抓取索引的页面,但是你会发现,有些页面还是会显示在搜索结果中,这时,你就会有疑问,是不是自己在robot.txt文件中设置错了,还是robot.txt文件没有效...

如何让你的网站被谷歌更好地抓取?

如何让你的网站被谷歌更好地抓取?

对于已经习惯于使用谷歌来查询信息的网民来说,搜索引擎是一款出色的工具,他可以帮您筛选出数十亿个页面,评估无数个因素,以确定哪些内容或页面与您的搜索查询最相关。这个过程听起来可能很复杂,但它主要就是通过两个操作来实现的:抓取和索引。抓取是指谷歌访问网站的行为。搜索引擎通过部署机器人(爬虫或蜘蛛)来浏览...

文化用品公司如何做谷歌SEO优化呢?

文化用品公司如何做谷歌SEO优化呢?

在当今数字化时代,拥有一个优化的网站对于任何企业都至关重要。特别是对于文化用品公司来说,如何提升谷歌SEO关键字排名和销售额就更加显得关键。通过合理选择关键字、优化网站内容、提升用户体验等方法,可以有效提高网站在搜索引擎中的排名,吸引更多潜在客户。而为了增加销售额,除了提高网站流量外,还要注重产品质...

谷歌SEO中产品属性怎么写合适呢?

谷歌SEO中产品属性怎么写合适呢?

有小伙伴问到产品属性的问题,今天平哥SEO就给大家详细分享一下:产品属性~一、什么是产品属性?产品属性是描述商品的详细信息和功能,并提供消费者决定购买所需的信息。产品属性可以包括设计特征、技术规格、价格和制造中使用的材料。产品属性分为两类:有形和无形。有形属性是感官可以感知的物理属性,例如颜色、形状...

谷歌SEO教程从基础到进阶阶段是什么?

谷歌SEO教程从基础到进阶阶段是什么?

很多人可能都知道谷歌SEO做得好了,能给网站持续带来很多的流量,但却并不是很多人知道要怎么做。于是有人会想自学SEO,但外面有很多信息,而且搜索引擎算法也在不断变化,很难系统地进行学习,所以今天,平哥SEO把谷歌SEO的核心知识点,包括一些注意的地方都整理了出来,如果你是刚开始接触谷歌SEO,建议可...

Google搜索算法内部文件对于SEO有什么参考意义?

Google搜索算法内部文件对于SEO有什么参考意义?

近日,Google搜索的Content Warehouse API的内部文档意外泄露。这份文件犹如一颗重磅炸弹,在SEO界引起了轩然大波。泄露内容包含了Google搜索内容存储的当前活动架构,详细描述了数千个特征和模块,以及内容、链接和用户交互数据的存储方式,为我们理解Google搜索算法的内部运作...