当前位置:首页 > 谷歌SEO培训 > 谷歌对于robots文件设置要求是什么?

谷歌对于robots文件设置要求是什么?

平哥SEO2024-05-13 14:33谷歌SEO培训895

今天是平哥SEO主讲robots.txt日志文件设置。在上节课我们就了解到,robots文件规定了Googlebot要抓取一个网站页面,首先就要先访问robots文件,而且必须按robots.txt文件里的规矩办事,那么今天我们就来详细了解下如何设置robots日志文件。

一、robots.txt文件基础理论

1、robots.txt工作原理

robots.txt是一个文件,主要是给各个搜索引擎抓取工具看的,里面用来设置一些规则,目的是告诉它们,哪些搜索引擎抓取工具能来抓取,哪些搜索引擎抓取工具不能来抓取,哪些页面可以访问,哪些页面不能访问。

2、robots.txt的好处

①、控制抓取工具预算

如果不了解抓取工具预算的朋友,这里大概解释下,抓取工具预算就是抓取你网站所花费的时间和资源,也就是在有限的时间内,Googlebot抓取网站的页面数量,并且这个预算值是可以变动的,所以有些seo,为了让Googlebot抓取更多的重要页面,他们会从而利用robots.txt来控制。

②、控制部分页面和文件不被抓取

每个网站都有一些页面不想被Googlebot抓取并索引。例如网站的管理后台登录及管理页面、一些暂时性的内容页面、PDF文件、视频、图片等等。

谷歌对于robots文件设置要求是什么?

二、制作robots.txt文件

1、制作方法

①、如果你用的是一些CMS客户管理系统,类似WordPress,shopify等建站工具,那么你就不需要制作这个文件,因为系统会默认生成这个文件,并且把相应的规则填写好,如果你需要添加规则,直接点击修改即可。

②、如果你网站的根目录下面没有这个文件,那请新建一个文件,文件名为:robots.txt的文本文档,然后根据你网站的实际情况,添加相应的规则命令后,用ftp上传到服务器网站根目录就完成了。

备注:如果你想研究学习参考别人网站的robots.txt文件,也可以直接输入他们的域名,加上文件名,例如:www.c-sz.com/robots.txt

需要注意的是,robots.txt文件和网站地图不一样,robots.txt只能以这个名字命名,同时一个站点有且只有一个robots.txt文件。

2、使用方法

个人觉得常用的就三大板块和两个通用符,下面我们通过一个例子来了解吧。

User-agent: Googlebot

allow: /

User-agent: Baiduspider

Disallow: /example1/

Disallow: /example2.html

Disallow: /*.jpg$

Sitemap: https://www.c-sz.com/sitemap.xml

I、“user-agent” :指的用户代理,也就是各大搜索引擎抓取工具。

例如上面的案例中Googlebot和Baiduspider,分别为Google和百度的抓取工具。

不同的搜索引擎,不同的名称,如果有特定要求可以查询相关名称。另外,如果需要区分开不同类型的抓取工具,可以参考上节课的内容。

II、“allow” ,“disallow” :指令是“允许抓取”和“不允许抓取”某些页面路径的意思。

通配符“*”表示匹配0或多个任意字符。

通配符“$”表示字符串的结束,用于结尾。

如上面案例中的,

·允许Googlebot抓取所有页面

·不允许百度蜘蛛抓取example1栏目

·不允许百度蜘蛛抓取example2.html页面

·不允许百度蜘蛛抓取网站所有jpg类型的图片,包括图片为example.jpg?p=12345的类型

III、Sitemap:这个是站点地图的指令,类似提交网站地图的效果,之前的第十课网站地图全面解析课程里面有讲,这里我们只需把所有的站点地图加上就好。

今天就分享到这里,期待能帮助你!

扫描二维码推送至手机访问。

版权声明:本文由【平哥SEO学堂】整理发布,如需转载请注明出处。

本文链接:https://www.c-sz.com/post/13.html

分享给朋友:

“谷歌对于robots文件设置要求是什么?” 的相关文章

谷歌怎么删除收录无效的页面记录呢?

谷歌怎么删除收录无效的页面记录呢?

今天平哥SEO学堂主讲如何快速处理已收录页面。平哥SEO在前面几节课我们学会了综合使用robots.txt文件和Noindex可以更加有效的防止一些不想被Googlebot抓取索引的页面,但是这两种方法擅长阻止被Googlebot抓取,对于已经收录的页面,处理起来,会需要一些时间,这个时间甚至长达1...

哪些项目适合做谷歌SEO呢?

哪些项目适合做谷歌SEO呢?

之前发过一篇文章是我们那谷歌SEO的业务员,没错,我就是那个业务,团队唯一的业务。看到文章下面很多人留言,建议把我开掉,还开玩笑说,只要有我这样的业务在,公司就别想做大。不管是建议开掉我的还是支持我的,我在这里都要表达感谢,相信你们都是为了平哥SEO团队有更好的未来,在这个浮躁的社会,能够为别人提一...

谷歌网站结构优化方案有哪些呢?

谷歌网站结构优化方案有哪些呢?

网站结构优化是指通过调整和优化网站的首页、导航、布局等结构,提升网站的用户体验,有助于搜索引擎更好的理解和抓取网站的每个页面,也能更合理的分配网站内部页面的权重,从而提升网站在搜索结果中的排名的一个过程。为什么要对网站结构进行优化?网站结构优化既是要满足用户需求,也要方便搜索引擎的收录。通过合理的网...

谷歌SEO中长域名和短域名哪个好?

谷歌SEO中长域名和短域名哪个好?

在谷歌SEO方面,长域名和短域名各有优势,但总体来说,短域名通常会更有利,原因包括以下几点:用户体验:短域名:更容易记忆和输入,有助于提高用户的访问体验。用户倾向于分享简洁易记的域名,这在社交媒体传播中尤为重要。长域名:可能容易拼错或难以记忆,导致用户在返回或分享时遇到困难,从而影响流量。品牌识别:...

独立站谷歌SEO优化流程是什么?

独立站谷歌SEO优化流程是什么?

今天平哥SEO整理了下我们自己做跨境电商独立站谷歌seo优化的全流程和重点注意事项。唠下嗑:很多人都觉得谷歌SEO优化似乎很难,尤其是个非常难入门的技术活,尤其是对于B2C的跨境电商网站新手站长来说。说下我的个人经历。我本人在入行之前从事了多年的海外广告相关的工作,但我对这个领域直很感兴趣,就路跟着...

做好google seo的技巧由哪几个方面入手呢?

做好google seo的技巧由哪几个方面入手呢?

SEO其实说来说去就包含三样,网站本身技术优化,内容以及外链,而这三样里,网站的技术优化是前提本身,确保网站符合谷歌搜索规范,包括调整网站的结构、速度和移动设备兼容性,以提高用户体验和搜索引擎排名。好的网站优化可以确保访问者能够快速找到他们需要的信息,同时也让搜索引擎更容易爬取和索引你的网站。然后就...