当前位置:首页 > 谷歌SEO培训 > 谷歌对于robots文件设置要求是什么?

谷歌对于robots文件设置要求是什么?

平哥SEO2024-05-13 14:33谷歌SEO培训723

今天是平哥SEO主讲robots.txt日志文件设置。在上节课我们就了解到,robots文件规定了Googlebot要抓取一个网站页面,首先就要先访问robots文件,而且必须按robots.txt文件里的规矩办事,那么今天我们就来详细了解下如何设置robots日志文件。

一、robots.txt文件基础理论

1、robots.txt工作原理

robots.txt是一个文件,主要是给各个搜索引擎抓取工具看的,里面用来设置一些规则,目的是告诉它们,哪些搜索引擎抓取工具能来抓取,哪些搜索引擎抓取工具不能来抓取,哪些页面可以访问,哪些页面不能访问。

2、robots.txt的好处

①、控制抓取工具预算

如果不了解抓取工具预算的朋友,这里大概解释下,抓取工具预算就是抓取你网站所花费的时间和资源,也就是在有限的时间内,Googlebot抓取网站的页面数量,并且这个预算值是可以变动的,所以有些seo,为了让Googlebot抓取更多的重要页面,他们会从而利用robots.txt来控制。

②、控制部分页面和文件不被抓取

每个网站都有一些页面不想被Googlebot抓取并索引。例如网站的管理后台登录及管理页面、一些暂时性的内容页面、PDF文件、视频、图片等等。

谷歌对于robots文件设置要求是什么?

二、制作robots.txt文件

1、制作方法

①、如果你用的是一些CMS客户管理系统,类似WordPress,shopify等建站工具,那么你就不需要制作这个文件,因为系统会默认生成这个文件,并且把相应的规则填写好,如果你需要添加规则,直接点击修改即可。

②、如果你网站的根目录下面没有这个文件,那请新建一个文件,文件名为:robots.txt的文本文档,然后根据你网站的实际情况,添加相应的规则命令后,用ftp上传到服务器网站根目录就完成了。

备注:如果你想研究学习参考别人网站的robots.txt文件,也可以直接输入他们的域名,加上文件名,例如:www.c-sz.com/robots.txt

需要注意的是,robots.txt文件和网站地图不一样,robots.txt只能以这个名字命名,同时一个站点有且只有一个robots.txt文件。

2、使用方法

个人觉得常用的就三大板块和两个通用符,下面我们通过一个例子来了解吧。

User-agent: Googlebot

allow: /

User-agent: Baiduspider

Disallow: /example1/

Disallow: /example2.html

Disallow: /*.jpg$

Sitemap: https://www.c-sz.com/sitemap.xml

I、“user-agent” :指的用户代理,也就是各大搜索引擎抓取工具。

例如上面的案例中Googlebot和Baiduspider,分别为Google和百度的抓取工具。

不同的搜索引擎,不同的名称,如果有特定要求可以查询相关名称。另外,如果需要区分开不同类型的抓取工具,可以参考上节课的内容。

II、“allow” ,“disallow” :指令是“允许抓取”和“不允许抓取”某些页面路径的意思。

通配符“*”表示匹配0或多个任意字符。

通配符“$”表示字符串的结束,用于结尾。

如上面案例中的,

·允许Googlebot抓取所有页面

·不允许百度蜘蛛抓取example1栏目

·不允许百度蜘蛛抓取example2.html页面

·不允许百度蜘蛛抓取网站所有jpg类型的图片,包括图片为example.jpg?p=12345的类型

III、Sitemap:这个是站点地图的指令,类似提交网站地图的效果,之前的第十课网站地图全面解析课程里面有讲,这里我们只需把所有的站点地图加上就好。

今天就分享到这里,期待能帮助你!

扫描二维码推送至手机访问。

版权声明:本文由【平哥SEO学堂】整理发布,如需转载请注明出处。

本文链接:https://www.c-sz.com/post/13.html

分享给朋友:

“谷歌对于robots文件设置要求是什么?” 的相关文章

FAQs页面利于谷歌SEO排名吗?

FAQs页面利于谷歌SEO排名吗?

频繁出现在各个网站上的FAQs大家并不陌生,FAQs页面已经存在很多年。好的FAQs可以帮助我们填补网站页面上可能存在的空白。很多成熟的互联网人在阅读网页遇到困惑时不再直接寻找客服,而是滑到FAQs,FAQs也促使客户自助服务日益成为一种趋势。当我们在Google搜索问题,当大家向Siri、Goog...

谷歌外链购买如何防止被骗呢?

谷歌外链购买如何防止被骗呢?

做谷歌SEO运营离不开高质量的外链。平哥SEO相信很多人都有考虑或已经在外包平台上购买外链。我们谷歌SEO培训课教程也给大家提供了一些思路和渠道。但不知道你们有没有发现,虽然给某个页面做了很多外链,可工具却不一定能查到。这里面原因很多,可能是工具抓取不到,外链没收录,或是外链付款后还没被收录就删了。...

谷歌SEO:什么是301重定向呢?

谷歌SEO:什么是301重定向呢?

重定向是一种在用户和机器人请求旧URL但页面位置已更改时将其发送到新URL的方法。当您搬到美国的新地址时,您可以通过美国邮政服务(USPS)设置邮件转发。如果有人向您的旧地址发送邮件,USPS将查看他们的邮件转发规则并意识到您不再居住在旧地址。他们会收取邮件并将其递送到您的新位置而不是旧位置。这也是...

Google 算法文档泄露对SEO优化有什么影响?

Google 算法文档泄露对SEO优化有什么影响?

我看到有人在问:“平哥SEO,你怎么看待Google这次文档泄露的事情?”我的观点是,这事情对我们普通SEO玩家没有什么太大的影响,不用杞人忧天。因为就算给你知道算法,你也没有短时间内拥有大量的资源去获取这个算法中的利益。我举个例子,好比很多人说:“数据表明,现在用户行为数据非常重要”,那普通玩家能...

谷歌sge是什么?

谷歌sge是什么?

2024年5月谷歌推出AI概述(SGE),搜索引擎结果页面迎来了颠覆性变革。对于我们做网站的,是否准备好迎接这一挑战,并将其转化为提升网站流量和排名的新机遇?本文将提供7大策略,希望可以抓住SEO机会。1.什么是谷歌AI概述(SGE)?谷歌AI概述,前称SGE,利用人工智能技术生成用户查询的答案摘要...

为何在AI时代还需要谷歌SEO?

为何在AI时代还需要谷歌SEO?

ChatGPT应该是近年来最火爆的话题了。连老高都透漏这是最有可能成为奇异点的存在——因为它从根本上改变了每个人的生产力。你看看周遭的人,似乎每个人都在讨论,每个人都在尝试——那想像一下,如果未来大家都被它驯养了,想到什么问题都是第一时间去问它,不再开Google了,那针对旧有Google来优化的S...