当前位置:首页 > 学无止境 > Web前端 > 如何禁止网站内容被搜索引擎收录的几种方法讲解

如何禁止网站内容被搜索引擎收录的几种方法讲解

鲁豫2年前 (2022-07-26)Web前端5066

前言


通常做网站的目标就是让搜索引擎收录,扩大推广面,但是如果你的网站涉及个人隐私或者机密性非公开的网页而需要禁止搜索引擎收录抓取的话,该如何操作呢?比如淘宝网就是禁止搜索引擎收录的一个例子,本文将教你几种做法来实现屏蔽或禁止搜索引擎收录抓取网站的内容。



搜索引擎蜘蛛不断爬行互联网,如果我们网站没有做出禁止搜索引擎收录的操作,很容易就会被搜索引擎收录。那么下面介绍一下怎么样禁止搜索引擎收录网站内容。

效果






教程一


第一种、robots.txt方法



搜索引擎默认的遵守robots.txt协议(不排除某些耍流氓的引擎),创建robots.txt文本文件放至网站根目录下,编辑代码如下:

User-agent: *
Disallow: /


通过以上代码,即可告诉搜索引擎不要抓取采取收录本网站,注意慎用如上代码:这将禁止所有搜索引擎访问网站的任何部分。



如果只禁止百度搜索引擎收录抓取网页



1、编辑robots.txt文件,设计标记为:

User-agent: Baiduspider
Disallow: /

以上robots文件将实现禁止所有来自百度的抓取。



这里说一下百度的user-agent,Baiduspider的user-agent是什么?



百度各个产品使用不同的user-agent:





  • 产品名称 对应user-agent



  • 无线搜索 Baiduspider



  • 图片搜索 Baiduspider-image



  • 视频搜索 Baiduspider-video



  • 新闻搜索 Baiduspider-news



  • 百度搜藏 Baiduspider-favo



  • 百度联盟 Baiduspider-cpro



  • 商务搜索 Baiduspider-ads



  • 网页以及其他搜索 Baiduspider





你可以根据各产品不同的user-agent设置不同的抓取规则,以下robots实现禁止所有来自百度的抓取但允许图片搜索抓取/image/目录:

User-agent: Baiduspider
Disallow: /
User-agent: Baiduspider-image
Allow: /image/


请注意:Baiduspider-cpro和Baiduspider-ads抓取的网页并不会建入索引,只是执行与客户约定的操作,所以不遵守robots协议,这个就需要和百度的人联系才能解决了。



如何只禁止Google搜索引擎收录抓取网页,方法如下:



编辑robots.txt文件,设计标记为:


User-agent: googlebot
Disallow: /


教程二


第二种、网页代码方法



在网站首页代码<head>与</head>之间,加入<meta name="robots" content="noarchive">代码,此标记禁止搜索引擎抓取网站并显示网页快照。





在网站首页代码<head>与</head>之间,加入<meta name="Baiduspider" content="noarchive">即可禁止百度搜索引擎抓取网站并显示网页快照。



在网站首页代码<head>与</head>之间,加入<meta name="googlebot" content="noarchive">即可禁止谷歌搜索引擎抓取网站并显示网页快照。





另外当我们的需求很怪异的时候,比如下面这几种情况:



1. 网站已经加了robots.txt,还能在百度搜索出来?



因为搜索引擎索引数据库的更新需要时间。虽然Baiduspider已经停止访问您网站上的网页,但百度搜索引擎数据库中已经建立的网页索引信息,可能需要数月时间才会清除。另外也请检查您的robots配置是否正确。如果您的拒绝被收录需求非常急迫,也可以通过投诉平台反馈请求处理。



2. 希望网站内容被百度索引但不被保存快照,我该怎么做?



Baiduspider遵守互联网meta robots协议。您可以利用网页meta的设置,使百度显示只对该网页建索引,但并不在搜索结果中显示该网页的快照。和robots的更新一样,因为搜索引擎索引数据库的更新需要时间,所以虽然您已经在网页中通过meta禁止了百度在搜索结果中显示该网页的快照,但百度搜索引擎数据库中如果已经建立了网页索引信息,可能需要二至四周才会在线上生效。



3. 希望被百度索引,但是不保存网站快照,如下代码解决:



<meta name="Baiduspider" content="noarchive">




4. 如果要禁止所有的搜索引擎保存你网页的快照,那么代码就是下面的:



<meta name="robots" content="noarchive">




下面列出一些常用的代码组合:





  • <META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">:可以抓取本页,而且可以顺着本页继续索引别的链接



  • <META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW">:不许抓取本页,但是可以顺着本页抓取索引别的链接



  • <META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW">:可以抓取本页,但是不许顺着本页抓取索引别的链接



  • <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">:不许抓取本页,也不许顺着本页抓取索引别的链接





总结



以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对的支持。如果你想了解更多相关内容请查看下面相关链接


文章出处: 阅读原文

版权声明:本文由微站Blog发布,如需转载请注明出处。

免责声明:微站技术博客所有资料搜集整理于互联网或者网友提供,并且以计算机技术研究交流为目的,仅供大家参考、学习,不存在任何商业目的与商业用途。资料获取后24小时内请删除资料,不得用于任何商业用途。否则后果自负!博主不保证资料的安全性!也不承担任何责任!切勿用博主分享的任何资料运营!

本文链接:http://ys.vzcc.cc/post/89.html

分享给朋友:

“如何禁止网站内容被搜索引擎收录的几种方法讲解” 的相关文章

评论列表

tlwazo46129PX-
tlwazo46129PX- IP:
2个月前 (07-09)

识别码:tlwazo46129PX-csgo在线开箱 http://m.jinanyaoyuan.com/news-/19641.html

游客
游客 IP:
2个月前 (07-09)

楼上的很有激情啊!http://gko.yuxiaoguang.com

vmdsge83104LP-
vmdsge83104LP- IP:
2个月前 (07-10)

识别码:vmdsge83104LP-这篇文章真是让人受益匪浅!它让我们在学习的过程中不断进步,也让我们在成长的道路上更加坚定。感谢你的分享,宝宝取名网会永远为你提供支持和帮助。

游客
游客 IP:
2个月前 (07-10)

楼主内心很强大!http://nfklh9.cyansm.com

mzxysd81637XQ-
mzxysd81637XQ- IP:
2个月前 (07-10)

识别码:mzxysd81637XQ-这个平台的内容质量很高,值得长期关注。

游客
游客 IP:
2个月前 (07-10)

论坛的人气越来越旺了!http://1k4dp.xmdgjzzs.com

游客
游客 IP:
2个月前 (07-11)

收藏了,很不错的内容!http://e5v2.bfdt2000.com

游客
游客 IP:
2个月前 (07-11)

楼主很有经验啊!http://3s0.cyansm.com

游客
游客 IP:
2个月前 (07-11)

不是惊喜,是惊吓!http://syv.rdhyjx.com

游客
游客 IP:
2个月前 (07-11)

顶一个!http://k2v.xmdgjzzs.com

游客
游客 IP:
2个月前 (07-11)

哥回复的不是帖子,是寂寞!http://zjg.175vision.com

mtxafz82751RQ-
mtxafz82751RQ- IP:
2个月前 (07-11)

识别码:mtxafz82751RQ-网站导航清晰明了,找资料非常方便。

游客
游客 IP:
2个月前 (07-11)

我只是来赚积分的!http://3tadqq.ycotc.com

游客
游客 IP:
2个月前 (07-11)

这里的资源非常丰富,帮助我解决了很多问题。http://eetv51.bfdt2000.com

游客
游客 IP:
2个月前 (07-11)

最近压力山大啊!http://fcva8i.rdhyjx.com

游客
游客 IP:
2个月前 (07-11)

大神就是大神,这么经典!http://k4rz.xmdgjzzs.com

游客
游客 IP:
2个月前 (07-11)

楼主写的很经典!http://5cweqz.ycotc.com

游客
游客 IP:
2个月前 (07-11)

今天怎么了,什么人都出来了!http://y02o.bfdt2000.com

游客
游客 IP:
2个月前 (07-11)

顶顶更健康!http://l4bo.thskglj.com

游客
游客 IP:
2个月前 (07-11)

顶顶更健康!http://4y3.cyansm.com

游客
游客 IP:
2个月前 (07-11)

楼主加油,看好你哦!http://hksa.rdhyjx.com

游客
游客 IP:
2个月前 (07-11)

强,我和我的小伙伴们都惊呆了!http://yvloe.cyansm.com

游客
游客 IP:
2个月前 (07-11)

支持楼上的!http://vrcw.ycotc.com

游客
游客 IP:
2个月前 (07-11)

楼主是一个神奇的青年!http://y32jgn.yin-bao.com

游客
游客 IP:
2个月前 (07-11)

好无聊啊!http://pc3dv.yin-bao.com

游客
游客 IP:
2个月前 (07-11)

观点鲜明,立场坚定,作者态度明确。http://gi3g.cyansm.com

游客
游客 IP:
2个月前 (07-11)

顶一下,收藏了!http://zk8.thskglj.com

游客
游客 IP:
2个月前 (07-11)

信楼主,得永生!http://j6749.rdhyjx.com

游客
游客 IP:
2个月前 (07-11)

楼主加油,看好你哦!http://dob6n6.cyansm.com

发表评

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。