在网站优化(SEO)中,noindexnofollow 是两条非常常见的指令。它们看似相似,但在本质上作用完全不同。很多站长因为混淆这两个概念,导致收录和排名出现问题,甚至误伤了自己的网站权重。 本文将用通俗易懂的方式,帮你彻底搞清楚它们的区别、用法、默认值、使用原因和最佳实践。

noindex 与 nofollow 的定义

什么是 noindex?

noindex 的作用是告诉搜索引擎 不要将这个页面收录到索引中

HTML 写法

<meta name="robots" content="noindex" />

HTTP Header 写法

X-Robots-Tag: noindex

效果

  • 搜索引擎可以抓取并读取页面内容,但不会在搜索结果中显示这个页面。
  • 如果有其他页面链接到这个 URL,Google 可能会显示 URL 但不显示摘要(带提示“描述不可用”)。

什么是 nofollow?

nofollow 的作用是告诉搜索引擎 不要传递链接权重(Link Juice)给页面中的外部链接。

HTML 写法(在 <meta> 标签中作用于全页面的所有链接):

<meta name="robots" content="nofollow" />

单个链接写法

<a href="https://example.com" rel="nofollow">示例链接</a>

效果

  • 搜索引擎依然可以抓取目标链接(如果能从别处发现),但不会通过该链接传递权重。
  • 主要用于控制权重分配、防止垃圾外链(spam)。

为什么要使用 noindex / nofollow?

在 SEO 策略中,并不是所有页面和链接都值得被搜索引擎平等对待。noindexnofollow 的使用,可以帮助你精准控制收录与权重流向。

使用 noindex 的原因

  1. 节省爬虫抓取预算(Crawl Budget):搜索引擎每天对你网站的抓取量是有限的,屏蔽价值低的页面,可以让爬虫更多访问重要页面。
  2. 防止重复内容:比如分页、标签页、参数化 URL,可能与主页面内容重复,影响排名。
  3. 隐藏隐私或低价值页面:如后台管理、登录页、结算页、隐私政策页等,对搜索用户没有意义。
  4. 临时屏蔽测试页面:防止未完成或敏感信息被提前收录。

使用 nofollow 的原因

  1. 防止垃圾外链影响权重:评论、论坛、UGC 内容中的外链可能是垃圾链接,传递权重会影响你网站信誉。
  2. 遵守搜索引擎广告政策:Google 明确要求付费链接加 rel="nofollow"rel="sponsored"
  3. 不为不信任的站点背书:如果引用的内容不保证质量,可以加 nofollow 避免权重传递。
  4. 控制权重流向:对非核心内容页面的链接加 nofollow,集中权重到重要页面。

默认值说明

如果你不写 noindexnofollow,搜索引擎会默认:

  • index(收录):页面内容会被索引,可能显示在搜索结果中。
  • follow(传递权重):页面内的链接会被爬取,并将权重传递给目标页面。

默认等价于

<meta name="robots" content="index, follow" />

换句话说,noindexnofollow 只是限制默认行为,不写它们,搜索引擎就会:

  1. 收录你的页面(除非被 robots.txt 或算法过滤)。
  2. 跟踪并传递权重给页面上的链接。

noindex 与 nofollow 的区别对比

特性noindexnofollow
作用对象整个页面页面上的链接(或全站链接)
核心目的阻止页面被收录阻止链接传递权重
搜索引擎是否抓取可以抓取(但不收录)可以抓取(但不传权重)
对 SEO 排名影响阻止该页面参与排名影响被链接页面的权重流动
常见用途隐私页、后台页、临时页付费链接、广告链接、用户生成内容

noindex 的常见应用场景

  1. 隐私政策、条款页面
  2. 站内搜索结果页
  3. 测试/临时页面
  4. 重复内容的分页页面(noindex, follow)

nofollow 的常见应用场景

  1. 付费广告链接
  2. 用户生成内容(UGC)外链
  3. 不信任的外部链接
  4. 非核心内容页面的链接

noindex 和 nofollow 可以一起用吗?

可以,而且在某些情况下建议同时使用,比如后台页面:

<meta name="robots" content="noindex, nofollow" />

效果:不收录页面,也不传递任何权重。

Google 对 noindex 和 nofollow 的处理细节

  • noindex:必须可抓取页面才能生效,如果 robots.txt 阻止了抓取,Google 可能看不到它。
  • nofollow:Google 2019 年后将其视为提示(hint),可能会选择性抓取链接。

最佳实践建议

  1. noindex 放在 <head>,不要放在 <body>
  2. 对非 HTML 文件用 HTTP Header 设置 noindex。
  3. 不要用 robots.txt 代替 noindex。
  4. 定期审查 noindex 和 nofollow 的使用情况,避免误伤。

常见误区与注意事项

误区 1:robots.txt 能替代 noindex

错误。robots.txt 只是阻止抓取,不等于不收录。Google 可能会通过外部链接收录该 URL。

误区 2:nofollow 可以防止页面被收录

错误。nofollow 不会阻止搜索引擎访问或收录目标页面,只是不传递权重。

误区 3:noindex 会立刻删除页面收录

不一定。搜索引擎需要再次抓取页面才能处理 noindex,删除收录可能需要数天或数周。

误区 4:nofollow 完全阻断搜索引擎访问链接

错误。Google 在 2019 年起将 nofollow 当作提示(hint),可能依然会抓取。

误区 5:meta 标签放哪里都行

错误。 必须放在里,越靠前越好。

注意事项:

  • 如果要控制 PDF、图片等非 HTML 文件收录,必须用 HTTP Header 的 X-Robots-Tag。
  • 在大型网站里批量使用 noindex 和 nofollow 之前,建议先做全站 SEO 审计,避免无意屏蔽高流量页面。
  • 对于分页、标签页等,noindex, follow 比完全屏蔽权重更利于 SEO 内链结构。

总结

  • noindex:阻止页面收录(覆盖默认的 index
  • nofollow:阻止权重传递(覆盖默认的 follow
  • 默认值是 index, follow,也就是收录并传递权重。

合理搭配这两个指令,可以优化网站收录策略、提升权重分配效率、防范垃圾外链。注意使用前先确认需求,避免无意屏蔽有价值的页面或权重。


也可以看看