在网站优化(SEO)中,noindex
和 nofollow
是两条非常常见的指令。它们看似相似,但在本质上作用完全不同。很多站长因为混淆这两个概念,导致收录和排名出现问题,甚至误伤了自己的网站权重。
本文将用通俗易懂的方式,帮你彻底搞清楚它们的区别、用法、默认值、使用原因和最佳实践。
noindex 与 nofollow 的定义
什么是 noindex?
noindex
的作用是告诉搜索引擎 不要将这个页面收录到索引中。
HTML 写法:
<meta name="robots" content="noindex" />
HTTP Header 写法:
X-Robots-Tag: noindex
效果:
- 搜索引擎可以抓取并读取页面内容,但不会在搜索结果中显示这个页面。
- 如果有其他页面链接到这个 URL,Google 可能会显示 URL 但不显示摘要(带提示“描述不可用”)。
什么是 nofollow?
nofollow
的作用是告诉搜索引擎 不要传递链接权重(Link Juice)给页面中的外部链接。
HTML 写法(在 <meta>
标签中作用于全页面的所有链接):
<meta name="robots" content="nofollow" />
单个链接写法:
<a href="https://example.com" rel="nofollow">示例链接</a>
效果:
- 搜索引擎依然可以抓取目标链接(如果能从别处发现),但不会通过该链接传递权重。
- 主要用于控制权重分配、防止垃圾外链(spam)。
为什么要使用 noindex / nofollow?
在 SEO 策略中,并不是所有页面和链接都值得被搜索引擎平等对待。noindex
和 nofollow
的使用,可以帮助你精准控制收录与权重流向。
使用 noindex 的原因
- 节省爬虫抓取预算(Crawl Budget):搜索引擎每天对你网站的抓取量是有限的,屏蔽价值低的页面,可以让爬虫更多访问重要页面。
- 防止重复内容:比如分页、标签页、参数化 URL,可能与主页面内容重复,影响排名。
- 隐藏隐私或低价值页面:如后台管理、登录页、结算页、隐私政策页等,对搜索用户没有意义。
- 临时屏蔽测试页面:防止未完成或敏感信息被提前收录。
使用 nofollow 的原因
- 防止垃圾外链影响权重:评论、论坛、UGC 内容中的外链可能是垃圾链接,传递权重会影响你网站信誉。
- 遵守搜索引擎广告政策:Google 明确要求付费链接加
rel="nofollow"
或rel="sponsored"
。 - 不为不信任的站点背书:如果引用的内容不保证质量,可以加 nofollow 避免权重传递。
- 控制权重流向:对非核心内容页面的链接加 nofollow,集中权重到重要页面。
默认值说明
如果你不写 noindex
和 nofollow
,搜索引擎会默认:
- index(收录):页面内容会被索引,可能显示在搜索结果中。
- follow(传递权重):页面内的链接会被爬取,并将权重传递给目标页面。
默认等价于:
<meta name="robots" content="index, follow" />
换句话说,noindex
和 nofollow
只是限制默认行为,不写它们,搜索引擎就会:
- 收录你的页面(除非被 robots.txt 或算法过滤)。
- 跟踪并传递权重给页面上的链接。
noindex 与 nofollow 的区别对比
特性 | noindex | nofollow |
---|---|---|
作用对象 | 整个页面 | 页面上的链接(或全站链接) |
核心目的 | 阻止页面被收录 | 阻止链接传递权重 |
搜索引擎是否抓取 | 可以抓取(但不收录) | 可以抓取(但不传权重) |
对 SEO 排名影响 | 阻止该页面参与排名 | 影响被链接页面的权重流动 |
常见用途 | 隐私页、后台页、临时页 | 付费链接、广告链接、用户生成内容 |
noindex 的常见应用场景
- 隐私政策、条款页面
- 站内搜索结果页
- 测试/临时页面
- 重复内容的分页页面(noindex, follow)
nofollow 的常见应用场景
- 付费广告链接
- 用户生成内容(UGC)外链
- 不信任的外部链接
- 非核心内容页面的链接
noindex 和 nofollow 可以一起用吗?
可以,而且在某些情况下建议同时使用,比如后台页面:
<meta name="robots" content="noindex, nofollow" />
效果:不收录页面,也不传递任何权重。
Google 对 noindex 和 nofollow 的处理细节
- noindex:必须可抓取页面才能生效,如果 robots.txt 阻止了抓取,Google 可能看不到它。
- nofollow:Google 2019 年后将其视为提示(hint),可能会选择性抓取链接。
最佳实践建议
- noindex 放在
<head>
,不要放在<body>
。 - 对非 HTML 文件用 HTTP Header 设置 noindex。
- 不要用 robots.txt 代替 noindex。
- 定期审查 noindex 和 nofollow 的使用情况,避免误伤。
常见误区与注意事项
误区 1:robots.txt 能替代 noindex
错误。robots.txt 只是阻止抓取,不等于不收录。Google 可能会通过外部链接收录该 URL。
误区 2:nofollow 可以防止页面被收录
错误。nofollow 不会阻止搜索引擎访问或收录目标页面,只是不传递权重。
误区 3:noindex 会立刻删除页面收录
不一定。搜索引擎需要再次抓取页面才能处理 noindex,删除收录可能需要数天或数周。
误区 4:nofollow 完全阻断搜索引擎访问链接
错误。Google 在 2019 年起将 nofollow 当作提示(hint),可能依然会抓取。
误区 5:meta 标签放哪里都行
错误。 必须放在
里,越靠前越好。注意事项:
- 如果要控制 PDF、图片等非 HTML 文件收录,必须用 HTTP Header 的 X-Robots-Tag。
- 在大型网站里批量使用 noindex 和 nofollow 之前,建议先做全站 SEO 审计,避免无意屏蔽高流量页面。
- 对于分页、标签页等,noindex, follow 比完全屏蔽权重更利于 SEO 内链结构。
总结
- noindex:阻止页面收录(覆盖默认的
index
) - nofollow:阻止权重传递(覆盖默认的
follow
) - 默认值是
index, follow
,也就是收录并传递权重。
合理搭配这两个指令,可以优化网站收录策略、提升权重分配效率、防范垃圾外链。注意使用前先确认需求,避免无意屏蔽有价值的页面或权重。