Google搜索引擎要求站点的URL 结构应尽可能简单。考虑组织您的内容,使 URL 的构造符合逻辑,并以人类最容易理解的方式进行。如果可能,请在您的 URL 中使用易读的词而不是长 ID 号。
过于复杂的 URL,尤其是那些包含多个参数的 URL,可能会创建不必要的大量指向您网站上相同或相似内容的 URL,从而给抓取工具带来问题。因此,Googlebot 可能会消耗比必要更多的带宽,或者可能无法完全索引您网站上的所有内容。
此问题的常见原因
许多问题可能导致不必要的大量 URL。这些包括:
- 一组项目的附加过滤。许多网站提供同一组项目或搜索结果的不同视图,通常允许用户使用定义的标准过滤这组(例如:显示海滩上的酒店)。当过滤器可以以附加方式组合时(例如:海滩上的酒店和健身中心),网站中的 URL(数据视图)数量会激增。创建大量略有不同的酒店列表是多余的,因为 Googlebot 只需要查看少量列表即可访问每家酒店的页面。例如:
- 动态生成文档。由于计数器、时间戳或广告,这可能会导致微小的变化。
- URL 中有问题的参数。例如,会话 ID 可以创建大量重复项和更多 URL。
- 排序参数。一些大型购物网站提供多种方式来对相同的商品进行排序,从而导致 URL 的数量大大增加。例如:
https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
- URL 中不相关的参数,例如引用参数。例如:
https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
- 日历问题。动态生成的日历可能会生成指向未来和以前日期的链接,而对开始或结束日期没有限制。例如:
https://www.example.com/calendar.php?d=13&m=8&y=2011
- 损坏的相对链接。断开的相对链接通常会导致无限空间。通常,由于重复的路径元素会出现此问题。例如:
https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
解决这个问题
为避免 URL 结构的潜在问题,我们建议如下:
- 考虑使用 robots.txt 文件来阻止 Googlebot 访问有问题的网址。通常,请考虑阻止动态 URL,例如生成搜索结果的 URL,或可以创建无限空间的 URL,例如日历。在 robots.txt 文件中使用正则表达式可以让您轻松阻止大量 URL。
- 尽可能避免在 URL 中使用会话 ID。考虑改用 cookie。
- 尽可能通过修剪不必要的参数来缩短 URL。
- 如果您的站点有无限日历,请将
nofollow
属性添加到指向动态创建的未来日历页面的链接。 - 检查您的站点是否存在损坏的相关链接。
延伸阅读
- google官方noindex、nofollow、noarchive及nosnippet等meta标签用法讲解 (1.000)
- Yoast SEO教程系列:如何使用Yoast SEO内容分析工具 (1.000)
- SEO基础知识:什么是固定链接? (1.000)
- SEO技术系列教程:SEO友好URL的设置方法 (1.000)
- SEO基础知识:什么是面包屑?为什么它们对SEO很重要? (1.000)
- SEO基础知识系列: 改善网站结构的意义和实践方法 (1.000)
- Google搜索引擎可索引收录的文件类型 (RANDOM - 1.000)