网站路径是最容易被站长们忽略的关键点,网站路径对于网站的结构有着关键的影响,并且对于seo优化起到了深远的影响。今天给大家分享下,网站路径与网络推广渠道之间的关系,我们应该如何处理正确地处理网站路径。
路径层级
对于蜘蛛抓取层面,网站的路径应该控制在3-5层,这是比较合理的一个区间,并且这个层级越短对于蜘蛛的抓取更友好。当然层级也不能少于3层,虽然利于抓取但是不利于网站内容的层级显现。
这里推荐大家网站层级控制在3层,第 一层首页,第二层可以是列表或者是栏目页,第三层则是详情页面。如果站点内容比较复杂的可以将几层路径合并为一层,总体控制在3层,合并对于路径。
链接无序化
内容原创对于网络推广的优化服务非常的重要,但是泛滥的采集行为让人防不慎防,常见的方法无非只是增加了采集难度,只要可以访问到链接就可以采集。这里给大家提供一个非常有用的方法,巧妙地利用网站路径来规避采集。
采集的危害在于对站点的大批量采集,所以关键点在于要防止站点大多数的内容被采集,好的方法就是把所有的路径给隐藏起来。很多站点的路径都是有规律的大多数都是同栏目的内容通过id自增实现,可以通过暴力枚举id来爬取全站的内容。
所以,站点需要通过将链接url无序化处理,处理方式就是在第三层的id添加脏数据,比如id加时间戳、或随机字符串,推荐可以添加关键词的拼音,提升关键词匹配的几率同时无序化来了网站路径。
列表数据范围控制
内容无序化之后更加关键的是,列表栏目页一定不能翻页显示全部的内容,可以根据自身的网络推广服务需要仅展示一定范围的数据。对于用户来说一般正常人也最多浏览1-3页的列表,更加高效的获取需求内容会通过搜索实现。
做到以上两点之后,爬虫基本上无法通过站点可显链接抓取到全站的内容;同样搜索引擎也无法抓取到全站的内容。这一点可以通过sitemap网站地图提交来解决,需要注意的是sitemap的路径要复杂,并且不要在任何位置公布出来。
因此,合理的布局网站路径结构不但可以增强搜索引擎蜘蛛抓取的友好性,同时可以很好规避内容被采集的情况。