公司新闻
Company news
现在大多数的网站都是数据库驱动,页面由程序实时生成,而不是真正的在服务器上有一个静态HTML文件存在。当用户访问一个网址时,程序根据URL中的参数调用数据库数据,实时生成页面内容。因此动态页面相对应的URL原始状态也是动态的,包含问号,等号及参数,如下面这种典型的URL:
http://seo.sxqswl.net/?cat=8&paged=2
搜索引擎在发展初期(其实也就是10年前到三四年前而已)一般不太愿意爬行和收录动态的URL,主要原因是可能陷入无限循环或收录大量重复内容,造成资源极大的浪费。最典型的无限循环就是网站上出现的万年历,很多博客都按照时间存档,一些宾馆、航班查询网站经常出现万年历形式。
搜索引擎蜘蛛碰到万年历,如果一直跟踪上面的链接,可以不停的点击下一个月,下一年,无穷无尽陷入循环中,每一个如期对应的页面内容也没有什么区别。真实用户一眼就可以看出来这是一个万年历,但搜索引擎面对的只是一串代码,不一定能判断出来这是一个日历。
有时就算不存在无限循环,动态的url也可能造成大量复制页面。比如URL:
http://seo.sxqswl.net/?paged=2&cat=8
和URL
http://seo.sxqswl.net/?cat=8&paged=2
很可能完全一样的内容,都是分类8和第二页内容。URL中参数顺序不一样就是不同的网址。但是调用的参数是一模一样的,内容也是一样的。如果CMS内容管理系统设计不周全的话,这样的情况很有可能出现在网站的页面上。
所以搜索引擎针对动态URL敬而远之,想要网站页面被充分收录,站长需要把动态URL转换成静态URL。
下一篇:H5 是 HTML5 吗?