网络孕育了网站,网站的诞生让企业在线上多了一个门店,一个新的获客渠道。为了让用户在“光临”门店的时候有所收获,我们需要不断输出专业的内容或者从业心得和经验。不过除非专门聘了运营写文章,不然很少有老板能持续不断的输出,所以现在做网站优化时,企业常常是采用伪原创的方式来编写内容。
不过这里面还存在一个问题,文章内容原创或是伪原创,但是不符合搜索引擎的爬取习惯,很容易出现文章不被收录或者收录不高的情况,这时该如何做呢?下面跟深圳百快抖网络一起跟来看看:
审查网站整站结构是否符合爬虫抓取原则
①整站结构呈现多目录的情况,一级目录多达七八十个是不符合的。
②网站内容百科主体页面,不存在任何内部链接是不符合的。
③网站列表页面存在侧栏调用缺失的情况是不符合的。
④网站新增内容,部分页面并没有明显的时间因子是不符合的。
⑤网站页面标题,多级分类名称展现,使得标题文字展现超长是不符合的。
⑥每日新增内容,难以在首页与站内非相关页面展现是不符合的。
⑦页面访问速度3-4秒PC端是不符合的。
⑧没有HTML网站地图是不符合的。
上述不符合的地方,接下来就是优化的解决方案:
①标准化页面标题
采用:内容、列表、tag名称+品牌词的形式,比如:SEO标题-品牌词
将整站所有页面标题统一调整成简短的形式,这个时候有的小伙伴会担心大量调整标题出现降权的情况,我们不能完全保证这个情况不发生,但我们基于有限时间周期内,就需要强势推进调整,出现问题之后再根据实际情况来解决。
②调整网站速度
深入和对方运营的技术沟通,合理的优化了数据库维护的策略,同时,升级网站配置和带宽,本打算启用百度云加速,后来我们实测页面打开速度可以有效的控制在1.5秒-2秒PC端。
③制定输出频率
网站原因API自动提交的时间周期相对的集中,调整之后,我们采取两个策略,白天提交日均新增的1万个页面,进行每小时平均分配,而晚上时间我们同样提交一万个长尾词的搜索结果页,采用的策略同样是平均分配。
④搭建网站内链结构
内链结构我们主要分为两个部分,一部分就是现有站内核心排名关键词需要的栏目与内容页的关联,其次,一个策略主要是在15万个页面中,识别长尾关键词新增页面,将这部分页面导入到现有页面中。这样我们在站内基本形成一个相对性的循环状态,单页->搜索结果聚合页->展现的每一个单页,然后再次循环下去。采用这个策略的核心目的就是希望站内的每一个页面都存在多次被爬行与抓取的几率,从而提升页面的收录量。
⑤建立HTML版本地图
在这个过程中,由于早期分类目录数量众多,我们短期内,进行有效的目录合并非常不现实,因此,在实际操作的过程中,我们创建了5个HTML版本的网站地图。 每个页面平均展现20个分类,每个小分类调用最新与随机性内容,进行合理的展现。 单页面顶部导航展现5个HTML版本的链接入口,提供搜索引擎蜘蛛进行爬行。
以上就是《网站优化时,文章收录不高怎么办》的相关内容,希望能帮助到大家吧~