众所周知的是搜索引擎越来越关注原创性的文章,而众多网站为了达到排名及流量目的,采用各种手法才对复制性的文章进行修改,然而多数的伪原创其实只是一种的方法,搜索引擎远远没有我们想象的简单。搜索引擎如何识别原创和伪原创文章?可以通过下面几个方面:
1.关键词词频:这里大家需要了解一个名词:“信息指纹”,信息指纹类似人类的指纹。搜索引擎截取一定目标文字,然后根据一定的算法,将文字及其权重为一定的编码,这些文字可能是几个字符,可能是一句话或者几句话,通常一篇文章对应多个信息指纹,如果你的文章是原创性的文章的话,搜索引擎会根据信息指纹判断。
2.文章锚文本连接:相同的一篇文章,被各个网站相互转载,如果有文章内部的锚文本连接都指向同一个网站的话,这无疑会增加被搜索引擎认可是原创的筹码。
3.文字顺序:如果两个文本的信息指纹完全相同的话,理论上可以认为两个文本完全一样,但是实际上却不是这样,既然搜索引擎会截取一定的字符作为信息指纹的基础,那么通过打乱这些字符的顺序也可以得到不同的信息指纹。
4.文章发布时间:相同的一篇文章,发布并且被搜索引擎收录的时间越早,越容易被搜索引擎认为是原创文章。
通过以上几点我们不难发现,原来一些SEO所谓的伪原创创作手法在搜索引擎看来是如此的“小儿科”,下面的几种伪原创手法都是不可取的:
1.修改首段及末端:这是绝大多数SEO采用的手法,同时也被广大编辑所认可,简单修改首段及末端就可以让搜索引擎认为伪原创么?不一定,当修改幅度不足以影响主关键词词频的时候是不能起到任何作用的,搜索引擎看它和复制的文章没有两样。
2关键词替换:SEO市场上流行着各种伪原创工具,基本上都是依靠关键词替换而来,通过建立一定量的同义词词库,使文章内同义词相互替换而达到伪原创的效果,上海SEO曾手动整理了两万多同义词进行试验,基本作用不大,因为关键词可替换的词相对来说太少,一篇文章整体替换后也就缺乏可阅读性了。
3.图片替换法:我记得曾经见到过有网站利用图片替代停止词及标点符号,这么如果是纯粹为了让搜索引擎认为是伪原创的话我认为就太可笑了,但是这种方法不失为一种防治信息拷贝的好方法,一句话,对搜索引擎没用,对用户有用。
4.调整段落顺序:这个就不多说了,简单调整顺序是不能起到任何的伪原创作用。
当然还有一些其他方法,比如几篇文章整合为一片文章、调用上一篇或者下一篇文章描述等等,在搜索引擎看来,这些手法不是一种常有效的手法。
搜索引擎越来越打击经过SEO优化的网站,这不得不让我重新对网站优化行业进行思考:随着搜索引擎的进步。垃圾网站会逐步被搜索引擎和用户所抛弃,如果你是一个正规的网站,自己撰写或者聘请几个专业的编辑,写些对用户有用的东西,脱离SEO,才是最好的SEO。