谷歌正在刷新和更新它的 熊猫算法 自2月以来几乎每个月都是这样, 2011年为了推广高质量的网站(低重复内容, 编写良好的, 权威的, 高用户粘性),并降级低质量的网站(技术或编辑重复内容), 糟糕的语法和拼写, 薄/浅内容, 可怜的用户参与). 这些更新的最大因素之一是重复的内容. 注:如果你想知道谷歌认为什么是高质量的网站,请阅读Amit Singhal的文章 博客 关于这个话题.
许多网站已经被谷歌的熊猫更新惩罚有意或无意地在他们的网站上创建重复的内容. 无论内容管理系统(WordPress, Magento, Drupal, 表达式引擎, 社区服务器, etc.),任何网站如不采取适当的预防措施,都可能受到攻击. 这个重复内容SEO指南旨在成为一个完整的指南,让您检查重复的内容, fix it, 并防止重复,以保护您的网站从谷歌熊猫更新在未来.
我把我在搜索引擎优化方面最有帮助的一些内容,变成了一本70多页的电子书,你可以免费下载! This SEO指南电子书 是关于重复内容和SEO的其他重要方面的专家指导.
Copying & 粘贴:复制内容
防止重复内容时要采取的第一个预防措施, 在解决潜在的重复内容问题时,首先要开始, 在您自己的网站上手动复制和粘贴内容吗, 从另一个网站到你自己的网站, 或者从其他人(拥有更大的域名权限)窃取您的内容. 以下几个简单的技巧可以帮助你避免这种情况:
- 确保您没有创建任何新的重复内容 manually. 不要在多个网站上发布同一篇文章/帖子/页面, 或复制/粘贴任何内容到我们的网站上的一个新页面,这个页面的大部分最终是重复的内容. 最多, 您可以“引用”我们网站上其他页面的内容片段(这是常见的,可以这样做), 但是页面的绝大部分内容应该是独特的.
- 识别任何现有的重复内容 你明明知道是从你网站的某个页面复制粘贴过来的, 或者其他网站, 到你网站的另一个页面. 要么通过meta robots标签将这些页面设置为“noindex,follow”,要么从你的网站上删除它们. 如果你的网站有数据提要(来自其他网站)作为页面上唯一的内容, 然后需要在页面顶部编写足够独特的内容, 或者设置为“noindex”,关注”(或删除).
- 找到当前存在于你的网站上的无吸引力的单薄内容或者让它更健壮, 将其设置为“noindex”,关注”或简单地将页面重定向到与该主题更相关的页面. 薄的内容,例如,可以是一篇只有1- 3句话的博客文章,就是这样. 虽然谷歌的成员在谷歌的支持论坛中提到,短内容仍然可以排名很好, 请记住,除非你是一个知名品牌,否则很难用如此短的内容来吸引人, 很有创意. 衡量你成功与否的最佳方法是查看谷歌Analytics中短内容页面的跳出率. 如果它远远高于你网站的平均水平,那么它对你是弊大于利的.
案例研究:手动粘贴其他网站的内容

谷歌的目标是提供最高的质量, 最权威的内容对一个主题的搜索用户. 你的目标是创造同样的东西. 至于谷歌是否100%准确,那就是另一回事了!
重复内容的技术来源
以下是搜索引擎优化和电子商务部门最近一直在解决的项目列表, 导致这些初步改善:
- 从搜索引擎索引中删除搜索结果页面. 如果你的网站有内部搜索功能,你的网站不是很大,搜索结果页面不需要充当分类页面(i.e. - eBay),然后你必须通过meta robots标签将这些页面设置为“noindex,follow”. 这些都是纯粹的重复内容和竞争 real 你网站的内容(主页,分类页面,产品页面和策划登陆页面).
- 确保我们希望搜索引擎索引的所有页面上都有规范的url. 当编辑, 子公司, Twitter和其他推荐链接到您的网站,并在url末尾添加跟踪代码, 这就产生了一个真正的问题. 搜索引擎可能会在一个页面上看到数百个不同版本的URL,结果就是, 以为它们都是不同的页面,但实际上并非如此. 这种重复内容的问题可以通过使用规范标记来解决. 它们为搜索引擎定义了一个URL的单一版本,以确保它是搜索引擎索引的唯一URL.
- 从搜索引擎的索引中删除结帐/购物车页面. 如果你经营一个电子商务网站, 搜索引擎没有业务索引我们网站上的任何内容,从点点击“添加到购物车”按钮向前. 结果是, 最好将所有这些页面设置为“noindex”,Nofollow”,并禁止在你的机器人中访问它们.TXT文件,所以搜索引擎不索引他们.
- 从搜索引擎的索引中删除WordPress站点上的标签页. 当编辑创建新内容时, 是WordPress网站的命脉, 他们经常在每个帖子上添加多个标签. 完成后,将为每个标记创建一个新的URL/页面. 这个页面只是重新使用的文章片段,并且没有任何独特的内容. Thus, 建议所有WordPress站点的标签页都设置为“noindex”,遵循“防止/扭转熊猫处罚”.
- 在类别页面顶部添加独特的内容. 分类页面存在于大多数网站,往往目标非常普遍, 高搜索关键词, 经常链接到从顶部导航菜单, 因此在网站上很有分量. 他们还可以吸引更多的链接. However, 除非独特, 介绍性的描述内容被添加到这些页面的顶部……它们就像上面的标签页一样. 要查看示例,请访问 SEO博客本网站网页. 简单地添加100+字的独特内容分类页面,以避免页面被认为是纯粹的重复内容谷歌.
- 注:当Gaiam(著名的瑜伽器材制造商)重新设计其网站时, 他们在瑜伽垫的主页面上删除了介绍内容 “瑜伽垫”在谷歌排名第一.” 在写这篇文章时,盖亚姆是 谷歌排名第四. Clearly, 类别页面很容易出现重复内容,如果没有考虑到这一点,可能会让你的公司损失严重的收入.
- 修复重复/空元标签. 如果你还没有建立你的网站谷歌和必应 网站管理员工具在美国,你错过了不可思议的免费工具. 这些在线应用程序让网站管理员难以置信地了解这些搜索引擎如何查看他们的网站. 最重要的区域之一是“HTML改进”部分,它指出了我们网站上哪些页面有重复的元标题, 缺少元标题, 重复元描述, 缺少元描述, etc. 虽然这些问题很容易解决, 手动或通过脚本修改, 它们通常是页面实际主体内容中更深层次的重复内容问题的线索.
- 提高搜索机器人在爬行网站的效率. 虽然这不是重复内容的来源,但通过机器人阻止访问不必要的页面的积极影响.txt文件, 规范化的url, 并将不必要的页面设置为“noindex”,是我们提高谷歌的可能性, 必应和其他搜索引擎将全面抓取和索引所有的 实际内容 我们网站上的网页.
- *重写产品页面上重复的产品描述. 这很关键. 大多数电子商务网站采取了简单的路线,简单地使用制造商的产品页面的描述. 你猜怎么着? (几乎)其他所有销售相同产品的网站也是如此. 除非你的产品页面上有独特的评论(不太可能……获得评论是非常困难的), 如果你没有很高的域名授权,那么你的产品页面在谷歌的排名就不会很好. 解决办法是让你的产品描述独一无二. 使用像这样的网站 克劳德的 回顾最受欢迎的众包网站,可以帮助重写产品页面. 这需要投资,但你需要花钱来赚钱. 而且,重写产品描述比建立链接要便宜得多, 建立域管理机构需要什么.
这些只是技术重复内容的几个例子, 我们还在继续寻找更多. 你有发现类似的东西吗?
内容联合=重复内容(除非……)
内容联合是跨域重复内容的常见来源. 这可能包括:
- 将你的内容联合到其他网站
- 联合其他网站的内容到你的网站
- 在拥有的网站之间聚合内容
所有这些内容开发方法都在今天的在线世界中使用(有时出于合理的原因), 然而,它们会给有机搜索引擎优化带来严重的风险. 让我们考虑这样一种情况,你每周通过内容联合协议向外部网站提供X数量的文章(这些文章最初发布在你的网站上). 作为交换, 通过链接到我们的网站(从他们的网站上你的文章),你得到一个体面的流量推荐回到我们的网站. 有人会认为这是一个不错的策略(即使他们链接到我们网站上的源文章), 但它仍然为像谷歌这样的搜索引擎“弄错”,看到我们自己的原创内容(在我们的网站上)在完整的文章发布在两个网站上的情况下是重复的. 这种情况经常发生在您将内容聚合到的站点具有比您自己的站点更高的域名权限的情况下.
避免重复内容的解决方案:
- 将复制的内容设置为“noindex,follow” 通过页面源代码中的meta robots标签. 这对你们大多数人来说可能听起来很难懂, 但重要的是要记住“noindex”这个短语,作为一个在线出版商. 这意味着: “亲爱的谷歌,请不要索引这个页面,而是跟随上面的链接.” 这允许我们把我们的内容放在其他网站(或我们自己的其他网站), 或者把其他网站的内容放在我们自己的网站上,但不允许搜索引擎索引重复的页面,这样就避免了重复的内容问题,这会让我们受到惩罚,导致流量下降.
- 将复制页面的规范URL设置为原始文章的URL 在页面的源代码中. 对你们大多数人来说,这可能听起来很难懂, 但对于在线出版商来说,了解“规范”一词的含义是很重要的.
- 规范URL =一个页面的权威正确URL. 当一个页面可以通过多个url访问时, 应该标识一个规范的URL(在页面的源代码中). (source)
我们可以发布www.domain1.com/article on www.domain2.com/article, 但要求内容联合合作伙伴(其他网站所有者)在其网站的网页源代码中放置以下代码行:
通过这种方式,我们告诉搜索引擎:“不,不,它可能看起来像http://www.domain2.com/article是这个页面的URL,但是http://www.domain1.com/article是你应该建立索引的唯一URL. 搜索引擎接受这一点,并鼓励我们使用它.
这是避免内容联合产生重复内容的两种最普遍接受的解决方案. 如果您的内容联合合作伙伴不愿实现此类技术请求, 那么你需要认真评估与熊猫惩罚的真正危险相比,这种关系的价值. 从谷歌失去大部分流量值得吗?
使用谷歌的 Site: 检查重复内容的命令
The site: 命令可以在谷歌查询中使用,以查找任何网站上的特定页面. 这是一个灵活的工具,可以与其他搜索操作符一起使用,以帮助查找内部重复的内容. 以下是一些使用这个工具的更有效的方法:
- site:www.websiteurl.com -这拉出谷歌的索引在这个URL下的页数. 检查你网站的url数量.
- site:www.websiteurl.Com“来自页面的文本内容块” -这将显示您网站上的其他页面是否在多个页面上具有相同的内容主体. 这是一种变体——只是在引号中搜索文本主体, 可以快速显示您是否其他网站正在采取您的内容.
- site:www.websiteurl.com inurl: = -使用此命令查看由于站点的排序/搜索功能,谷歌是否正在索引重复的url.
- 网站:websiteurl.com inurl: http -可用于显示您的URL的安全/http版本是否可能导致重复内容问题. 例如: site:www.writersmarket.com inurl: http 作家市场只有两个.
了解更多 谷歌运营商 为了扩大使用这些命令查找重复内容的知识.
管理被盗/被窃取的内容
如果你不小心,互联网上的刮刮者和不道德的网站管理员会窃取你的内容. 如果您发现您的内容未经您的书面同意在网上其他地方发布, 你有几个选择:
- 给网站管理员或作者发邮件 -这是第一个开始的地方. 在窃取你网站的网站上寻找“足彩推荐软件app排名人”页面. 如果没有,查找域名所有者via www.whois.com 如果列出了足彩推荐软件app排名方式,可以发邮件或打电话. 如果你能足彩推荐软件app排名上, 礼貌地开始谈话,让网站管理员知道你在浏览他们的网站时找到了你的内容. 如果你的页面只有一部分被复制,那么我们把它作为一个链接建设的机会. 简单地提供他们在他们的网站上保留内容,以换取一个链接回到你网站上的内容片段的完整来源. 如果你的整个页面被复制, 然后要求网站管理员删除它, 如果重复的内容会损害你们两个网站的流量. 作为安慰, 你可以为网站管理员提供内容的简短摘要/片段,以换取你网站上完整内容的链接. 这对双方来说都是双赢的,你得到了一个链接!
- 向谷歌提交搜索移除/DMCA投诉.