Não permita a indexação de conteúdo duplicado no Wordpress | BrPoint


Publicidade 

Não permita a indexação de conteúdo duplicado no Wordpress

wordpress

Seguindo com os tutoriais para Wordpress, vamos ver como controlar a meta tag robots para que os mecanismos de busca não indexem conteúdo duplicado.

Não ter conteúdo duplicado indexado é muito importante para aumentar o valor de cada página e para evitar penalizações.

Queremos que somente os artigos e páginas sejam indexados e ganhem seus respectivos rankings, sem que as inúmeras páginas de arquivo geradas pelo Wordpress sejam indexadas e acabem penalizando os documentos principais por conteúdo duplicado.

Para atingirmos isso, basta usar o código abaixo no tema em uso no blog, junto as demais meta tags, dentro do <head> </head>:

PHP:
<meta name="robots" content="<?php if ( is_home() || is_archive()) { ?>noindex<?php } else { ?>index<?php } ?>,follow">

Com o código acima, sempre que o robô acessar uma página de arquivo ou a homepage do blog, não fará a indexação, mas seguirá os links, indexando os artigos, que é nosso objetivo.

Compare Preços de: Camera Digital, MP3 Player, iPod, Celular, Livros, CD, DVD, Monitor, TV, Notebook, Wii, PS2, PS3

Compartilhe e Guarde: Esses links facilitam a inclusão deste artigo nas redes sociais. Compartilhe.
  • Rec6
  • StumbleUpon
  • ueba
  • linkk
  • dihitt
  • linkloko
  • websapiens
  • linkto
  • Technorati
  • Simpy
  • del.icio.us
  • Blue Dot

Artigos relacionados







45 Comentários »

Comentário por Carlos Eduardo
2007-04-04 16:05:48

Muito interessante esta dica!

Vou inserir em meu blog para testá-la... Acho que poderá acabar dando diferença mesmo :)

 
Comentário por Alexandre
2007-04-04 16:29:31

Excelente dica! Eu sempre mandava ver no index,follow sem pensar. Imaginava "ah, indexar tudo é sempre melhor", mas isso realmente tem sentido, não é bom manter duplicatas!

Já tô implementando!

 
Comentário por BrPoint
2007-04-04 16:42:27

Carlos e Alexandre, apesar de ser ótimo ser indexado, não é bom indexar conteúdo duplicado, um dos conteúdos será penalizado, o ideal é sempre gerar conteúdo único, garantindo o melhor ranking possível.

Abraços

 
Comentário por Alessandro Martins
2007-04-05 09:23:21

Eu descobri recentemente que tive problemas com isso depois de criar o meu atual blog. Importei boa parte de minhas crônicas do Cracatoa Simplesmente Sumiu e, até agora, meu PR está zerado. Bem. Minha solução foi pedir a desindexação do conteúdo no endereço antigo, atualizar o robots.txt e incluir as tags, só para garantir. Vamos ver se dá certo.

 
Comentário por Alessandro Martins
2007-04-05 09:28:20

... e já coloquei a tag para evitar a indexação da home e dos arquivos. E, mais, assinei o feed. Estava na hora de alguém falar a sério sobre esse assunto. Algumas pessoas ainda acreditam que SEO é falar de personalidades sem calcinha.

 
Comentário por dudu
2007-04-05 18:09:47

Bruno

Não seria melhor indexar a home, que normalmente tem um PR maior?

 
Comentário por BrPoint
2007-04-05 19:57:17

Alessandro, obrigado.

A atualização do PR ocorre somente de tempos em tempos, é normal que fique zerado até a nova atualização, o grande problema está em deixar as páginas com conteúdo duplicado perderem a força e só aparecerem no final da pesquisa ou nem mesmo aparecerem.

Dudu, a home muda o tempo todo, não é bom que ela seja indexada (para blogs), o ideal é mandar a pessoa que está pesquisando direto para o artigo.

Imagine que o visitante faz uma pesquisa pelas palavras mais procuradas no Google em Janeiro, escrevi um artigo sobre isso que não está mais na home, caso ele seja enviado para a home, não vai encontrar o que quer e irá embora.

Se for enviado diretamente para o artigo, pode ficar satisfeito e começar a visitar o resto do blog.

Existe uma opção para isso, se quiser que a home seja indexada, você poderia colocar só os excerpts na home, assim, não haveria tanta duplicação de conteúdo.

Mas testei isso por um tempo e não gostei do resultado.

Abraço

 
Comentário por Kaleo Silva
2007-04-07 02:21:50

Como era de se esperar, existe um plugin para essa tarefa.

Que por sinal, precisa de uma nova versão com opção de não indexar a home, como sugerido aqui... Alguém se habilita?

 
Comentário por Filipe
2007-04-09 00:26:35

Grande Bruno,

Obrigado pela dica, ultimamente percebi que estava tendo essa duplicação num dos meus sites. Não sabia como resolver isso e fiquei muito feliz em encontrar essa dica aqui.

Obrigado mesmo.

Abraços,
Filipe

 
Comentário por BrPoint
2007-04-09 08:32:04

Kaleo,

pode ser uma boa idéia incrementar este plugin, vou dar uma olhada nele.

Filipe, obrigado, que bom que ajudou.

Abraços

 
Comentário por Sergingc
2007-04-11 16:38:42

Desculpa a ignorância,
mas onde eu tenho q inserir esse código mesmo?

 
2007-04-11 17:00:45

[...] passada escrevi como manipular a meta tag robots para que os mecanismos de busca não indexassem conteúdo duplicado na homepage do [...]

 
Comentário por BrPoint
2007-04-11 17:03:04

Sergingc, no header no arquivo header.php do seu tema.

Abraço

 
Comentário por FernandoJS
2007-04-12 10:08:04

Acabei de fazer a alteração...

Estava notando uma irrelevância dos posts depois de alguns dias...

Espero que com essa técnica melhore. :D
Abs

 
Comentário por BrPoint
2007-04-12 10:29:22

Fernando, depois avise qual o impacto que obteve.

Abraço

 
Comentário por Renê Fraga
2007-04-12 13:09:59

Olá,

Fiz esta alteração no Google Discovery também. Vamos ver o que acontece.

Abraços e parabéns pelo blog!

 
Comentário por BrPoint
2007-04-12 13:48:38

Renê, obrigado, não deixe de dizer como foram os resultados ;)
Abraço

 
Comentário por FernandoJS
2007-04-13 08:54:43

Boa dia Bruno!

Estava pensando sobre está modificação e surgiu algumas questões.

Quanto tempo é necessário perceber a mudança?

Será que só vale para os posts novos?

Abs

 
2007-04-14 15:09:18

[...] você tem um blog com wordpress, existe um bom artigo com dicas sobre o assunto Não permita a indexação de conteúdo duplicado no Wordpress, mas tenho algumas coisas a acrescentar sobre isso, que vou deixar para um próximo [...]

 
Comentário por BrPoint
2007-04-17 10:38:44

Fernando, vai depender da velocidade que o Google varre seu blog, pode variar de algumas horas até vários dias e valerá para todos os artigos que o crawler conseguir acessar.

Abraço

 
Comentário por Renê Fraga
2007-04-18 11:25:25

Bruno, notei uma maior relevância de termos com o meu blog e em alguns casos meu blog passou a liderar sobre diversos produtos do Google. Diferente do que alguns disseram, não presenciei um aumento estrondoso de acessos depois da mudança. Mas isso é questão de tempo.

Abraços!

 
Comentário por BrPoint
2007-04-18 19:05:19

Renê, o efeito principal já está acontecendo, que é sua página aparecer mais perto do topo.

A quantidade de acessos, depende de vários fatores, além de aparecer no topo.

Demanda, por exemplo, é uma questão fundamental, não adiantaria ser o primeiro de um termo que é pesquisado uma vez a cada dois anos.

Outro problema que lhe afeta é com quem você está concorrendo, mesmo que o seu artigo apareça na frente de um do Google, as pessoas tendem a ir primeiro no domínio do Google.

Abraço

 
Comentário por Renê Fraga
2007-04-18 23:57:35

Bruno,

Com certeza existe essa dificuldade pois nosso conteúdo as vezes se torna redundante ao próprio Google, mas a relevância de resultados já é um grande passo para conquistar novos leitores. Abraços!

 
2007-04-19 03:08:09

[...] Mas para que funcione corretamente, você precisa bloquear o endereço removendo ele do ar, através do robots.txt ou da meta tag robots. [...]

 
Comentário por BrPoint
2007-04-19 10:10:07

Renê, não diria redundantes, mas a maioria das pessoas (os que não são blogueiros), ao procurar por GMail, vão preferir ir no domínio do Google, já os blogueiros tendem a ir para o blog, onde, normalmente, o conteúdo é melhor :).

Abraço

 
2007-04-20 15:39:13

[...] onde eu estava… No artigo do Bruno chamado “Não permita a indexação de conteúdo duplicado no Wordpress“, existe uma dica para usuários do wordpress desabilitarem a indexação da Homepage do seu [...]

 
Comentário por brazz
2007-04-22 17:48:31

Olá,
Por favor, esclareça-me uma dúvida.
Vc. está sugerindo que o bot da google veja o noindex, nofollow para a homepage do blog? (Desculpe se eu estiver enganado, não entendo nada de scripts).
Se for assim, como é que o bot vai encontrar as outras páginas? O principal link para as páginas do arquivo vem da homepage, certo? Mesmo que outros blogs linkem para páginas do arquivo, elas ainda assim perderão o link da homepage.

Obrigado pela atenção.

 
Comentário por Lu
2007-04-24 02:35:24

Bruno, dá pra criar exceções? O problema é o seguinte: tenho algumas páginas hospedadas na raiz do site (ex.: a página de fotos está na raiz como fotos.php) e elas não estão mais sendo indexadas, agora que implantei a meta-tag. São apenas quatro páginas, então creio que valeria a pena criar exceções para elas e manter a meta-tag, só que não sei como fazê-lo...

 
Comentário por BrPoint
2007-04-27 13:35:39

Brazz, estou sugerindo o noindex com follow na home, assim, o Google não indexará a home, mas seguirá os links, fazendo a devida indexação dos artigos.

Lu, sim, é possível, mas seira necessário saber como essas páginas são montadas para isso.

Uma opção é verificar, com o PHP, qual endereço da página e fazer a alteração.

Abraço

 
Comentário por Rafael Arcanjo
2007-04-29 10:29:34

Mas testei isso por um tempo e não gostei do resultado.

Você testou usar o que indicou neste artigo e não gostou muito do resultado, é isto ?

Coloquei no meu blog pra ver... Mas se já adiantas que o resultado pode não ser satisfatório, vou ver se tiro então.

Mas primeiro, vou aguardar seu retorno.

 
Comentário por BrPoint
2007-05-02 18:48:32

Rafael, exatamente, não gostei muito do aspecto visual e da usabilidade, em termos de resultado, é praticamente o mesmo.

Uso, hoje, apenas no BrPoint, pois a home dele sofrerá uma mudança e preciso que a mesma seja indexada.

Para quem tem apenas um blog no endereço, a escolha entre as duas opções depende apenas de gosto pessoal.

Abraço

 
Comentário por Alessandro Martins
2007-05-05 09:48:57

Fiquei com uma dúvida. Isso não poderia prejudicar o PR de uma forma geral no caso do site ter muitos links apontando para a home?

 
Comentário por FernandoJS
2007-05-05 10:24:19

Depois de algumas semanas usando essa tecnica...não tive nenhum ganho nas visitas. Pelo contrario as visitas cairam pois a busca pelo dominio (tocando) não aparece mais na primeira pagina do google.

 
Comentário por BrPoint
2007-05-07 09:31:16

Alessandro, indexação e PR não possuem relação, o PR é determinado pelo número e peso dos links que uma página recebe.

Fernando, esta técnica dá mais força aos artigos e retira a força da home, se quase todas as suas visitas vindas do Google apontam para a home, existem mais problemas de otimização que precisam ser resolvidos no seu blog.

Eu percebo um aumento considerável do peso dos artigos nos blogs que eu administro, mas, em geral, nenhum deles "depende" do tráfego da home.

Tente a técnica alternativa, ela pode lhe ajudar.

Abraços

 
Comentário por brazz
2007-05-09 09:54:31

Então, vc. sugere usar noindex, follow.

Os bots vão seguir os links e indexar as páginas-tópico (mas não vão indexar a homepage).

Mas vc. vai perder o pagerank/trustrank e o anchor-text que a homepage passa para as páginas-tópico (pois a homepage não será indexada, e portanto não será levada em conta para cálculo do pagerank das páginas tópico).

Acho que isso funciona se houver grande quantidade de links para as páginas-tópico (como deve ser o seu caso); mas pode ter efeito negativo se a maioria dos links apontar para a homepage.

 
Comentário por BrPoint
2007-05-09 10:43:03

Brazz, PageRank e indexação são coisas distintas, uma página pode ter um alto PageRank, sem que seja indexada.

O NoIndex só avisa para os bots que o conteúdo daquela página não deve ser apresentado como resultado de pesquisas, pois eu quero que os usuários acessem o artigo e não a home.

Quanto ao texto dos links, quando existe o follow, o Google vai pegar esse texto, mesmo que não indexe a página.

Abraço

 
Comentário por Alexandre Fugita
2007-05-19 01:20:55

Depois de falar com o Renê, que me sugeriu ler este artigo, agora fui convencido de vez após ler os comentários.

Estava com medo do PR cair mas vc disse que não há relação com a indexação. Perfeito!

Apesar disso, prefiro ainda que a home seja achada, mas não os arquivos e páginas antigas (/page/2). Então modifiquei sua dica para indexar a home e os artigos apenas. O resto, incluindo tags (ou categorias) virou noindex.

Mas ainda fiquei com uma dúvida: percebi que muita gente chega ao meu blog através de algumas categorias, wikipedia, por exemplo. E agora?

Abraços!

 
Comentário por Alexandre Fugita
2007-05-19 01:24:40

A solução que adotei:

noindexindex,follow">

Abraços!

 
Comentário por BrPoint
2007-05-21 09:21:59

Alexandre, é uma questão de escolha, tudo depende do que você quer.

Sempre que você indexa duas páginas com o mesmo conteúdo, duas coisas podem acontecer:

  1. O peso das duas ficarem diluídos.
  2. Uma das duas irem para o índice complementar.

O primeiro problema não é tão ruim, só reduz oi peso geral das páginas e pode te deslocar para baixo em relação a outros sites, pode acarretará diminuição no tráfego vindo do Google, mas as páginas ainda serão encontradas.

O segundo é que é o grande vilão.

Se o post for para o índice complementar e a página de categoria para o principal (o que é bastante comum, uma vez que a página de categorias recebe mais links internos que os artigos e é uma "página" mais antiga), seu artigo não será mais exibido.

Neste caso, as pessoas chegarão ao seu blog pela categoria, mas irão embora por não encontrarem o que procuram.

Abraço

 
2007-07-19 23:47:08

[...] blogosfera a fora encontrei um artigo mostrando uma forma para evitar que o rôbo, dos mecanismos de busca, indexe a página principal do [...]

 
Comentário por FritadorDePastel Recebendo notificações por e-mail
2007-09-09 00:53:26

Bem, segui a dica a risca e agora irei monitorar.

Cai aqui ao tentar procurar por informações a respeito de um problema que o google me indicou. Segundo o adsense, minha página principal está bloqueada para os robôs do sistema.

Para mim ainda é um mistério o que pode ter ocorrido.

Comentário por Bruno Alves
2007-09-10 07:05:07

Verifique se não está bloqueado no .htaccess, as vezes o host configura isso, quando o Google está acessando páginas demais.

Abraço

 
 
2007-09-29 12:48:08

[...] multidão. Os copiadores, claro, não fazem idéia do que é uma commodity… Também, ao copiar, mecanismos de busca rebaixam a nota de ambos os textos, o original e o copiado, principalmente este último. Se a pretensão do plagiador era aparecer nas [...]

 
Comentário por Romulo De Lazzari Recebendo notificações por e-mail
2008-03-17 10:58:51

Bruno, vc não esqueceu de colocar no if a função "is_category()"? Não é interessante que eu indexe uma página de categoria né? Cai na mesma história do index, não cai?

 
2008-03-23 00:16:45

[...] tentar corrigir o problema, fiz uma modificação no cabeçalho do código de acordo com esse artigo do Bruno Alves. Alguém pode me dizer que mais posso fazer para contornar o problema? [...]

 
Nome
Email
Site
Seu Comentário (menor | maior)
Você pode usar: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> e [CODE] [/CODE] em seu comentário.