O resumão sobre SEO e como Google lida com isso

Introdução

Há algumas semanas eu venho estudado o que é realmente o tal de SEO, aquele trunfo o qual tem sido tópico de discussão (e presença permanente em orçamentos) de todas as agências e profissionais de internet (sérios).

Passado o frenesi que esta novidade causou, posso ver com clareza a importância que estas técnicas (que aqui prefiro me referir como “bons hábitos”) exercem sobre a classificação do conteúdo dos websites.

Minha definição de SEO é, portanto, a seguinte:

Conjunto de bons hábitos que tornam mais claros aos motores de busca o assunto tratado no website em questão, visando o aumento de tráfego qualificado, colocando este nos resultados de pesquisa mais prováveis feitos pelo público alvo.

SEO + Google

Google está para SEO, assim como Coca-cola está para refrigerante. Não é para menos, pois foi graças à filosofia acadêmica de Larry Page e Sergey Brin que hoje estas técnicas de otimização nas buscas podem ser aplicadas.

O Google surgiu como uma alternativa ao Alta Vista, na época a ferramenta de pesquisa mais utilizada. Concomitantemente, o diretório de sites do Yahoo! ganhava notoriedade, mas os dois estudantes do Vale do Silício acreditavam que podiam criar algo muito melhor. Tomando como base suas vidas e projetos acadêmicos, Larry e Sergey construíram o Google para ser uma ferramenta independente da ação humana, imparcialmente fundamentada em uma equação lógica (o denominado PageRank). O diferencial do Google foi que o engine foi construído focado nas necessidades de busca dos usuários, de que uma pessoa tinha o direito de chegar ao resultado mais relevante de sua pesquisa da maneira mais rápida possível.

Antes do Google, o mercado de mecanismos de busca era visto pelos grandes portais apenas como uma forma de expor seus utilizadores ao máximo de publicidade possível, sem o interesse real de oferecer bons resultados. Um exemplo prático, utilizado na primeira apresentação pública do Google para uma turma de estudantes e professores de Standford, foi a de que procurando “AltaVista” no AltaVista, a ferramenta não conseguia achar a si mesma.

Graças à imparcialidade do algoritmo dos robôs do Google, ou seja, a certeza de que os resultados não eram manipulados ao conforme o bel-prazer dos administradores do site, podemos hoje utilizar o SEO.

Mas como o Google determina a relevância de uma página?

As palavras-chave, ou keywords, são a base das pesquisas do Google e de outros mecanismos. Para o Google, um site é relevante para uma determinada pesquisa se esse possuir em seu conteúdo a palavra-chave procurada ou sinônimos da mesma.

As palavras-chave encontradas no site são classificadas por relevância, dependendo onde são encontradas:

  1. Texto da Tag de Título;
  2. Nome do domínio;
  3. URL’s;
  4. Tags HTML (utilização correta de cabeçalhos, textos com ênfase e negrito);
  5. Keywords density (densidade de palavras-chave);
  6. Proximidade das palavras-chave;
  7. Texto da Tag Alt (texto alternativo para imagens);

A autora Mihaela Lica publicou no site SitePoint  um artigo sobre como o Google determina a relevância de uma página  para resultados de busca regionais. Posso resumir o artigo em alguns pontos-chave:

  • Top-level domain (TLD): “.com”, “.org”, “.gov”, “.edu” e “.mil” são os TLDs de maior autoridade na internet. TLDs como “.biz”, “.info” e “.tv” não são bem vistos pelos mecanismos de busca, dado o grande número de spammers que utilizam esse tipo de domínio.
  • Localização do servidor: sites hospedados na Austrália, por exemplo, recebem prioridade nas buscas regionais australianas. Se, por exemplo, seu site está hospedado na Austrália, mas tem como público alvo os habitantes da Alemanha, os sites hospedados no território alemão ganham vantagem na competição.
  • Localização do ITL (incoming text links): seguindo a mesma idéia da localização do servidor de hospedagem do site, se seu site possui vários links apontando para outros sites regionais e sites regionais têm links apontados para você, o Google entenderá que você é um resultado bom para esta região em questão, mas não tão bom para uma pesquisa internacional.
  • Linguagem da página: Assim como o lugar onde está hospedado e os links de referência, a linguagem da página, bem como configuração de caracteres e meta-tags traduzidas, influenciam na relevância das páginas para uma pesquisa regional.

Para mais informações, recomendo a leitura do artigo na íntegra.

Técnicas Gerais de SEO

São as técnicas gerais para um site otimizado:

  • Melhorar o Título de cada página, deixando os títulos das páginas internas o mais compreensível e conciso possível;
  • Melhorar a Meta Description de cada página, oferecendo uma descrição clara do conteúdo da página em questão;
  • Link Building, mantendo os links internos com endereços absolutos e analisando como conseguir links em websites externos;
  • Usabilidade, mantendo sempre uma estrutura semântica do HTML bem formatada, imagens com texto alternativo, mapas de site.
  • Escolhendo bem as palavras-chave do site e das páginas internas, pois elas serão a maneira como o site será encontrado e visto nos buscadores;
  • Evitando a Keyword Cannibalization, ou seja, a competição interna de palavras-chave de um website;
  • Evitar que links para páginas de erro 404 do site gerem resposta 200 para o navegador , para que esses não sejam indexados pelo Google ;
  • Evitar conteúdos duplicados;

O site Mestre SEO disponibiliza um artigo completo sobre o assunto.

Stopwords

Stopwords são palavras que não são consideradas pelo Google e outros buscadores, por não demonstrarem relevância na pesquisa. São geralmente preposições e artigos geralmente usados para dar coesão à frase na língua em questão. A lista completa de stopwords para a língua portuguesa pode ser lida no link http://www.ranks.nl/stopwords/portugese.html.

SEO Black Hat

Comentei há pouco da imparcialidade oferecida pelo algoritmo do Google, o que nos dava certeza que os resultados das pesquisas não seriam manipulados pelos donos do site. No entanto, este diferencial é uma faca de dois gumes, pois as mesmas regras podem ser usadas por terceiros para manipular o resultado de pesquisas.

Esse tipo de técnica ficou conhecido como SEO Black Hat, no qual um indivíduo mal intencionado faz uso das técnicas de SEO para fins maliciosos, como instalar vírus nas máquinas de usuários ou fazer tentativas de roubo de senhas de contas bancárias.

No intuito de proteger sua reputação de melhor mecanismo de pesquisa com os resultados mais relevantes, o Google aprimorou (e continua aprimorando) as regras utilizadas pelos seus robôs ao incluir um conteúdo à sua coleção de sites indexados.

Cloacking

Reservo aqui um espaço para falar de cloacking, que apesar de ser considerada uma técnica de SEO Black Hat, é utilizada por portais de notícias e fóruns, por exemplo.

A técnica é basicamente identificar quem está acessando o site, se é um agente navegador comum (navegadores como Firefox e Internet Explorer) ou se são de um mecanismo de busca (Google ou demais buscadores). Fazendo uso dessa informação, na pior intenção, mostra uma página abarrotada de palavras-chave e links para os buscadores, melhorando seu posicionamento nos SERPs (Search Engine Result Page), e para os visitantes mostra conteúdos maliciosos que podem ser executados no navegador do cliente.

No entanto, essa técnica foi usada por portais de notícia como o caso do The New York Times, no qual o portal deixou para os buscadores indexarem parte de seu conteúdo exclusivo para assinantes, enquanto se o visitante for um navegador normal, a página seria remetida para um formulário de login.

Pessoalmente, esta técnica é nociva apenas quando usada por pessoas que desejam manipular o resultado de do page rank de sites, pois mostrar conteúdo diferente, dependendo de quem acesse o site (navegador ou robô) é um dos recursos utilizados, por exemplo, para otimizar sites feitos em Flash.

Keywords/Links Stuffing

Também conhecidos como “spam de keywords/links”, acontece quando nas meta-tags do site ou no próprio conteúdo há demais keywords repetidas fora de um texto coerente. No caso do link, quando estes não estão relacionados a nenhum texto, ou seja, quando estão ali aparentemente sem motivo. Para determinar a relevância de uma página, o Google não só analisa a quantidade de vezes que a palavra-chave aparece, mas também o contexto na qual ela está inserida. Por este motivo, na terra dos buscadores, quem tem conteúdo é rei.

Penalidades

Visando manter a qualidade das suas buscas, o Google aplica penalidades para os domínios que fizerem uso de técnicas Black Hat. Estas penalidades variam desde manter o site fora das buscas durante um período de tempo até a exclusão definitiva do mesmo.

Não é raro de um site receber uma penalidade do mecanismo de busca, por exemplo, nos seis primeiros meses de existência de um domínio, o mesmo permanece no Google Sandbox, um repositório que tem como objetivo analisar os sites novos para identificar quais foram criados para servirem de domínios para spam.

Algumas dicas para que o site não seja penalizado são :

  • Não usar as keywords excessivamente na página;
  • Não linkar, nem se envolver com qualquer site que faça manipulação de links;
  • Faça uma campanha consistente de link building, tentando variar os textos âncora dos links;
  • Não utilize cloaking nem faça doorway pages (Páginas de um site geralmente em grande quantidade com conteúdo praticamente repetido, modificando-se apenas a principal keyword);
  • Faça seu site pensando no usuário, e não só no search engine.

Leia o artigo completo sobre Punições do Google no Mestre SEO.

This website uses IntenseDebate comments, but they are not currently loaded because either your browser doesn't support JavaScript, or they didn't load fast enough.

Sobre este Blog

Este blog expressa minhas opiniões sobre assuntos de meu interesse (geralmente publicidade, internet e livros).

Para contato profissional para freelances, envie-me um e-mail.