Del.icio.us | Perfil | Contato

Carregando...
Mostrando postagens com marcador Link Farm. Mostrar todas as postagens
Mostrando postagens com marcador Link Farm. Mostrar todas as postagens

quinta-feira, dezembro 21, 2006

Estudo de Caso: Scraping - Scraper Sites - Sites sugadores de conteúdo

Este é um post que compõe os Estudos de Casos, e que analisa um caso de SPAM de conteúdo: Um Scraper Site.

Vou pedir que se dirija ao site:
http://www.ronaldofansite.com/cristiano/

Ao chegar no site você vai ver uma foto do Cristiano Ronaldo, algumas notícias à sua esquerda e um Arranha-céu (120x600) do AdSense™ (Bloco de anúncios).

Gostaria que você desse um refresh no site (Atualizar) para perceber o seguinte elemento:



Na barra de ferramentas podemos notar que o site convert-rss-to-javascript.com é carregado. O Pagerank do site é 2, indicando que possivelmente (e eu tenho certeza que sim) esse site é parte de uma Fazenda de Links.

As notícias são recentes e isso dá uma falsa percepção de utilidade. O Arranha Céu do AdSense é presença marcante no site, dividindo o palco com o "conteúdo". O usuário fica na dúvida sobre o que é mais informativo. O conteúdo ou os anúncios.



Analisando mais a fundo a página temos a referência da fonte de conversão do RSS em html. Se trata do já mencionado, Convert-RSS-to-Javascript.com. Ao olharmos abaixo dessa referência vemos um link de afiliados do Commission Junction. Ou seja, o usuário é convidado a procurar por mais informações sobre o Cristiano Ronaldo no eBay.



Ao passarmos o mouse por cima do link da notícia podemos ver a verdadeira fonte da notícia: O Site SportNetwork (uma boa fonte de notícias em inglês sobre esportes).



Se você notar o canto inferior direito do site você vai ver os seguintes dizeres:

Copyright © 2005. ExodusSearch.com Team

Esse suposto time, é a Link Farm que eu mencionava anteriormente. O site analizado pertence ao ExodusSearch.com


Considerações


No caso analisado pudemos ver a técnica spâmica conhecida como Scraping. Ela se baseia na captura de informações advindas de outros sites. O site só exibe uma snippet (um curto fragmento textual) porque o feed liberado pelo Sport Network é incompleto. Esse é o argumento que servirá de base para o meu próximo post no qual eu analiso se a liberação de feeds completos é viável ou não.

O spammer do nosso Estudo de Caso se utiliza, como já enfatizado, de um conversor de RSS para HTML em JAVASCRIPT. Felizmente, os motores de busca já aperfeiçoaram as suas técnicas, e esse tipo de site não tem qualquer relevância em termos de busca orgânica. o Spammer desse estudo de caso é iniciante (ou metido a esperto), pois o scraping via JAVASCRIPT é obsoleto. O Spider não lê o texto que o usuário lê. Ele apenas segue o link de origem do texto, ficando o scraper site a ver navios. Ou seja, esse spammer não deve estar ganhando nada com esse site, pois os mecanismos de busca não indicam o site dele na lista de resultados. Quem vai ganhar o crédito com a notícia, é efetivamente o site que correu atrás da notícia: o SportNetwork.

Podemos identificar elementos do estudo da MicroEconomia através da possível externalidade positiva que a notícia gera. Ao liberar a notícia ou liberar um conteúdo grande, algum FreeRider pode fazer uso dele pra obter ganhos.

Infelizmente eu trago a vocês o que acontece na Web. A realidade é essa. Eu não escolho as técnicas de SEM (Search Engine Marketing) e de SEO que as pessoas usam. Eu, com o E-Opportunities, tento ajudar você a seguir o caminho mais correto, justo e efetivo para conquistar o seu espaço na internet e assim auferir ganhos.

quinta-feira, dezembro 07, 2006

Estudo de Caso: SPLOG - Blogspot

Assim como dito anteriormente, vamos fazer aqui hoje um estudo de caso sobre SPLOG.

O primeiro site analisado será o de domínio Zikyb.info.

Vou pedir para você acessar essa página dele:

http://adlig.zikyb.info/

Agora vamos passo a passo analisar o Blog.

1 - Primeiro Passo

Podemos notar que o blog é gratuito. É um blog do Blogger.
A princípio não notamos nada de anormal. O blog não possui Reflinks (Links de referências de programas de afiliados) então não temos nem idéia do que se trata. Perceba, que os links (citados no corpo da página), indicam domínios sem strings de referências: "click=id, ?ref=id, etc.." Os links favoritos da sidebar indicam possíveis sites parceiros. Na verdade são outros sites iguaizinhos a esse que estamos analisando. Então já começamos a identificar que isso se utiliza da técnica Link Farm. O(s) Spammer(s) fizeram (fez) com que se criasse um cíclo de votos, onde esse site vota para aqueles e aqueles votam pra esse, aumentando falsamente o Pagerank™ deles.

Passo 1 - Página aparentemente normal

2 - Segundo Passo

Ao investigarmos mais um pouco a página, vamos encontrar outra técnica black-hat: Hidden keywords, ou seja, palavras chaves escondidas.

Passo 2 - Texto Oculto - Hidden keywords

3 - Terceiro Passo

Continuemos a analisar a página, ao descermos o scrollbar, vamos vendo comentários de incentivos...como Bom trabalho, Ótimos links...
Perceba que essa tática tenta transparecer que o blog não é fake. Pois se tem comentários de humanos então o teoricamente não seria um SPLOG.

Passo 3 - Comentários aparentemente normais

4 - Quarto Passo

Ao descermos mais um pouco, temos acesso ao outro post do cidadão.
Se você sabe ler inglês, você de cara já percebeu que esse blog se utiliza de bombardeamento de palavras (stuffing keywords). Esse texto não tem qualquer sentido. É um bando de palavras em ingles combinadas de tal forma que pareça ser mesmo um texto. Mas não é. Note que ele tenta transparecer uma possível utilização da estratégia white-hat Link Bait, mas no caso nada mais é que uma tentativa de manipulação do Motor de Busca. Ao juntarmos um link à uma palavra, damos uma sinalização ao Motor de Busca que essa "possível busca" pode ser sanada pelo link em questão. Se conseguirmos alastrar por toda a internet essa "citação linkada do mal", o Google, Yahoo, MSN, etc vai crer que esse link é mesmo uma ótima alternativa para a busca da palavra. Isso já foi conhecido no passado como Google Bombing.

Passo 4 - Possível Link Ísca - Nada mais nada menos que uma Link Farm

5 - Quinto Passo

Vamos nos perguntar pra que esse cara fez isso. Porque perder o tempo fazendo isso? Bem, nós sabemos que assim como a economia neo-clássica doutrina, os seres humanos são movidos por incentivos. E no caso o incentivo financeiro é o grande motivador de todas as ações apresentadas aqui. Você, no caso, provavelmente não pegou a grande sacada desse SPLOG do caso. Duas são as alternativas pra esse Blog ter sido criado. As duas se conjugam com Cloaking. Uma é ganhar com afiliados e a outra é de, uma vez indexada a página pelos Motores de Busca, trocar o conteúdo da página para exibir outra página com outra cara, outro conteúdo, e com links de afiliados (claro!).

A segunda alternativa vamos analisar no próximo estudo de caso, porque a primeira alternativa é o objetivo do SPLOG.

Ao selecionarmos o texto do link WEBMOTORS, e ao clicar com o botão direito do mouse e selecionar a opção visualizar código fonte da seleção, vamos ver para onde a pessoa que clicar no link será direcionada.

Passo 5 - Página de compra do site do Webmotors

6 - Sexto Passo

Ao clicarmos, notamos que fomos redirecionados para uma página de compra de carros. Essa página com certeza vai oferecer uma comissão, sobre a venda realizada, para aquele Webmaster que através da publicidade do seu site deu origem à venda.
Assim como o link do Webmotors, todos os links que estão presentes naquela lista vão redirecionar a pessoa que clicá-los, até um site onde o webmaster estará ganhando algo.

Ao selecionar o corpo da página (main) e clicar com o botão direito do mouse, visualizando assim o código fonte da seleção, vamos ver a existência de dois comando de javascript que vão dar esse efeito. Um é o onmouseover e o outro é o onclick. Um mostra o link do webmotors, uma vez que passamos o mouse sobre o link. O outro é a página para onde o usuário será levado ao clicar no link. Perceba que a id de afiliado do nosso spammer é 158948.

Passo 6 - Código fonte da seleção

No passado, como disse no post Spam - Isso gerava dinheiro antigamente? , as atividades spammicas rendiam muito dinheiro. Dependendo da sua personalidade, provavelmente você vai achar que ninguém pôde ter ganhado algum dinheiro com esse tipo de site. Porém, devo alertá-lo que a pessoa (como vimos anteriormente) não fazia 1 ou 2 desses blogs. Ela fazia um número muito grande. Hoje em dia, existem scripts que fazem sites fakes como esse que você viu em questão de 10 minutos. Ou seja, isso impreguinava nos motores de busca. Existem muitas buscas com palavras digitadas erroneamente, e/ou palavras que não existem, etc etc...
Imagina que se o cara tivesse 1 visita em cada blog dele por dia, e tivesse uma média de 10.000 blogs (porque tem script que faz mais que isso em 10 minutos) ele teria muito mais visitas que muitos sites de ótima qualidade que existem por aí.

Porém, atualmente, o investimento em combate à esse tipo de coisa é muito grande. Então, dificilmente (acredito) que montar um site assim gere algum dinheiro. Acredito que é muito mais fácil investir em um site de qualidade, etc etc para obter vantagens financeiras.

Espero que tenha sido útil a apresentação que eu fiz aqui. Com esse tópico eu consegui mostrar como algumas das técnicas, que já mencionei aqui, são utilizadas. Acredito que fiz o post de forma didática de forma a agradar a novatos e a experts no assunto.

Comentem!

terça-feira, outubro 31, 2006

Link Farm - Fazenda de Links

Link Farm (Fazenda de Links) é um grupo de páginas que se linkam mutuamente, para aumentar artificialmente o PageRank™ das páginas. Geralmente algumas Fazendas de Links são criadas manualmente, mas a maior parte são criadas por programas ou serviços de criação de Fazenda de links. Link Farm é uma forma de Spammear uma search engine, e assim sendo, é uma forma de Spamdexamento. Porém, sistemas de trocas de links, que são feitos para permitir que o usuário possa consultar sites relacionados ao tema (objeto do site) e que são feitos de forma analítica (ou seja, não é predatório, o cara analisou o site que ele está linkando) não são consideradas como formas de Spamdexamento.
Inicialmente, as Fazendas de Links surgiram como uma forma de alguns Webmasters tirarem proveito da fragilidade do sistema de busca chamado Inktomi, que era baseado em popularidade de links. Esse sistema foi alvo de manipulação, porque na época (1999) ele era utilizado por famosos sites de busca como o Hotbot. O Yahoo!, o mais popular na época, também usava os resultados do Inktomi para complementar o seu Diretório de Sites. O impacto da utilização de Fazendas de links, foi reduzir a discrepância entre sites que já estavam a mais tempos consolidados na internet e sites que eram recentes no sistema de index do Inktomi (esse em 2002 fora adquirido pelo Yahoo).
As trocas em Link Farms foram, em um primeiro momento, baseadas em um sistema informal, mas em um momento posterior várias companias foram fundadas para prover registros automáticos, categorização, e linkagem de páginas.
Quando o Google™ se tornou popular, os otimizadores de mecanismos de busca aprenderam que o algorítmo de rankeamento do Google™, é em parte, dependente de popularidade de links. O PageRank™ se baseia em um sistema de votos onde um site com o PageRank™ elevado que linka um outro site com menor pagerank, sinaliza que esse site menorzinho é bom e vai ficar grande.
Porém, a elevação de linkagem de links artificalmente, tenta manipular o motor de busca, dando uma falsa percepção da realidade. Scripts geram milhares de páginas que linkam para outro site aumentando artificialmente o PageRank™ do site.
Várias tecnologias foram criadas pelos Motores de Busca para evitar essa elevação artificial de rankeamento. Então, não perca seu tempo tentando enganar os motores de busca, pois você sabe que será pego e a sanção para técnicas black-hat é o banimento.
A troca de links entre sites relacionados, não é, como dito anteriormente, black-hat. Então trocar links é saudável, uma vez que você possibilita que o seu usuário conheça outras fontes de informação sobre o nicho do seu site. Nas diretrizes para webmasters do google você pode esclarecer essa dúvida e ficar tranquilo com relação à trocas relacionadas.

[Dica:] Afaste-se do Black-hat ou a sanção será terrível. Os benefícios que os mecanismos de busca trazem ao site em termos financeiros é infinitamente superior à uma tentativa esdrúxula de enriquecimento fácil e rápido. Já alertei antes e reitero: Não existe dinheiro rápido na internet. A busca por isso está fadada à terminar com frustração. Todos os sites/blogs da internet que proporcionam boas remunerações foram construídos com tempo. Ninguém fez um site do dia pra noite gerar uma boa receita. Então fique calmo e não se deixe seduzir pelo lado negro da força.
akuma gif