| quiere
incluir nuestros artículos en su sitio ? Ahora puede
! : si encuentra interesante
este o alguno de nuestros artículos publicados, puede
incluirlos libremente en su sitio. Sólo debe respetar
el contenido, nombre del autor y email (si figura), y citar
como fuente a "Datacraft - tu revista digital", con
un link correspondiente a http://www.datacraft.com.ar/ Para
mayor información, contáctenos a info@datacraft.com.ar
con el asunto "incluir articulos" |
Por Alejandro Franco : mail : info@datacraft.com.ar
; webmaster de Datacraft,
Datahouse Company
y Drivers Argentina
La peor pesadilla de un webmaster : su
pagina web ha desaparecido de Google
Por su practicidad, por el comentario boca
a boca, o simplemente por su eficiencia como motor de búsqueda,
lo cierto es que Google se ha convertido en líder
absoluto de los buscadores. Lo cual supone un grave problema :
cuando usted tiene inconvenientes con Google, tiene inconvenientes
para captar el 70% del tráfico mundial posible que genera
Internet.
Esto podría ser un punto de polémica
que trataremos en otro momento, si las presencias monopólicas
se hacen o las hacemos, como el caso de Google o Windows
(entendemos por monopolios, ya que la presencia de la competencia
es tan menor que no representa amenaza para su liderazgo predominante
en el mercado). Pero, para el propósito que escribimos esta
nota, es un punto lateral que tomaremos como consideración
previa.
Lo cierto es que el 70% de busquedas en Internet
se hacen por Google, un 25% por Yahoo y MSN,
un 3% por Aol, y el saldo va a parar a manos de cientos de
buscadores y directorios menores. Las cifras son aproximadas, pero
reflejan el porcentaje de daño que significa el ser baneado
por Google.
¿Por qué
desapareció mi sitio de los resultados de Google?
El mayor problema que plantea Google
es Google mismo. Sus continuos cambios de criterios, los eternos
cambios en su robot, su constante volubilidad. Recetas que hoy se
aplican no sirven para mañana. Criterios de construcción
de páginas web usados hoy resultan ilegales en un futuro. Ciertamente
hecha la ley, hecha la trampa : a cada cambio de criterio de valuación
de Google, surgen nuevos trucos y artimañas. Y si bien Google
se ha vuelto quizás demasiado exquisito, lo cierto es que gran
parte de su popularidad se debe a sus continuos cambios en busca de
una exploración y clasificación óptima. Si uno
compara los spiders de Yahoo con los de Google, nota
que hay años de diferencia tecnológica. El truco archiconocido
de esconder palabras en el código fuente de una página
web da resultados en Yahoo o MSN, pero es penalizado
por Google. Hay diversas explicaciones
de qué pudo pasar para que su sitio web desapareciera de
los resultados de Google. Por experiencia propia, he revisado
toda la web en búsqueda de respuestas y soluciones eficaces.
Y cómo sólo he encontrado explicaciones parciales,
he tenido que aplicar mis propias recetas. Con lo cual me atrevería
a afirmar que este artículo es el mejor manual de supervivencia
para webmasters que han sido expulsados del índice de resultados
de Google. Aplicaremos algunos principios cibertécnicos
(pragmáticos en la estrategia SEO) para obtener resultados
en corto y mediano plazo.
Paso 1 : eliminando
las causas posibles
El ejemplo más común de que
Google lo expulse es esconder texto en su página web.
Keywords o términos repetidos hasta la saciedad, con el mismo
color de letra que el del fondo. El perfeccionamiento del spider
Googlebot ahora analiza los colores, incluso las tonalidades,
simplemente por la numeración hexadecimal de los colores
(algo que figura en el código html de las páginas).
Si estos textos son rojos y el fondo es rojo, usted va a ser penalizado;
pero incluso si el texto es bordó y el fondo rojo - variaciones
de tonalidad de un mismo color -, usted también será
penalizado. Lo primero que debe hacer es suprimir todo el texto
oculto, y revisar la paleta de colores de su sitio, para que textos
y fondos sean en completo contraste.
Otras causas tienen que ver con webmasters
que se han pasado de vivos. Creando doorways o páginas
fantasma (cuando usted accede a ellas, en realidad lo redirigen
a un sitio principal, totalmente diferente en contenido). Elimine
los doorways, cree páginas web con contenido y textos originales.
A la postre le resultará mejor, ya que diversifica los medios
de comunicación y de captación de visitantes. Lo mismo
pasa si usted clona sus sitios (todas sus webs tienen los mismos
textos, punto por punto y coma por coma)
Respecto a esto último, hay otras
causas que quizás sean más desagradables que errores
del mismo webmaster, y es la competencia descarada y desleal. Otras
personas que clonen alguno de sus sitios web, los publiquen como
originales y que, incluso, se atrevan a denunciarlo a usted frente
a Google como web spammer. Supongamos que usted posee un sitio
web de relativo éxito en un rubro o una serie de búsquedas.
Este competidor lo que atina es a descargar una copia de su sitio
web, hacer algunas modificaciones y subirlo a un dominio diferente.
Después se contacta con el departamento de denuncias de Google.
Este es un caso realmente extremo, pero no improbable (a mí
me ha sucedido). Lo que debe hacer allí es entrar en el registro
de dominios, averiguar quién es el poseedor, iniciar acciones
legales contra el webmaster y todos los involucrados. Al igual que
otros casos, donde los webmasters carecen de originalidad y "copian
y pegan" textos de su sitio, usted puede descubrir a los clones
malintencionados. Simplemente comience a buscar en Google frases
enteras que usted haya incluido en su web.
Es mucho más común de lo que
uno cree, que sitios web se roben textos enteros unos a otros. En
general Google reconoce la diferencia, y establece a la web más
antigua (la más vieja que capturó) como la original,
mientras que las webs plagiarias quedan relegadas a lugares menores.
Pero cuando se trata de clonaciones enteras, usted compite con su
mismo sitio, a lo sumo con dos palabras alteradas. Usted puede
contactarse con el webmaster, insultarlo o hacerle razonar de que
eso no sirve. Pero la mejor solución es que usted cambie
los textos de su sitio, y se despegue de los plagiarios. Es
triste, es cierto, pero no se puede razonar con ladrones - no le
responden -, y usted precisa salir del brete en el menor tiempo
posible.
Otro punto que debe considerar es su intercambio
de links, si posee. Revise con qué sitios ha intercambiado
enlaces web, vea si hay plagiarios, y vea también si hay
sitios web que han sido baneados (y que lo arrastran a usted en
la caída). Si su sitio web es de software y ha intercambiado
links con una página web de programas ilegales, es posible
que Google cuando castigue a una, lo haga con el resto. Quite
el enlace, comuníquese con el webmaster del sitio penalizado
y pídale que quite su nombre y enlace de la página.
Y otra causa puede ser su mismo sitio web;
que el código de la página se haya corrompido y
resulte ilegible.
Paso 2 : control
de daños
Lo primero que debe hacer, una vez que haya
eliminado las causas posibles, es establecer un control de daños.
Chequee las estadísticas habituales de su sitio, y vea cuántos
visitantes ha perdido en el tráfico diario. Si usted posee
estadísticas del tipo Webalizer, estas le resultarán
eficientes para medir cuando pasa el Googlebot (generalmente
figura como un cliente o como un navegador modificado, en el cuadro
de estadísticas), pero tiene el problema que se generan con
24 horas de diferencia. Entonces, incluya inmediatamente un boton
de estadísticas al momento, como Needstat / Webstats4u
u otro gratuito. Es cierto que esto hace perder algo de tráfico
(el codigo a veces tarda en cargarse y arrastra la carga de su pagina
también), pero usted sabe inmediatamente si hay cambios en
el volumen del tráfico. Incluya el código en todas
las páginas de su sitio, para saber al instante si Google
le ha perdonado la vida, o si alguna página interna ha sido
reflotada.
 |
Revise el índice de Google. Busque
www.susitio.com (o cómo se llame su página) en
el buscador. Si su página web ha sido baneada, no aparecerá.
En esta búsqueda, no figurará el link a su sitio, pero
puede chequear las búsquedas de páginas internas, y
de otros sitios que linkeen a su web. Si su sitio ha sido penalizado,
queda una especie de fantasma (hay buscadores, directorios y sitios
que linkean a una página cuyo original no figura en Google).
En penúltimo lugar, haga memoria
de los cambios que haya introducido en su sitio últimamente.
Si hay diferencia de unos pocos días con la desparicion en
los resultados, significa que esos cambios (de diseño, contenidos,
etc) han sido mal tomados. Sea porque el texto coincide con
otro preexistente en otros sitios capturados por Google,
porque los links estan mal o el código Html de la página
está corrupto. Elimine dichos contenidos, revise el esquema
de links y vea que todo apunta a páginas web que realmente
existen (su navegación interna o su sección de intercambio
de enlaces).
Hay maneras de saber si el código
Html está corrupto. Primero, haga un seguimiento de su
web en Yahoo. Si Yahoo (su robot se llama slurp! y deja marca en
las estadísticas de su sitio) lo ha visitado y capturado
recientemente, entonces no es un problema del código.
También pruebe, simulando un robot, de ver como se visualiza
su sitio. La mejor manera de simular lo que ve un robot de buscadores
es instalando el navegador de texto Lynx (que puede descargar de
cualquier web gratis como www.download.com). Cuesta un
poco manejar un navegador DOS con teclas (básicamente
la interfase entra a Google), pero después de un rato
lo podrá dominar. Como entra a Google, y su sitio
no está, utilice (en la pantalla de Google que le
muestra Lynx) la opción "intente visitar dicha
página directamente, haciendo click en el vínculo...".
Con Lynx usted ve la navegación pura, sin imágenes
ni colores, y verá si hay términos repetidos, abuso
en los textos ALT de las imágenes, enlaces mal escritos,
etc.
El último paso es instalar la barra
Google en su navegador. La dichosa barrita que indica el PageRank.
Como dijimos en otras ocasiones, el PR no sirve para casi nada,
pero en este caso resultará útil. Si usted instaló
la barra Google y visita su sitio web, y posee aún algún
PR, es una buena señal. Significa que Google ocultó
a su web, no lo echó del todo de sus resultados. Si el
PR ahora es cero, es el peor de los casos. Su falta es tan grave
que su web ha dejado de existir para Google.
Paso 3 : estrategia
de ataque
Si ha corregido su sitio web de impurezas
y posibles ilegalidades, es hora de empezar tácticas de guerrilla
para regresar al índice del buscador. El indicador de PR
es muy importante para determinar la estrategia. Si su PR ahora
es cero, prácticamente es un caso perdido. Le recomendaría
que iniciara la construcción de una web enteramente nueva.
Igual puede intentar aplicar algunas recetas.
Depure el código html. Si la web no es muy grande,
le sugeriría que la rediseñe completamente, o que
arme una nueva para un dominio nuevo mientras intenta resucitar
la actual. Depende del PR. Si aún hay puntos de PR, enmiende
la web actual.
Si se lanza a resucitar su web actual
porque tiene PR, intente intercambiar links con otras páginas.
En algunos casos, los webmasters sólo chequeamos el PR por
la barrita Google antes que buscar en el buscador. Con suerte, consiguiendo
algunos enlaces nuevos, obtiene oportunidades para que el Googlebot
visite su página. Porque aunque esté castigada,
Google sigue visitando su sitio. Debe aprovechar estas visitas
para mostrarle al robot los cambios que ha introducido en su página.
Si usted ha depurado código, chequeado
enlaces internos y con otros sitios, corregido textos, eliminando
textos ocultos, y considerado que la web ahora está 100%
legal, debe realizar un par de pasos más. En primer lugar,
si su sitio web intercambia enlaces y los publica en el index, le
sugiero que tome a la mitad y los desplace a una página interna
(p.ej. una sección de intercambio de enlaces). Google
tiene un límite respecto a los enlaces que pueden figurar
en un documento html. Si usted ha realizado demasiados intercambios,
sumado a los links hacia secciones internas, quizás llegue
a los 400 vinculos que es el máximo que puede leer el robot
- y que estén en un solo documento html -. Los enlaces
web siempre deben figurar en la página inicial - los webmasters
apreciamos mucho esto -, pero puede dejar los 30 o 40 últimos
enlaces, y poner el resto en una página interna (quizás
con menor PR, pero sigue siendo válida).
En segundo lugar, si está convencido
que está todo listo, debe anotarse en el programa de Google
Sitemaps. Para
ello, debe instalar un generador hecho en PHP que desarrolla un
indice escrito en XML (sitemap.xml), tema del cual hablamos en este
portal, y que está descripto en profundidad en dicho artículo,
del cual puede descargar dicho generador. Chequee que su hosting
tiene servicios PHP habilitados, suba el generador, ejecútelo
y revise la página XML resultante. Posiblemente esta página
deba editarla - porque memoriza directorios y webs que no queremos
que Google revise y publique en el buscador, como scripts
de correo, carpetas restringidas, la carpeta de estadísticas,
etc -. A su vez, si la analiza, verá si en su web hay
páginas muertas, descolgadas de cualquier link, páginas
de redireccionamiento (p.ej. que usted puso para secciones que no
existen más). Elimínelas. En algún momento
debía depurarlas, y éste es el indicado.
Una vez que genere el indice XML, anótese
en el programa que tiene el buscador, originalmente pensado para
enormes portales, pero válido para esta ocasion : Google
Sitemaps (https://www.google.com/webmasters/sitemaps/login),
requiere registración gratuita, y suba o linkee el mapa XML
que confeccionó (hay algún paso intermedio, como subir
una paginita de prueba que le pide Google para verificar
que esa web es la suya). Lo que tiene fantástico el programa
de sitemaps es que le provee estadísticas realmente
muy completas, le dice cómo ve Google a su web, y
le indica cuál es la última vez que Googlebot
lo visitó.
Cuando Google visita su sitio, no significa
que inmediatamente lo habilite. Se toma unos días (generalmente
una semana) para publicar resultados, si es que lo que vió
le gustó. Debe considerar que toda esta aventura le llevará
semanas o meses, depende de la velocidad y profundidad de
los cambios que implemente. No desespere, tómelo con ánimo
de experimentación. Aplique toda su experiencia SEO como
webmaster para rehabilitar a su página web.
Paso 4 : otras estrategias
alternativas
Google posee una interfase de contacto
para denunciar web spam (robo de contenidos) que se encuentra en
http://www.google.com/intl/es/webmasters/spamreport.html
; hay también, dentro de la interfase de Google Sitemaps,
un link a un formulario para comunicarle a Google que su
sitio web ha sido depurado y se encuentra en condiciones legales.
Usted puede informárselo a Google, pero en mi opinión
personal, dudo que sea efectivo o que le reporte beneficio, ya que
las listas negras así como los criterios que usa Google son
todos robotizados, no depende de personas que puedan chequear la
corrección de su sitio.
Si su sitio web demora demasiado tiempo
en ser rehabilitado (por ejemplo, más de dos meses), considere
crear una nueva web en un nuevo dominio. Tambien puede evaluar adosarle
un nombre de subdominio (esos gratis que algunas páginas
ofrecen como miarroba.com, y que son del tipo www.susitio.miarroba.com)
y empezar un nuevo proceso de registro en los buscadores.
Revise cómo funciona su hosting.
Escriba url inexistentes (www.susitio.com/cualquierpagina.html).
Debe dar un error 404, página no encontrada. Si, en cambio,
al escribir dicha URL se redirige a otro sitio (por ejemplo, el
del proveedor de hosting), hay un error grave que Google considera
como un doorway. Google chequea esto (y uno puede
descubrirlo gracias a Google sitemaps) como una prueba por
si uno incluyó el archivo robots.txt. Recordemos :
cuando un sitio tiene secciones restringidas que no quiere que capture
Google y las publique, incluye un archivo llamado robots.txt
en una o varias carpetas, que le dicen al robot que no lea ese
contenido. Google siempre prueba de escribir www.susitio.com/robots.txt
para verificar la existencia del mismo. Y como su sitio no posee
dicho archivo, y no dá error de página inexistente
sino que se redirige, entonces hay una doorway. Comuníquese
con su proveedor de hosting y pídale que corrija este error,
que pudo haber sucedido por un mal manejo o inexperiencia del controlador
del server de hosting o, en el peor de los casos, por un ataque
directo de hacking contra los archivos de configuracion del server
(el htaccess, por ejemplo).
En ningún caso debe exasperarse. Todo
en la vida tiene solución, y si bien esto depende de terceros
para regresar a la normalidad, con paciencia y trabajo es posible
resolverlo. |