|
La peor pesadilla de un webmaster : su pagina web ha
desaparecido de Google
Por su practicidad, por el comentario boca a boca,
o simplemente por su eficiencia como motor de búsqueda,
lo cierto es que Google se ha convertido en líder
absoluto de los buscadores. Lo cual supone un grave
problema : cuando usted tiene inconvenientes con
Google, tiene inconvenientes para captar el 70% del
tráfico mundial posible que genera Internet.
Esto podría ser un punto de polémica
que trataremos en otro momento, si las presencias monopólicas
se hacen o las hacemos, como el caso de Google
o Windows (entendemos por monopolios, ya que
la presencia de la competencia es tan menor que no representa
amenaza para su liderazgo predominante en el mercado).
Pero, para el propósito que escribimos esta nota,
es un punto lateral que tomaremos como consideración
previa.
Lo cierto es que el 70% de busquedas en Internet se
hacen por Google, un 25% por Yahoo y MSN,
un 3% por Aol, y el saldo va a parar a manos
de cientos de buscadores y directorios menores. Las
cifras son aproximadas, pero reflejan el porcentaje
de daño que significa el ser baneado por Google.
¿Por qué desapareció mi sitio
de los resultados de Google?
El mayor problema que plantea Google es Google
mismo. Sus continuos cambios de criterios, los eternos
cambios en su robot, su constante volubilidad. Recetas
que hoy se aplican no sirven para mañana. Criterios
de construcción de páginas web usados hoy
resultan ilegales en un futuro. Ciertamente hecha la ley,
hecha la trampa : a cada cambio de criterio de valuación
de Google, surgen nuevos trucos y artimañas. Y
si bien Google se ha vuelto quizás demasiado
exquisito, lo cierto es que gran parte de su popularidad
se debe a sus continuos cambios en busca de una exploración
y clasificación óptima. Si uno compara los
spiders de Yahoo con los de Google, nota
que hay años de diferencia tecnológica.
El truco archiconocido de esconder palabras en el código
fuente de una página web da resultados en Yahoo
o MSN, pero es penalizado por Google.
Hay diversas explicaciones de qué pudo pasar
para que su sitio web desapareciera de los resultados
de Google. Por experiencia propia, he revisado
toda la web en búsqueda de respuestas y soluciones
eficaces. Y cómo sólo he encontrado explicaciones
parciales, he tenido que aplicar mis propias recetas.
Con lo cual me atrevería a afirmar que este artículo
es el mejor manual de supervivencia para webmasters
que han sido expulsados del índice de resultados
de Google. Aplicaremos algunos principios cibertécnicos
(pragmáticos en la estrategia SEO) para obtener
resultados en corto y mediano plazo.
Paso 1 : eliminando las causas posibles
El ejemplo más común de que Google
lo expulse es esconder texto en su página web.
Keywords o términos repetidos hasta la saciedad,
con el mismo color de letra que el del fondo. El perfeccionamiento
del spider Googlebot ahora analiza los colores,
incluso las tonalidades, simplemente por la numeración
hexadecimal de los colores (algo que figura en el código
html de las páginas). Si estos textos son rojos
y el fondo es rojo, usted va a ser penalizado; pero
incluso si el texto es bordó y el fondo rojo
- variaciones de tonalidad de un mismo color -, usted
también será penalizado. Lo primero
que debe hacer es suprimir todo el texto oculto, y revisar
la paleta de colores de su sitio, para que textos y
fondos sean en completo contraste.
Otras causas tienen que ver con webmasters que se han
pasado de vivos. Creando doorways o páginas
fantasma (cuando usted accede a ellas, en realidad lo
redirigen a un sitio principal, totalmente diferente
en contenido). Elimine los doorways, cree páginas
web con contenido y textos originales. A la postre
le resultará mejor, ya que diversifica los medios
de comunicación y de captación de visitantes.
Lo mismo pasa si usted clona sus sitios (todas sus webs
tienen los mismos textos, punto por punto y coma por
coma)
Respecto a esto último, hay otras causas que
quizás sean más desagradables que errores
del mismo webmaster, y es la competencia descarada y
desleal. Otras personas que clonen alguno de sus
sitios web, los publiquen como originales y que, incluso,
se atrevan a denunciarlo a usted frente a Google como
web spammer. Supongamos que usted posee un sitio
web de relativo éxito en un rubro o una serie
de búsquedas. Este competidor lo que atina es
a descargar una copia de su sitio web, hacer algunas
modificaciones y subirlo a un dominio diferente. Después
se contacta con el departamento de denuncias de Google.
Este es un caso realmente extremo, pero no improbable
(a mí me ha sucedido). Lo que debe hacer allí
es entrar en el registro de dominios, averiguar quién
es el poseedor, iniciar acciones legales contra el webmaster
y todos los involucrados. Al igual que otros casos,
donde los webmasters carecen de originalidad y "copian
y pegan" textos de su sitio, usted puede descubrir
a los clones malintencionados. Simplemente comience
a buscar en Google frases enteras que usted haya incluido
en su web.
Es mucho más común de lo que uno cree,
que sitios web se roben textos enteros unos a otros.
En general Google reconoce la diferencia, y establece
a la web más antigua (la más vieja que
capturó) como la original, mientras que las webs
plagiarias quedan relegadas a lugares menores. Pero
cuando se trata de clonaciones enteras, usted compite
con su mismo sitio, a lo sumo con dos palabras alteradas.
Usted puede contactarse con el webmaster, insultarlo
o hacerle razonar de que eso no sirve. Pero la mejor
solución es que usted cambie los textos de su
sitio, y se despegue de los plagiarios. Es triste,
es cierto, pero no se puede razonar con ladrones - no
le responden -, y usted precisa salir del brete en el
menor tiempo posible.
Otro punto que debe considerar es su intercambio de links,
si posee. Revise con qué sitios ha intercambiado
enlaces web, vea si hay plagiarios, y vea también
si hay sitios web que han sido baneados (y que lo arrastran
a usted en la caída). Si su sitio web es de
software y ha intercambiado links con una página
web de programas ilegales, es posible que Google cuando
castigue a una, lo haga con el resto. Quite el enlace,
comuníquese con el webmaster del sitio penalizado
y pídale que quite su nombre y enlace de la página.
Y otra causa puede ser su mismo sitio web; que el
código de la página se haya corrompido
y resulte ilegible.
Paso 2 : control de daños
Lo primero que debe hacer, una vez que haya eliminado
las causas posibles, es establecer un control de daños.
Chequee las estadísticas habituales de su sitio,
y vea cuántos visitantes ha perdido en el tráfico
diario. Si usted posee estadísticas del tipo
Webalizer, estas le resultarán eficientes
para medir cuando pasa el Googlebot (generalmente
figura como un cliente o como un navegador modificado,
en el cuadro de estadísticas), pero tiene el
problema que se generan con 24 horas de diferencia.
Entonces, incluya inmediatamente un boton de estadísticas
al momento, como Needstat / Webstats4u u
otro gratuito. Es cierto que esto hace perder algo de
tráfico (el codigo a veces tarda en cargarse
y arrastra la carga de su pagina también), pero
usted sabe inmediatamente si hay cambios en el volumen
del tráfico. Incluya el código en todas
las páginas de su sitio, para saber al instante
si Google le ha perdonado la vida, o si alguna
página interna ha sido reflotada.
Revise el índice de Google. Busque www.susitio.com
(o cómo se llame su página) en el buscador.
Si su página web ha sido baneada, no aparecerá.
En esta búsqueda, no figurará el link a
su sitio, pero puede chequear las búsquedas de
páginas internas, y de otros sitios que linkeen
a su web. Si su sitio ha sido penalizado, queda una especie
de fantasma (hay buscadores, directorios y sitios que
linkean a una página cuyo original no figura en
Google).
En penúltimo lugar, haga memoria de los cambios
que haya introducido en su sitio últimamente.
Si hay diferencia de unos pocos días con la desparicion
en los resultados, significa que esos cambios (de diseño,
contenidos, etc) han sido mal tomados. Sea porque
el texto coincide con otro preexistente en otros sitios
capturados por Google, porque los links estan
mal o el código Html de la página está
corrupto. Elimine dichos contenidos, revise el esquema
de links y vea que todo apunta a páginas web
que realmente existen (su navegación interna
o su sección de intercambio de enlaces).
Hay maneras de saber si el código Html está
corrupto. Primero, haga un seguimiento de su web
en Yahoo. Si Yahoo (su robot se llama slurp! y deja
marca en las estadísticas de su sitio) lo ha
visitado y capturado recientemente, entonces no es un
problema del código. También pruebe,
simulando un robot, de ver como se visualiza su sitio.
La mejor manera de simular lo que ve un robot de buscadores
es instalando el navegador de texto Lynx (que puede
descargar de cualquier web gratis como www.download.com).
Cuesta un poco manejar un navegador DOS con teclas
(básicamente la interfase entra a Google),
pero después de un rato lo podrá dominar.
Como entra a Google, y su sitio no está,
utilice (en la pantalla de Google que le muestra
Lynx) la opción "intente visitar
dicha página directamente, haciendo click en
el vínculo...". Con Lynx usted
ve la navegación pura, sin imágenes ni
colores, y verá si hay términos repetidos,
abuso en los textos ALT de las imágenes, enlaces
mal escritos, etc.
El último paso es instalar la barra Google
en su navegador. La dichosa barrita que indica el
PageRank. Como dijimos en otras ocasiones, el
PR no sirve para casi nada, pero en este caso resultará
útil. Si usted instaló la barra Google
y visita su sitio web, y posee aún algún
PR, es una buena señal. Significa que Google
ocultó a su web, no lo echó del todo de
sus resultados. Si el PR ahora es cero, es el peor
de los casos. Su falta es tan grave que su web ha dejado
de existir para Google.
Paso 3 : estrategia de ataque
Si ha corregido su sitio web de impurezas y posibles
ilegalidades, es hora de empezar tácticas de
guerrilla para regresar al índice del buscador.
El indicador de PR es muy importante para determinar
la estrategia. Si su PR ahora es cero, prácticamente
es un caso perdido. Le recomendaría que iniciara
la construcción de una web enteramente nueva.
Igual puede intentar aplicar algunas recetas. Depure
el código html. Si la web no es muy grande,
le sugeriría que la rediseñe completamente,
o que arme una nueva para un dominio nuevo mientras
intenta resucitar la actual. Depende del PR. Si aún
hay puntos de PR, enmiende la web actual.
Si se lanza a resucitar su web actual porque tiene
PR, intente intercambiar links con otras páginas.
En algunos casos, los webmasters sólo chequeamos
el PR por la barrita Google antes que buscar en el buscador.
Con suerte, consiguiendo algunos enlaces nuevos,
obtiene oportunidades para que el Googlebot visite su
página. Porque aunque esté castigada,
Google sigue visitando su sitio. Debe aprovechar
estas visitas para mostrarle al robot los cambios que
ha introducido en su página.
Si usted ha depurado código, chequeado enlaces
internos y con otros sitios, corregido textos, eliminando
textos ocultos, y considerado que la web ahora está
100% legal, debe realizar un par de pasos más.
En primer lugar, si su sitio web intercambia enlaces
y los publica en el index, le sugiero que tome a la
mitad y los desplace a una página interna (p.ej.
una sección de intercambio de enlaces). Google
tiene un límite respecto a los enlaces que pueden
figurar en un documento html. Si usted ha realizado
demasiados intercambios, sumado a los links hacia secciones
internas, quizás llegue a los 400 vinculos que
es el máximo que puede leer el robot - y que
estén en un solo documento html -. Los enlaces
web siempre deben figurar en la página inicial
- los webmasters apreciamos mucho esto -, pero puede
dejar los 30 o 40 últimos enlaces, y poner el
resto en una página interna (quizás con
menor PR, pero sigue siendo válida).
En segundo lugar, si está convencido que está
todo listo, debe anotarse en el programa de Google
Sitemaps. Para
ello, debe instalar un generador hecho en PHP que desarrolla
un indice escrito en XML (sitemap.xml), tema del cual
hablamos en este portal, y que está descripto
en profundidad en dicho artículo, del cual puede
descargar dicho generador. Chequee que su hosting
tiene servicios PHP habilitados, suba el generador,
ejecútelo y revise la página XML resultante.
Posiblemente esta página deba editarla - porque
memoriza directorios y webs que no queremos que Google
revise y publique en el buscador, como scripts de
correo, carpetas restringidas, la carpeta de estadísticas,
etc -. A su vez, si la analiza, verá si en
su web hay páginas muertas, descolgadas de cualquier
link, páginas de redireccionamiento (p.ej. que
usted puso para secciones que no existen más).
Elimínelas. En algún momento debía
depurarlas, y éste es el indicado.
Una vez que genere el indice XML, anótese en
el programa que tiene el buscador, originalmente pensado
para enormes portales, pero válido para esta
ocasion : Google Sitemaps (https://www.google.com/webmasters/sitemaps/login),
requiere registración gratuita, y suba o linkee
el mapa XML que confeccionó (hay algún
paso intermedio, como subir una paginita de prueba que
le pide Google para verificar que esa web es
la suya). Lo que tiene fantástico el programa
de sitemaps es que le provee estadísticas
realmente muy completas, le dice cómo ve Google
a su web, y le indica cuál es la última
vez que Googlebot lo visitó.
Cuando Google visita su sitio, no significa que
inmediatamente lo habilite. Se toma unos días
(generalmente una semana) para publicar resultados,
si es que lo que vió le gustó. Debe
considerar que toda esta aventura le llevará
semanas o meses, depende de la velocidad y profundidad
de los cambios que implemente. No desespere, tómelo
con ánimo de experimentación. Aplique
toda su experiencia SEO como webmaster para rehabilitar
a su página web.
Paso 4 : otras estrategias alternativas
Google posee una interfase de contacto para
denunciar web spam (robo de contenidos) que se encuentra
en http://www.google.com/intl/es/webmasters/spamreport.html
; hay también, dentro de la interfase de
Google Sitemaps, un link a un formulario para
comunicarle a Google que su sitio web ha sido
depurado y se encuentra en condiciones legales. Usted
puede informárselo a Google, pero en mi opinión
personal, dudo que sea efectivo o que le reporte beneficio,
ya que las listas negras así como los criterios
que usa Google son todos robotizados, no depende de
personas que puedan chequear la corrección de
su sitio.
Si su sitio web demora demasiado tiempo en ser rehabilitado
(por ejemplo, más de dos meses), considere crear
una nueva web en un nuevo dominio. Tambien puede evaluar
adosarle un nombre de subdominio (esos gratis que algunas
páginas ofrecen como miarroba.com, y que
son del tipo www.susitio.miarroba.com) y empezar
un nuevo proceso de registro en los buscadores.
Revise cómo funciona su hosting. Escriba
url inexistentes (www.susitio.com/cualquierpagina.html).
Debe dar un error 404, página no encontrada.
Si, en cambio, al escribir dicha URL se redirige a otro
sitio (por ejemplo, el del proveedor de hosting), hay
un error grave que Google considera como un doorway.
Google chequea esto (y uno puede descubrirlo
gracias a Google sitemaps) como una prueba por
si uno incluyó el archivo robots.txt.
Recordemos : cuando un sitio tiene secciones restringidas
que no quiere que capture Google y las publique,
incluye un archivo llamado robots.txt en una
o varias carpetas, que le dicen al robot que no lea
ese contenido. Google siempre prueba de escribir
www.susitio.com/robots.txt para verificar la
existencia del mismo. Y como su sitio no posee dicho
archivo, y no dá error de página inexistente
sino que se redirige, entonces hay una doorway.
Comuníquese con su proveedor de hosting y pídale
que corrija este error, que pudo haber sucedido por
un mal manejo o inexperiencia del controlador del server
de hosting o, en el peor de los casos, por un ataque
directo de hacking contra los archivos de configuracion
del server (el htaccess, por ejemplo).
En ningún caso debe exasperarse. Todo en la
vida tiene solución, y si bien esto depende de
terceros para regresar a la normalidad, con paciencia
y trabajo es posible resolverlo. |