|
Un sitio web tranquilo es un sitio web muerto.
Si tiene poco o nada de tráfico, directamente se
encuentra en coma y nunca aspirará a figurar primero
en los rankings de buscadores.
Pero si usted se toma la molestia de aplicar
criterios técnicos para optimizar su página
web y posicionarla entre los primeros puestos de resultados,
usted ya posee un sitio exitoso. No precisa tener millones
de visitas; basta con que figure primero en su rubro
(sea popular o no). Y también deberá prepararse
para los efectos colaterales. Una web bien
posicionada genera contactos y visitantes, y con el
tiempo termina por construir una marca (la gente ya
la conoce por el nombre), dejando de ser una página
más, perdida en el anonimato de billones de sitios
que pululan en Internet. Pero así como sucede
en la vida real, el éxito tiene un costo y usted
deberá estar listo para poder afrontarlo.
El costo del éxito 1: el
robo de imágenes (y el tráfico inflado)
El primer efecto colateral de tener un sitio web bien
posicionado es el abuso de las imágenes del mismo.
Como usted ya debe saber, Google (y
el resto de los buscadores secundarios como Yahoo
y MSN, por ejemplo) posicionan páginas
web así como las imágenes que contienen
las mismas. Lo usual (hasta hace poco) es que las posiciones
de sitios coincidieran con las de sus imágenes;
si usted buscaba el término "club deportivo
ZZ" y encontraba la página de José
Perez dedicada al tema en primer lugar, al buscar imágenes
del "club deportivo ZZ" encontraría
las fotos del sitio de Jose Perez en los primeros puestos.
(ahora puede encontrar una vaca, juguetes porno y fotos
de gente haciendo monigotadas en Google,
simplemente porque el buscador numero 1 del mundo ha
castrado su buscador de imagenes por diversas razones:
1) para evitar problemas legales sobre derechos de imagenes
2) para intentar vender esas posiciones a sitios gigantes
de venta de fotos de stock y 3) porque el código
fuente de Google cada vez es más
ineficiente cuando existe un interés comercial
de por medio).
Pero aún con la enorme ineficiencia de Google
para posicionar imagenes que coincidan con los términos
que pretende buscar, es posible hallar dichas fotos.
¿Quiénes buscan esas fotos?. No conozco
las cifras exactas, pero podría vaticinar con
un mínimo margen de error que el 10% de quienes
realizan la búsqueda lo hacen para obtener imágenes
para trabajos de oficina y diversas presentaciones;
un 20% son webmasters que están a la caza de
fotografías para utilizar en sus sitios web;
y el 70% es gente que participa en foros y desea
ilustrar una idea, hacer un chiste o poner un avatar
(icono que los representa al publicar los posts) que
parezca pintoresco.
El problema de los posteadores de foros (o diseñadores
de blogs, que suelen tener el mismo vicio) es que no
descargan la imagen en su PC y la vuelven a subir al
foro donde desean publicarla, sino que lo hacen a traves
de un link directo a su página. Por ejemplo www.deportivozz.com/futbol.jpg
. Así que cada vez que estos genios deciden escribir
una tontería memorable (y tienen el link de una
imagen de su sitio web como rehen, apareciendo en cada
post que redactan) le consume a usted tráfico
web. El trafico web se lee por dos datos: visitas
y megabytes consumidos (por ejemplo, el peso
total del documento + las imagenes y adornos que usted
haya incluido, y que cada visitante descarga en su PC
a través del navegador cada vez que ingresa en
su página). Con cada nuevo post que realiza
el ladrón de imágenes, se suma una visita
y una cantidad de MB que consume a su costilla.
Además, cada visitante de dicho foro que lea
el dichoso post volverá a realizar un consumo
de su cuenta (la imagen debe volver a aparecer y a cargarse
desde el sitio web original).
Existen dos maneras para combatir esto: una,
reemplace las imagenes de su sitio web por representaciones
en Flash (son más difíciles de linkear
directamente y no todos los foros y blogs las admiten);
la segunda, utilice la cantidad mínima e indispensable
de imagenes en su sitio web.
El costo del éxito 2: el
robo de textos
Otra de los abusos más corrientes es el robo
de textos. En otra medición a ojo, me atrevería
a decir que sólo el 30% de los contenidos
totales de Internet son originales y el resto es pura
copia. Mucha gente copia y pega párrafos
(e incluso páginas enteras) de su sitio web para
volcarlas en foros, blogs y portales. Esto va desde
chistes, frases celebres hasta textos institucionales
de sitios empresariales. El problema de todo
esto es que, cuando Google y otros buscadores detectan
sitios con contenidos calcados, tiende a restar ranking
a todos ellos (bajan posiciones en los resultados).
La teoría indica que Google
sabe cuál es el sitio donde se encontraba primero
el contenido (memoriza su antiguedad), pero en la práctica
muy poco de esto sucede. Y, lo que es peor, cuando la
cantidad de contenidos coincide en exceso entre dos
o más sitios, la penalización es más
severa (bajan a últimos lugares o son baneados
por los buscadores).
Usted puede intentar implementar scripts insertados
en el código fuente de su sitio para bloquear
el uso del boton izquierdo del ratón (que impide
seleccionar, copiar y pegar), pero un webmaster experto
sabe cómo saltearse estos impedimentos. Lo que
le resta es chequear los buscadores periódicamente,
poniendo frases enteras que haya escrito como contenido
de su sitio y fijarse si alguien más las está
reproduciendo. Y amablemente pedirle a dicho webmaster
que lo altere o quite, o bien usted deberá proceder
a escribir un nuevo texto original.
El costo del éxito 3: los
robots spammers
El spam ya ha dejado de ser una tecnología restringida
al email. Mientras que antes se tomaba una lista de correo
electrónicos y se despachaban miles de emails basura
a los destinatarios a través de un cliente masivo,
ahora existen mecanismos más sofisticados y difíciles
de controlar.
Existen webmasters que desarrollan robots propios,
capaces de navegar sitios web e ir saltando de una página
a la otra. Esto ya de por sí le aumenta
artificialmente el tráfico; ¿pero
con qué propósito?. Hasta ahora los
robots spammers tienen dos objetivos:
1 - completar automáticamente los formularios
de contacto de su página web. Usualmente
esto es una idiotez mayúscula (se envía
constantemente spam al webmaster sobre venta de Viagra,
por ejemplo), pero puede tener un costado más
peligroso que es el abuso de scripts para beneficio
propio. Mientras que la mayoría de sitios web
posee al menos un formulario de contacto, si el script
que utiliza para ejecutarlo es un CGI al menos puede
dormir tranquilo el webmaster, sabiendo de que sólo
el spam será recibido por él. Pero,
en cambio, si se trata de un script de correo hecho
en PHP, ¡póngase en alerta!. El PHP es
un lenguaje con muchas vulnerabilidades; una de ellas
pasa porque los formularios de correo no contemplan
la anulación de la posible función de
CC (carbon copy) cuando realizan un despacho de email.
Intentaré explicárselo en términos
sencillos: el robot "explota" la debilidad
del CC del formulario de correo y empieza a despachar
spam desde su sitio web a cualquier destinatario (no
sólo el webmaster, que es el que recibe la primera
copia). O sea que terminan haciendo su negocio y a usted
lo ponen en la lista negra (un CGI, al estar más
protegido su código fuente - hardcoded
-, evita estos abusos). Consejo: utilice CGI
en vez de scripts PHP para los formularios de correo
directo.
2 - el otro propósito de los robots
spammers es simplemente provocar tráfico para
quedar registrados en su estadística.
Todos los sitios web poseen estadísticas propias
del tip webalyzer o similares. Entre otros
datos que registran, figuran los robots que han visitado
el sitio (googlebot, slurp de Yahoo,
etc). Pero usualmente uno se lleva la sorpresa al ver
que el robot se llama www.paginapirulo.com
.¿Qué sentido tiene?. Es muy simple; muchos
webmasters son totalmente incautos respecto de sus estadísticas,
y las mismas pueden ser accesibles sin ningún
tipo de contraseña. El propósito
de estos robots es hacer web spam; publican las estadísticas
de su sitio en Google y otros buscadores, y hacen figurar
a la pagina www.paginapirulo.com en las mismas, con
lo cual termina que usted le está dando un link
gratis hacia dicho sitio (y por lo tanto, mejorando
el posicionamiento de este último).
Esto es algo idéntico a lo que sucede con los
robots que hacen web spam en foros, blogs y libros de
visitas: cargan un comentario que incluye un link hacia
un sitio web determinado, con el sólo fin de
aumentar los enlaces recibidos por dicho sitio y mejorar
su posicionamiento web. Ejemplos
de esto son mutoid org, perlazas com y comosabermiip
net (les quito el punto para no regalarles el enlace),
auténticas web basura que intentan a toda costa
obtener un posicionamiento creando enlaces artificiales
en sitios desprotegidos. ¿La solución?.
1) ponga contraseñas a la url de sus estadísticas
y no las haga públicas 2) mediante el panel de
control de administracion de su web (o pidiéndole
a su proveedor de hosting) banee la IP del sitio web
que envía el robot.
El costo del éxito 4: la
pelea con Google por la indexación de contenidos
Hay varias mentiras que proliferan por Internet y que
todo el mundo repite como loro. Por ejemplo,
que los contenidos originales son el Rey y que Google
premia a los sitios web que publican material nuevo.
Totalmente falso. Si el contenido que usted publica
puede tener un valor comercial para Google, privilegiará
a los sitios webs más importantes (los de mayor
PageRank) y posiblemente omita el suyo. En
nuestro caso, tenemos el ejemplo de dos críticas
de filmes muy populares (Beowulf
y John
Rambo) que hace dos meses que fueron posteadas en
la web y que Google se ha negado sistemáticamente
a indexarlas.
La cuestión es muy simple: Google establece
cupos. Si usted posee una .com.ar jamás
podrá alcanzar un ranking alto; eso está
reservado para las .com (y especialmente para
las .com que son clientes de Google).
Siguiendo con el mismo ejemplo de las reviews de cine,
es posible encontrar en los primeros puestos a sitios
que generan basura (textos sin sentido) en primer lugar,
simplemente porque son usuarias de Ad Sense
(le pagan por click a Google para aparecer
en resultados). Usted puede buscar la crítica
de un film y encontrar una página vacía
(generada automáticamente por un soft creador
de contenidos) con el frustrante texto "muy pronto
la leerá aquí" o "no hay ningún
contenido al respecto". Pero aún estando
toda la página en blanco, se encuentra en primer
lugar por encima de otros sitios que sí han tenido
la decencia de escribir algo sobre el mismo tema.
Y siguiendo con los cupos y privilegios, no
espere que Google indexe todas sus páginas.
Siempre tiene un pero y siempre pone un límite.
A Google no le importa si usted ha descubierto
la cura milagrosa contra todo tipo de cancer y lo describe
detalladamente en 600 páginas; le indexará
400 o 500, y de allí no pasará.
Quizás si usted tuviera un PageRank 9 o 10 (como
Microsoft.com) Google se tomará
la molestia de leer todo su sitio. Como el huevo y la
gallina, usted no puede subir de categoría mientras
no publique mucho contenido original; pero a su vez,
Google se lo impide porque usted no
tiene ranking suficiente. No importan los sitemaps,
los lineamientos oficiales de Google,
etc. Es simplemente una cuestión de castas.
Ahora usted conoce algunos de los problemas que produce
tener un sitio popular. Figurar en primeros
lugares en resultados (en uno o en muchos términos)
atrae visitantes pero también robots dañinos
y otro tipo de problemas. Ascender en popularidad
no es difícil, pero termina por ocurrir lo de
siempre: cuanto más arriba esté, mayores
serán las trabas. Usted puede resolver la mayoría
de estos inconvenientes, pero otros dependen de factores
externos fuera de su control. Armese de paciencia, realice
un buen diagnóstico y depure el camino de ascenso
de todos los obstáculos posibles mediante la
aplicación de estas prácticas recetas. |