Cibertecnia - los problemas mas frecuentes de un sitio web exitoso. Desde robots spammers hasta el robo de imagenes y textos
posicionamiento en buscadores de sitios web en Datahouse Company - click aqui
 
Volver a la pagina principal de Datacraft Volver al indice de Posicionamiento Web utilice nuestro buscador interno, motorizado por Google venta de software en CD
 
posicionamiento web articulos problemas webmasters sitios paginas exitosas rankeadas bien posicionadas robots spammers estadisticas notas seo serp
 
manuales de lenguajes y programas, drivers para todas las versiones de Windows, bases de emails, software para internet, programas para oficina, manuales de hardware y software, fotografias y fuentes para diseño grafico... en Drivers Argentina - click aqui
 

Un sitio web exitoso posee popularidad y prestigio; pero pocos conocen que esa fama tiene un costo. Aquí describimos algunos de los efectos colaterales de poseer una web popular en su rubro.

quiere incluir nuestros artículos en su sitio ? Ahora puede ! : si encuentra interesante este o alguno de nuestros artículos publicados, puede incluirlos libremente en su sitio. Sólo debe respetar el contenido, nombre del autor y email (si figura), y citar como fuente a "Datacraft - tu revista digital", con un link correspondiente a http://www.datacraft.com.ar/ Para mayor información, contáctenos a info@datacraft.com.ar con el asunto "incluir articulos"
Por Alejandro Franco : mail : info@datacraft.com.ar ; webmaster de Datacraft, Datahouse Company y Drivers Argentina

Un sitio web tranquilo es un sitio web muerto. Si tiene poco o nada de tráfico, directamente se encuentra en coma y nunca aspirará a figurar primero en los rankings de buscadores.

Pero si usted se toma la molestia de aplicar criterios técnicos para optimizar su página web y posicionarla entre los primeros puestos de resultados, usted ya posee un sitio exitoso. No precisa tener millones de visitas; basta con que figure primero en su rubro (sea popular o no). Y también deberá prepararse para los efectos colaterales. Una web bien posicionada genera contactos y visitantes, y con el tiempo termina por construir una marca (la gente ya la conoce por el nombre), dejando de ser una página más, perdida en el anonimato de billones de sitios que pululan en Internet. Pero así como sucede en la vida real, el éxito tiene un costo y usted deberá estar listo para poder afrontarlo.

El costo del éxito 1: el robo de imágenes (y el tráfico inflado)

El primer efecto colateral de tener un sitio web bien posicionado es el abuso de las imágenes del mismo. Como usted ya debe saber, Google (y el resto de los buscadores secundarios como Yahoo y MSN, por ejemplo) posicionan páginas web así como las imágenes que contienen las mismas. Lo usual (hasta hace poco) es que las posiciones de sitios coincidieran con las de sus imágenes; si usted buscaba el término "club deportivo ZZ" y encontraba la página de José Perez dedicada al tema en primer lugar, al buscar imágenes del "club deportivo ZZ" encontraría las fotos del sitio de Jose Perez en los primeros puestos. (ahora puede encontrar una vaca, juguetes porno y fotos de gente haciendo monigotadas en Google, simplemente porque el buscador numero 1 del mundo ha castrado su buscador de imagenes por diversas razones: 1) para evitar problemas legales sobre derechos de imagenes 2) para intentar vender esas posiciones a sitios gigantes de venta de fotos de stock y 3) porque el código fuente de Google cada vez es más ineficiente cuando existe un interés comercial de por medio).

Pero aún con la enorme ineficiencia de Google para posicionar imagenes que coincidan con los términos que pretende buscar, es posible hallar dichas fotos. ¿Quiénes buscan esas fotos?. No conozco las cifras exactas, pero podría vaticinar con un mínimo margen de error que el 10% de quienes realizan la búsqueda lo hacen para obtener imágenes para trabajos de oficina y diversas presentaciones; un 20% son webmasters que están a la caza de fotografías para utilizar en sus sitios web; y el 70% es gente que participa en foros y desea ilustrar una idea, hacer un chiste o poner un avatar (icono que los representa al publicar los posts) que parezca pintoresco.

El problema de los posteadores de foros (o diseñadores de blogs, que suelen tener el mismo vicio) es que no descargan la imagen en su PC y la vuelven a subir al foro donde desean publicarla, sino que lo hacen a traves de un link directo a su página. Por ejemplo www.deportivozz.com/futbol.jpg . Así que cada vez que estos genios deciden escribir una tontería memorable (y tienen el link de una imagen de su sitio web como rehen, apareciendo en cada post que redactan) le consume a usted tráfico web. El trafico web se lee por dos datos: visitas y megabytes consumidos (por ejemplo, el peso total del documento + las imagenes y adornos que usted haya incluido, y que cada visitante descarga en su PC a través del navegador cada vez que ingresa en su página). Con cada nuevo post que realiza el ladrón de imágenes, se suma una visita y una cantidad de MB que consume a su costilla. Además, cada visitante de dicho foro que lea el dichoso post volverá a realizar un consumo de su cuenta (la imagen debe volver a aparecer y a cargarse desde el sitio web original).

Existen dos maneras para combatir esto: una, reemplace las imagenes de su sitio web por representaciones en Flash (son más difíciles de linkear directamente y no todos los foros y blogs las admiten); la segunda, utilice la cantidad mínima e indispensable de imagenes en su sitio web.

El costo del éxito 2: el robo de textos

Otra de los abusos más corrientes es el robo de textos. En otra medición a ojo, me atrevería a decir que sólo el 30% de los contenidos totales de Internet son originales y el resto es pura copia. Mucha gente copia y pega párrafos (e incluso páginas enteras) de su sitio web para volcarlas en foros, blogs y portales. Esto va desde chistes, frases celebres hasta textos institucionales de sitios empresariales. El problema de todo esto es que, cuando Google y otros buscadores detectan sitios con contenidos calcados, tiende a restar ranking a todos ellos (bajan posiciones en los resultados). La teoría indica que Google sabe cuál es el sitio donde se encontraba primero el contenido (memoriza su antiguedad), pero en la práctica muy poco de esto sucede. Y, lo que es peor, cuando la cantidad de contenidos coincide en exceso entre dos o más sitios, la penalización es más severa (bajan a últimos lugares o son baneados por los buscadores).

Usted puede intentar implementar scripts insertados en el código fuente de su sitio para bloquear el uso del boton izquierdo del ratón (que impide seleccionar, copiar y pegar), pero un webmaster experto sabe cómo saltearse estos impedimentos. Lo que le resta es chequear los buscadores periódicamente, poniendo frases enteras que haya escrito como contenido de su sitio y fijarse si alguien más las está reproduciendo. Y amablemente pedirle a dicho webmaster que lo altere o quite, o bien usted deberá proceder a escribir un nuevo texto original.

El costo del éxito 3: los robots spammers

El spam ya ha dejado de ser una tecnología restringida al email. Mientras que antes se tomaba una lista de correo electrónicos y se despachaban miles de emails basura a los destinatarios a través de un cliente masivo, ahora existen mecanismos más sofisticados y difíciles de controlar.

Existen webmasters que desarrollan robots propios, capaces de navegar sitios web e ir saltando de una página a la otra. Esto ya de por sí le aumenta artificialmente el tráfico; ¿pero con qué propósito?. Hasta ahora los robots spammers tienen dos objetivos:

1 - completar automáticamente los formularios de contacto de su página web. Usualmente esto es una idiotez mayúscula (se envía constantemente spam al webmaster sobre venta de Viagra, por ejemplo), pero puede tener un costado más peligroso que es el abuso de scripts para beneficio propio. Mientras que la mayoría de sitios web posee al menos un formulario de contacto, si el script que utiliza para ejecutarlo es un CGI al menos puede dormir tranquilo el webmaster, sabiendo de que sólo el spam será recibido por él. Pero, en cambio, si se trata de un script de correo hecho en PHP, ¡póngase en alerta!. El PHP es un lenguaje con muchas vulnerabilidades; una de ellas pasa porque los formularios de correo no contemplan la anulación de la posible función de CC (carbon copy) cuando realizan un despacho de email. Intentaré explicárselo en términos sencillos: el robot "explota" la debilidad del CC del formulario de correo y empieza a despachar spam desde su sitio web a cualquier destinatario (no sólo el webmaster, que es el que recibe la primera copia). O sea que terminan haciendo su negocio y a usted lo ponen en la lista negra (un CGI, al estar más protegido su código fuente - hardcoded -, evita estos abusos). Consejo: utilice CGI en vez de scripts PHP para los formularios de correo directo.

2 - el otro propósito de los robots spammers es simplemente provocar tráfico para quedar registrados en su estadística. Todos los sitios web poseen estadísticas propias del tip webalyzer o similares. Entre otros datos que registran, figuran los robots que han visitado el sitio (googlebot, slurp de Yahoo, etc). Pero usualmente uno se lleva la sorpresa al ver que el robot se llama www.paginapirulo.com .¿Qué sentido tiene?. Es muy simple; muchos webmasters son totalmente incautos respecto de sus estadísticas, y las mismas pueden ser accesibles sin ningún tipo de contraseña. El propósito de estos robots es hacer web spam; publican las estadísticas de su sitio en Google y otros buscadores, y hacen figurar a la pagina www.paginapirulo.com en las mismas, con lo cual termina que usted le está dando un link gratis hacia dicho sitio (y por lo tanto, mejorando el posicionamiento de este último). Esto es algo idéntico a lo que sucede con los robots que hacen web spam en foros, blogs y libros de visitas: cargan un comentario que incluye un link hacia un sitio web determinado, con el sólo fin de aumentar los enlaces recibidos por dicho sitio y mejorar su posicionamiento web. Ejemplos de esto son mutoid org, perlazas com y comosabermiip net (les quito el punto para no regalarles el enlace), auténticas web basura que intentan a toda costa obtener un posicionamiento creando enlaces artificiales en sitios desprotegidos. ¿La solución?. 1) ponga contraseñas a la url de sus estadísticas y no las haga públicas 2) mediante el panel de control de administracion de su web (o pidiéndole a su proveedor de hosting) banee la IP del sitio web que envía el robot.

El costo del éxito 4: la pelea con Google por la indexación de contenidos

Hay varias mentiras que proliferan por Internet y que todo el mundo repite como loro. Por ejemplo, que los contenidos originales son el Rey y que Google premia a los sitios web que publican material nuevo. Totalmente falso. Si el contenido que usted publica puede tener un valor comercial para Google, privilegiará a los sitios webs más importantes (los de mayor PageRank) y posiblemente omita el suyo. En nuestro caso, tenemos el ejemplo de dos críticas de filmes muy populares (Beowulf y John Rambo) que hace dos meses que fueron posteadas en la web y que Google se ha negado sistemáticamente a indexarlas.

La cuestión es muy simple: Google establece cupos. Si usted posee una .com.ar jamás podrá alcanzar un ranking alto; eso está reservado para las .com (y especialmente para las .com que son clientes de Google). Siguiendo con el mismo ejemplo de las reviews de cine, es posible encontrar en los primeros puestos a sitios que generan basura (textos sin sentido) en primer lugar, simplemente porque son usuarias de Ad Sense (le pagan por click a Google para aparecer en resultados). Usted puede buscar la crítica de un film y encontrar una página vacía (generada automáticamente por un soft creador de contenidos) con el frustrante texto "muy pronto la leerá aquí" o "no hay ningún contenido al respecto". Pero aún estando toda la página en blanco, se encuentra en primer lugar por encima de otros sitios que sí han tenido la decencia de escribir algo sobre el mismo tema.

Y siguiendo con los cupos y privilegios, no espere que Google indexe todas sus páginas. Siempre tiene un pero y siempre pone un límite. A Google no le importa si usted ha descubierto la cura milagrosa contra todo tipo de cancer y lo describe detalladamente en 600 páginas; le indexará 400 o 500, y de allí no pasará. Quizás si usted tuviera un PageRank 9 o 10 (como Microsoft.com) Google se tomará la molestia de leer todo su sitio. Como el huevo y la gallina, usted no puede subir de categoría mientras no publique mucho contenido original; pero a su vez, Google se lo impide porque usted no tiene ranking suficiente. No importan los sitemaps, los lineamientos oficiales de Google, etc. Es simplemente una cuestión de castas.

Ahora usted conoce algunos de los problemas que produce tener un sitio popular. Figurar en primeros lugares en resultados (en uno o en muchos términos) atrae visitantes pero también robots dañinos y otro tipo de problemas. Ascender en popularidad no es difícil, pero termina por ocurrir lo de siempre: cuanto más arriba esté, mayores serán las trabas. Usted puede resolver la mayoría de estos inconvenientes, pero otros dependen de factores externos fuera de su control. Armese de paciencia, realice un buen diagnóstico y depure el camino de ascenso de todos los obstáculos posibles mediante la aplicación de estas prácticas recetas.

 
posicionamiento en buscadores de sitios web en Datahouse Company - click aqui
utilice nuestro formulario de contacto directo para averiguar por productos o servicios