google al limite ? analizamos los sitemaps, el pagerank y otras herramientas de google para posicionamiento web, y llegamos a inquietantes conclusiones - un articulo de nuestra seccion de estartegia SEO
posicionamiento en buscadores de sitios web en Datahouse Company - click aqui
 
Volver a la pagina principal de Datacraft Volver al indice de Estrategia SEO utilice nuestro buscador interno, motorizado por Google venta de software en CD
 
google al limite ? analizamos los sitemaps, el pagerank y otras herramientas de google para posicionamiento web, y llegamos a inquietantes conclusiones - un articulo de nuestra seccion de estartegia SEO
 
manuales de lenguajes y programas, drivers para todas las versiones de Windows, bases de emails, software para internet, programas para oficina, manuales de hardware y software, fotografias y fuentes para diseño grafico... en Drivers Argentina - click aqui
 

Por Alejandro Franco : mail : info@datacraft.com.ar ; webmaster de Datacraft, Datahouse Company y Drivers Argentina

quiere incluir nuestros artículos en su sitio ? Ahora puede ! : si encuentra interesante este o alguno de nuestros artículos publicados, puede incluirlos libremente en su sitio. Sólo debe respetar el contenido, nombre del autor y email (si figura), y citar como fuente a "Datacraft - tu revista digital", con un link correspondiente a http://www.datacraft.com.ar/ Para mayor información, contáctenos a info@datacraft.com.ar con el asunto "incluir articulos"
El comportamiento de Google, de sus criterios de evaluación, y del funcionamiento de su robot Googlebot es imprevisible. Esa es una realidad incuestionable porque parte de una premisa lógica : uno puede asumir ciertas cosas basadas en la observación, pero si no dispone de la fórmula original de algo, lo único que hace es adivinar. Así como si observando una vaso lleno de Coca Cola, pudiéramos deducir la fórmula que compone el refresco ... y todas sus propiedades.

Intentar "comprender" a Google ha resultado, cada vez, más complejo, y especialmente si no conocemos los criterios que manejan sus algoritmos. Mientras que hace unos años, sólo bastaba construir sitios con un código html limpio, y anotarlo en la mayor cantidad de buscadores, hoy en día la situación es bastante más complicada. Nuevos criterios implementados por el buscador más grande de la Tierra rozan entre lo lógico y el mero capricho, y foros dedicados a la estrategia de optimización para buscadores (SEO) explotan en discusiones y acalorados debates sobre qué quiso decir / qué se interpreta del último cambio de políticas de Google. Cual dios pagano, al cual todos rinden homenaje, y del cual todos intentan descifrar mensajes no siempre claros.

Pero lo cierto es, que Google está actuando de modo diferente, y está dando señales de límites en algunas capacidades. ¿Es realmente una incapacidad tecnológica de seguir devorando información, o se trata de un criterio concienzudamente implementado ?. Lo veremos a lo largo de esta nota.

Algunos de los cambios : el PageRank

Si hay algo que enciende pasiones, es la puntuación que Google asigna a nuestros web sites, y que es visible a través de su barra de herramientas agregada al Internet Explorer (Google Toolbar), llamado PageRank.

En un principio el PageRank indicaba la cantidad de sitios que nos enlazaban (buscadores, otros sitios, etc). Pero ahora la interpretación es mucho más compleja. Sitios con pocos enlaces pueden tener un PR más alto que otros sitios anotados en miles de otras webs. Establecer un PR para Google, es una mezcla entre cantidad de enlaces, cantidad de material (texto) original, óptima construcción de la página, densidad o frecuencia de palabras que Google considere importantes... y un largo etc. Un sitio con PR 5 puede figurar mejor en resultados que un sitio con PR 6, y cosas así.

Pero del PageRank se desprenden algunas conclusiones interesantes : una, es que Google nos valora de acuerdo a una serie de criterios - y como es obvio, comparado con otras paginas webs, estaremos mejores o peores en uno u otro sentido, de enlaces, palabras, etc. - y nos dá un número que es totalmente relativo. Ese número nos dá un ranking y nos aproxima o aleja entre los sitios más populares de la Tierra y las webs que recien empiezan. Y, cuando la cantidad de sitios webs a nivel mundial crece, el PR disminuye, a pasos lentos, por una cuestión de agregar cada vez más criterios para determinar el PR. Digamoslo así : Google es un concurso de belleza, y premia a los mejores con la corona y los cargos de princesa. Es fácil elegir reina y princesas en 10 concursantes ... pero cómo hacer con millones ?. Por eso, si usted tenía PR 6 el año pasado, es posible que este año tenga un PR 5, aun cuando no haya hecho nada malo. Su sitio no es menos popular, sino que Google tiene cada vez mas criterios. Quizás en ese sentido, el PR sea algo pasado de moda, y debería darse una escala, no de uno a diez, sino de uno a la infinitésima, tal como hace Alexa, que es algo más concreto. P.ej., si Datacraft tiene un puesto 210.000 según Alexa, significa que en todo el mundo hay 209.999 sitios más populares que nuestro portal.

Pero, en segundo lugar, el PR y cómo monitorearlo, comienza a dar muestra de una tendencia de Google : usted sólo sabe su PR vía barra Google. El usuario común no sabe esto, lo sabe el webmaster. O sea que Google comienza a dar señales a los webmasters para que entiendan algunos de sus criterios y, especialmente, para facilitar su trabajo. Si Google nos está hablando en chino, es para que quienes hablamos chino entendamos lo que dice. Y nos da guías, especialmente para quienes somos webmasters profesionales, para despegar nuestros sitios de la gigantesca masa de webs amateurs. O sea, Google nos habla para que mejoremos y nos destaquemos, ya que - al parecer - , él solo no puede hacerlo.

La base de este criterio es muy simple : evitar la lotería, los resultados por azar. En los ´90 no era difícil armar una web básica y competir (hasta inconscientemente, sin propósito) en primeros lugares en resultados. Ahora Google busca que los primeros lugares los tomen quienes hacen bien los deberes. O sea, quienes estudian las directivas, y tienen buenos instintos para sufrir las olas de las Google Dance.

Otro de los cambios : la captura de sitios

Mientras que hasta no hace mucho, Google no daba importancia a los meta tag de descripción de páginas (mostraba capturas parciales de texto en resultados), ahora muestra indefectiblemente la etiqueta meta de descripción. Igual memoriza parte de los textos (hasta 100 kb por página). ¿Significa que Google se ha puesto más ordenado, o son señales de limitación de su capacidad ?

Pero hay mas datos sobre el tema de la captura : si usted es webmasters y usa estadísticas en su sitio, habrá podido descifrar cuándo es que lo visite Googlebot, el robot del buscador, para capturar su web. Las visitas se han hecho cada vez más espaciadas, e incluso se notan que ciertas visitas, a pesar de incluir material nuevo, no capturan nada. Aparentemente, si el material incluido no es original, Google lo está descartando de plano, mientras que antes lo capturaba directamente, aunque lo posicionaba muy bajo en resultados. Por ejemplo, muchos portales que repiten palabra por palabra una noticia o texto, figuraban todos, y el creador de la nota original (bah, el primero capturado), en primer lugar, siguiendo sus "clones" ubicados entre otros criterios, por su PR. Hoy Google es mucho más selectivo, y no se satura de material clonado.

Pero quizás el dato más interesante de todo esto, es que Google ha comenzado a limitar la navegación interna de su sitio. Por ejemplo, si su web tiene un PR 5, quizás no capture más de 450 páginas. Y todas ellas no estarán completas, sino verá que las que figuran al final (cuando empieza a investigar en "más páginas de este sitio"), tienen descripción / contenido vacío (y eso que estuvieron bien capturadas hace bastante tiempo). ¿Que esto es ilógico ?. ¿Que usted conoce webs con miles de páginas capturadas - por ejemplo, los foros - ?. Pronto veremos que no es tan así.

El PR para algo sirve. Y, entre otras cosas, para ser un criterio interno de Google, para limitar su cantidad de información a procesar de un sitio web. Si usted tiene un PR 1 y un foro con 900 páginas, olvídese que Google capture las 900 páginas. Tal como dijimos antes, el PR tiene su peso para varias decisiones que toma el robot, y especialmente para diferenciar entre quienes hacen los suyo con dedicación y limpieza, y quienes lo hacen a la marchanta. De algún modo, un mecanismo no humano como un spider de Internet debe diferenciar entre información valiosa y pura basura, y fundamentalmente, cómo evitar saturarse con información no útil.

Para diferenciar aficionados y profesionales, Google ha comenzado a implementar - en plan beta - un mecanismo llamado Sitemaps. Si bien hasta ahora era usual que los webmasters construyeran una página con todos los links de su web en la misma (para que Google lo usara y navegara todo el contenido), ahora el popular buscador busca implementar algo similar... pero sin toparse con su propio límite de 100 kb capturados por página web, y armado de un modo algo más complejo, que posiblemente no está al alcance de cualquiera.

Los Sitemaps es el tradicional mapa del sitio (con todos los enlaces), pero armado en XML, puesto en una página aparte - no pública - , e informada directamente a Google a través de su sección, que puede encontrarse en https://www.google.com/webmasters/sitemaps/login(precisa obtener una cuenta gratuita Google previamente). Un mapa del web site puede hacerse en XML sin muchas complicaciones y casi automáticamente mediante scripts PHP que se obtienen en la web. Nosotros incluímos uno, que puede descargar (formato RAR) haciendo click aqui. Una vez que suba los archivos, les de la propiedad 666 mediante su software de FTP y lo ejecute, le generará un archivo sitemap.xml que deberá informar a Google.

Mediante los Sitemaps en XML, uno habla más directamente con Google, pidiendo que nos visite nuestra página. Y que navegue la totalidad de ella. Cada vez que incorporemos una novedad, deberemos correr nuevamente el script PHP e informarlo a Google para que envíe su robot. Este nos navegará en totalidad y capturará en un tiempo algo menor a lo normal (o lo que era habitual hasta hace unos años).

De todo esto pueden obtenerse algunas conclusiones interesantes :

1 - que el PR y otros parámetros de Google no son solo puntuaciones para nosotros, sino que Google mismo le da importancia para establecer, por ejemplo, la frecuencia de visitas y la cantidad de paginas a capturar

2 - que Google está llegando a un nivel de saturación en aspectos físicos y de programación. Las simples sentencias lógicas de su robot ya no bastan para establecer primeros puestos, y nos pide ayuda con la colaboración de quienes somos webmasters, para cumplir ciertas reglas y criterios que Google establece para especialistas, y comenzar a diferenciar / calificar entre sitios webs, y posicionar. Es tan grande la masa de webs "primerizas", que precisa que los humanos hagan méritos siguiendo sus directivas, para posicionar mejor a los sitios "Google approved".

3 - y lo que resulta más alarmante de todo, mencionado en estos últimos párrafos, es que todas estas son muestras de que Google está llegando a un límite de capacidad. Capacidad física es lo de menos, se soluciona con más servidores. Pero acá se trata de capacidad de calificación, y de la inmensidad de información nueva que surge día a día, que no puede ser recorrida de modo eficiente en tiempo y espacio. Capturar nuevas webs lo sigue haciendo... pero quizás de un modo no tan eficiente como antes, o no dándole el valor que corresponde. Al establecer criterios extra, que sólo cumplirán algunos entre muchos, le ayuda a organizar su trabajo, y posiblemente a premiar a los cumplidores. Si bien es un criterio de calidad y cooperación, lo cierto es que lo que muestra, es que el límite de lo infinito está más cerca de lo que habíamos pensado.

 
posicionamiento en buscadores de sitios web en Datahouse Company - click aqui
utilice nuestro formulario de contacto directo para averiguar por productos o servicios