|
El comportamiento de Google, de sus criterios de evaluación,
y del funcionamiento de su robot Googlebot es imprevisible.
Esa es una realidad incuestionable porque parte de una
premisa lógica : uno puede asumir ciertas cosas
basadas en la observación, pero si no dispone de
la fórmula original de algo, lo único que
hace es adivinar. Así como si observando una
vaso lleno de Coca Cola, pudiéramos deducir la
fórmula que compone el refresco ... y todas sus
propiedades.
Intentar "comprender" a Google ha resultado,
cada vez, más complejo, y especialmente si no
conocemos los criterios que manejan sus algoritmos.
Mientras que hace unos años, sólo bastaba
construir sitios con un código html limpio, y
anotarlo en la mayor cantidad de buscadores, hoy en
día la situación es bastante más
complicada. Nuevos criterios implementados por el buscador
más grande de la Tierra rozan entre lo lógico
y el mero capricho, y foros dedicados a la estrategia
de optimización para buscadores (SEO) explotan
en discusiones y acalorados debates sobre qué
quiso decir / qué se interpreta del último
cambio de políticas de Google. Cual dios pagano,
al cual todos rinden homenaje, y del cual todos intentan
descifrar mensajes no siempre claros.
Pero lo cierto es, que Google está actuando
de modo diferente, y está dando señales
de límites en algunas capacidades. ¿Es
realmente una incapacidad tecnológica de seguir
devorando información, o se trata de un criterio
concienzudamente implementado ?. Lo veremos a lo largo
de esta nota.
Algunos de los cambios : el PageRank
Si hay algo que enciende pasiones, es la puntuación
que Google asigna a nuestros web sites, y que es visible
a través de su barra de herramientas agregada
al Internet Explorer (Google Toolbar), llamado PageRank.
En un principio el PageRank indicaba la cantidad de
sitios que nos enlazaban (buscadores, otros sitios,
etc). Pero ahora la interpretación es mucho más
compleja. Sitios con pocos enlaces pueden tener un PR
más alto que otros sitios anotados en miles de
otras webs. Establecer un PR para Google, es una mezcla
entre cantidad de enlaces, cantidad de material (texto)
original, óptima construcción de la página,
densidad o frecuencia de palabras que Google considere
importantes... y un largo etc. Un sitio con PR 5 puede
figurar mejor en resultados que un sitio con PR 6, y
cosas así.
Pero del PageRank se desprenden algunas conclusiones
interesantes : una, es que Google nos valora de acuerdo
a una serie de criterios - y como es obvio, comparado
con otras paginas webs, estaremos mejores o peores en
uno u otro sentido, de enlaces, palabras, etc. - y nos
dá un número que es totalmente relativo.
Ese número nos dá un ranking y nos aproxima
o aleja entre los sitios más populares de la
Tierra y las webs que recien empiezan. Y, cuando
la cantidad de sitios webs a nivel mundial crece, el
PR disminuye, a pasos lentos, por una cuestión
de agregar cada vez más criterios para determinar
el PR. Digamoslo así : Google es un concurso
de belleza, y premia a los mejores con la corona y los
cargos de princesa. Es fácil elegir reina y princesas
en 10 concursantes ... pero cómo hacer con millones
?. Por eso, si usted tenía PR 6 el año
pasado, es posible que este año tenga un PR 5,
aun cuando no haya hecho nada malo. Su sitio no es menos
popular, sino que Google tiene cada vez mas criterios.
Quizás en ese sentido, el PR sea algo pasado
de moda, y debería darse una escala, no de uno
a diez, sino de uno a la infinitésima, tal como
hace Alexa, que es algo más concreto. P.ej.,
si Datacraft tiene un puesto 210.000 según Alexa,
significa que en todo el mundo hay 209.999 sitios más
populares que nuestro portal.
Pero, en segundo lugar, el PR y cómo monitorearlo,
comienza a dar muestra de una tendencia de Google :
usted sólo sabe su PR vía barra Google.
El usuario común no sabe esto, lo sabe el webmaster.
O sea que Google comienza a dar señales a los
webmasters para que entiendan algunos de sus criterios
y, especialmente, para facilitar su trabajo. Si Google
nos está hablando en chino, es para que quienes
hablamos chino entendamos lo que dice. Y nos da guías,
especialmente para quienes somos webmasters profesionales,
para despegar nuestros sitios de la gigantesca masa
de webs amateurs. O sea, Google nos habla para que mejoremos
y nos destaquemos, ya que - al parecer - , él
solo no puede hacerlo.
La base de este criterio es muy simple : evitar
la lotería, los resultados por azar. En los
´90 no era difícil armar una web básica
y competir (hasta inconscientemente, sin propósito)
en primeros lugares en resultados. Ahora Google busca
que los primeros lugares los tomen quienes hacen bien
los deberes. O sea, quienes estudian las directivas,
y tienen buenos instintos para sufrir las olas de las
Google Dance.
Otro de los cambios : la captura de sitios
Mientras que hasta no hace mucho, Google no daba importancia
a los meta tag de descripción de páginas
(mostraba capturas parciales de texto en resultados),
ahora muestra indefectiblemente la etiqueta meta de
descripción. Igual memoriza parte de los textos
(hasta 100 kb por página). ¿Significa
que Google se ha puesto más ordenado, o son señales
de limitación de su capacidad ?
Pero hay mas datos sobre el tema de la captura : si usted
es webmasters y usa estadísticas en su sitio, habrá
podido descifrar cuándo es que lo visite Googlebot,
el robot del buscador, para capturar su web. Las visitas
se han hecho cada vez más espaciadas, e incluso
se notan que ciertas visitas, a pesar de incluir material
nuevo, no capturan nada. Aparentemente, si el material
incluido no es original, Google lo está descartando
de plano, mientras que antes lo capturaba directamente,
aunque lo posicionaba muy bajo en resultados. Por ejemplo,
muchos portales que repiten palabra por palabra una noticia
o texto, figuraban todos, y el creador de la nota original
(bah, el primero capturado), en primer lugar, siguiendo
sus "clones" ubicados entre otros criterios,
por su PR. Hoy Google es mucho más selectivo, y
no se satura de material clonado.
Pero quizás el dato más interesante de
todo esto, es que Google ha comenzado a limitar la
navegación interna de su sitio. Por ejemplo,
si su web tiene un PR 5, quizás no capture más
de 450 páginas. Y todas ellas no estarán
completas, sino verá que las que figuran al final
(cuando empieza a investigar en "más páginas
de este sitio"), tienen descripción / contenido
vacío (y eso que estuvieron bien capturadas hace
bastante tiempo). ¿Que esto es ilógico
?. ¿Que usted conoce webs con miles de páginas
capturadas - por ejemplo, los foros - ?. Pronto veremos
que no es tan así.
El PR para algo sirve. Y, entre otras cosas, para ser
un criterio interno de Google, para limitar su cantidad
de información a procesar de un sitio web. Si
usted tiene un PR 1 y un foro con 900 páginas,
olvídese que Google capture las 900 páginas.
Tal como dijimos antes, el PR tiene su peso para varias
decisiones que toma el robot, y especialmente para diferenciar
entre quienes hacen los suyo con dedicación y
limpieza, y quienes lo hacen a la marchanta. De algún
modo, un mecanismo no humano como un spider de Internet
debe diferenciar entre información valiosa y
pura basura, y fundamentalmente, cómo evitar
saturarse con información no útil.
Para diferenciar aficionados y profesionales, Google
ha comenzado a implementar - en plan beta - un mecanismo
llamado Sitemaps. Si bien hasta ahora era usual
que los webmasters construyeran una página con
todos los links de su web en la misma (para que Google
lo usara y navegara todo el contenido), ahora el popular
buscador busca implementar algo similar... pero sin
toparse con su propio límite de 100 kb capturados
por página web, y armado de un modo algo más
complejo, que posiblemente no está al alcance
de cualquiera.
Los Sitemaps es el tradicional mapa del sitio (con
todos los enlaces), pero armado en XML, puesto en una
página aparte - no pública - , e informada
directamente a Google a través de su sección,
que puede encontrarse en https://www.google.com/webmasters/sitemaps/login(precisa
obtener una cuenta gratuita Google previamente). Un
mapa del web site puede hacerse en XML sin muchas complicaciones
y casi automáticamente mediante scripts PHP que
se obtienen en la web. Nosotros
incluímos uno, que puede descargar (formato RAR)
haciendo click aqui. Una vez que suba los archivos,
les de la propiedad 666 mediante su software de FTP
y lo ejecute, le generará un archivo sitemap.xml
que deberá informar a Google.
Mediante los Sitemaps en XML, uno habla más
directamente con Google, pidiendo que nos visite nuestra
página. Y que navegue la totalidad de ella. Cada
vez que incorporemos una novedad, deberemos correr nuevamente
el script PHP e informarlo a Google para que envíe
su robot. Este nos navegará en totalidad y capturará
en un tiempo algo menor a lo normal (o lo que era habitual
hasta hace unos años).
De todo esto pueden obtenerse algunas conclusiones
interesantes :
1 - que el PR y otros parámetros de Google
no son solo puntuaciones para nosotros, sino que Google
mismo le da importancia para establecer, por ejemplo,
la frecuencia de visitas y la cantidad de paginas a
capturar
2 - que Google está llegando a un nivel de
saturación en aspectos físicos y de programación.
Las simples sentencias lógicas de su robot ya
no bastan para establecer primeros puestos, y nos pide
ayuda con la colaboración de quienes somos webmasters,
para cumplir ciertas reglas y criterios que Google establece
para especialistas, y comenzar a diferenciar / calificar
entre sitios webs, y posicionar. Es tan grande la masa
de webs "primerizas", que precisa que los
humanos hagan méritos siguiendo sus directivas,
para posicionar mejor a los sitios "Google approved".
3 - y lo que resulta más alarmante de todo,
mencionado en estos últimos párrafos,
es que todas estas son muestras de que Google está
llegando a un límite de capacidad. Capacidad
física es lo de menos, se soluciona con más
servidores. Pero acá se trata de capacidad de
calificación, y de la inmensidad de información
nueva que surge día a día, que no puede
ser recorrida de modo eficiente en tiempo y espacio.
Capturar nuevas webs lo sigue haciendo... pero quizás
de un modo no tan eficiente como antes, o no dándole
el valor que corresponde. Al establecer criterios extra,
que sólo cumplirán algunos entre muchos,
le ayuda a organizar su trabajo, y posiblemente a premiar
a los cumplidores. Si bien es un criterio de calidad
y cooperación, lo cierto es que lo que muestra,
es que el límite de lo infinito está más
cerca de lo que habíamos pensado. |