| Por
Alejandro Franco : mail : info@datacraft.com.ar
; webmaster de Datacraft,
Datahouse Company
y Drivers Argentina
| quiere
incluir nuestros artículos en su sitio ? Ahora puede
! : si encuentra interesante
este o alguno de nuestros artículos publicados, puede
incluirlos libremente en su sitio. Sólo debe respetar
el contenido, nombre del autor y email (si figura), y citar
como fuente a "Datacraft - tu revista digital", con
un link correspondiente a http://www.datacraft.com.ar/ Para
mayor información, contáctenos a info@datacraft.com.ar
con el asunto "incluir articulos" |
El comportamiento de Google, de sus criterios
de evaluación, y del funcionamiento de su robot Googlebot es
imprevisible. Esa es una realidad incuestionable porque parte de una
premisa lógica : uno puede asumir ciertas cosas basadas
en la observación, pero si no dispone de la fórmula
original de algo, lo único que hace es adivinar. Así
como si observando una vaso lleno de Coca Cola, pudiéramos
deducir la fórmula que compone el refresco ... y todas sus
propiedades. Intentar "comprender"
a Google ha resultado, cada vez, más complejo, y especialmente
si no conocemos los criterios que manejan sus algoritmos. Mientras
que hace unos años, sólo bastaba construir sitios
con un código html limpio, y anotarlo en la mayor cantidad
de buscadores, hoy en día la situación es bastante
más complicada. Nuevos criterios implementados por el buscador
más grande de la Tierra rozan entre lo lógico y el
mero capricho, y foros dedicados a la estrategia de optimización
para buscadores (SEO) explotan en discusiones y acalorados debates
sobre qué quiso decir / qué se interpreta del último
cambio de políticas de Google. Cual dios pagano, al cual
todos rinden homenaje, y del cual todos intentan descifrar mensajes
no siempre claros.
Pero lo cierto es, que Google está
actuando de modo diferente, y está dando señales de
límites en algunas capacidades. ¿Es realmente una
incapacidad tecnológica de seguir devorando información,
o se trata de un criterio concienzudamente implementado ?. Lo veremos
a lo largo de esta nota.
Algunos de los cambios
: el PageRank
Si hay algo que enciende pasiones, es la
puntuación que Google asigna a nuestros web sites, y que
es visible a través de su barra de herramientas agregada
al Internet Explorer (Google Toolbar), llamado PageRank.
En un principio el PageRank indicaba la cantidad
de sitios que nos enlazaban (buscadores, otros sitios, etc). Pero
ahora la interpretación es mucho más compleja. Sitios
con pocos enlaces pueden tener un PR más alto que otros sitios
anotados en miles de otras webs. Establecer un PR para Google, es
una mezcla entre cantidad de enlaces, cantidad de material (texto)
original, óptima construcción de la página,
densidad o frecuencia de palabras que Google considere importantes...
y un largo etc. Un sitio con PR 5 puede figurar mejor en resultados
que un sitio con PR 6, y cosas así.
Pero del PageRank se desprenden algunas conclusiones
interesantes : una, es que Google nos valora de acuerdo a una
serie de criterios - y como es obvio, comparado con otras paginas
webs, estaremos mejores o peores en uno u otro sentido, de enlaces,
palabras, etc. - y nos dá un número que es totalmente
relativo. Ese número nos dá un ranking y nos aproxima
o aleja entre los sitios más populares de la Tierra y las
webs que recien empiezan. Y, cuando la cantidad de sitios webs
a nivel mundial crece, el PR disminuye, a pasos lentos, por una
cuestión de agregar cada vez más criterios para determinar
el PR. Digamoslo así : Google es un concurso de belleza,
y premia a los mejores con la corona y los cargos de princesa. Es
fácil elegir reina y princesas en 10 concursantes ... pero
cómo hacer con millones ?. Por eso, si usted tenía
PR 6 el año pasado, es posible que este año tenga
un PR 5, aun cuando no haya hecho nada malo. Su sitio no es menos
popular, sino que Google tiene cada vez mas criterios. Quizás
en ese sentido, el PR sea algo pasado de moda, y debería
darse una escala, no de uno a diez, sino de uno a la infinitésima,
tal como hace Alexa, que es algo más concreto. P.ej., si
Datacraft tiene un puesto 210.000 según Alexa, significa
que en todo el mundo hay 209.999 sitios más populares que
nuestro portal.
Pero, en segundo lugar, el PR y cómo
monitorearlo, comienza a dar muestra de una tendencia de Google
: usted sólo sabe su PR vía barra Google. El usuario
común no sabe esto, lo sabe el webmaster. O sea que Google
comienza a dar señales a los webmasters para que entiendan
algunos de sus criterios y, especialmente, para facilitar su trabajo.
Si Google nos está hablando en chino, es para que quienes
hablamos chino entendamos lo que dice. Y nos da guías, especialmente
para quienes somos webmasters profesionales, para despegar nuestros
sitios de la gigantesca masa de webs amateurs. O sea, Google nos
habla para que mejoremos y nos destaquemos, ya que - al parecer
- , él solo no puede hacerlo.
La base de este criterio es muy simple :
evitar la lotería, los resultados por azar. En los
´90 no era difícil armar una web básica y competir
(hasta inconscientemente, sin propósito) en primeros lugares
en resultados. Ahora Google busca que los primeros lugares los tomen
quienes hacen bien los deberes. O sea, quienes estudian las directivas,
y tienen buenos instintos para sufrir las olas de las Google Dance.
Otro de los cambios
: la captura de sitios
Mientras que hasta no hace mucho, Google
no daba importancia a los meta tag de descripción de páginas
(mostraba capturas parciales de texto en resultados), ahora muestra
indefectiblemente la etiqueta meta de descripción. Igual
memoriza parte de los textos (hasta 100 kb por página). ¿Significa
que Google se ha puesto más ordenado, o son señales
de limitación de su capacidad ?
Pero hay mas datos sobre el tema de la captura
: si usted es webmasters y usa estadísticas en su sitio,
habrá podido descifrar cuándo es que lo visite Googlebot,
el robot del buscador, para capturar su web. Las visitas se han
hecho cada vez más espaciadas, e incluso se notan que ciertas
visitas, a pesar de incluir material nuevo, no capturan nada. Aparentemente,
si el material incluido no es original, Google lo está descartando
de plano, mientras que antes lo capturaba directamente, aunque lo
posicionaba muy bajo en resultados. Por ejemplo, muchos portales
que repiten palabra por palabra una noticia o texto, figuraban todos,
y el creador de la nota original (bah, el primero capturado), en
primer lugar, siguiendo sus "clones" ubicados entre otros
criterios, por su PR. Hoy Google es mucho más selectivo,
y no se satura de material clonado.
Pero quizás el dato más interesante
de todo esto, es que Google ha comenzado a limitar la navegación
interna de su sitio. Por ejemplo, si su web tiene un PR 5, quizás
no capture más de 450 páginas. Y todas ellas no estarán
completas, sino verá que las que figuran al final (cuando
empieza a investigar en "más páginas de este
sitio"), tienen descripción / contenido vacío
(y eso que estuvieron bien capturadas hace bastante tiempo). ¿Que
esto es ilógico ?. ¿Que usted conoce webs con miles
de páginas capturadas - por ejemplo, los foros - ?. Pronto
veremos que no es tan así.
El PR para algo sirve. Y, entre otras cosas,
para ser un criterio interno de Google, para limitar su cantidad
de información a procesar de un sitio web. Si usted tiene
un PR 1 y un foro con 900 páginas, olvídese que Google
capture las 900 páginas. Tal como dijimos antes, el PR tiene
su peso para varias decisiones que toma el robot, y especialmente
para diferenciar entre quienes hacen los suyo con dedicación
y limpieza, y quienes lo hacen a la marchanta. De algún
modo, un mecanismo no humano como un spider de Internet debe diferenciar
entre información valiosa y pura basura, y fundamentalmente,
cómo evitar saturarse con información no útil.
Para diferenciar aficionados y profesionales,
Google ha comenzado a implementar - en plan beta - un mecanismo
llamado Sitemaps. Si bien hasta ahora era usual que los webmasters
construyeran una página con todos los links de su web en
la misma (para que Google lo usara y navegara todo el contenido),
ahora el popular buscador busca implementar algo similar... pero
sin toparse con su propio límite de 100 kb capturados por
página web, y armado de un modo algo más complejo,
que posiblemente no está al alcance de cualquiera.
Los Sitemaps es el tradicional mapa del
sitio (con todos los enlaces), pero armado en XML, puesto en una
página aparte - no pública - , e informada directamente
a Google a través de su sección, que puede encontrarse
en https://www.google.com/webmasters/sitemaps/login(precisa
obtener una cuenta gratuita Google previamente). Un mapa del web
site puede hacerse en XML sin muchas complicaciones y casi automáticamente
mediante scripts PHP que se obtienen en la web. Nosotros
incluímos uno, que puede descargar (formato RAR) haciendo
click aqui. Una vez que suba los archivos, les de la propiedad
666 mediante su software de FTP y lo ejecute, le generará
un archivo sitemap.xml que deberá informar a Google.
Mediante los Sitemaps en XML, uno
habla más directamente con Google, pidiendo que nos visite
nuestra página. Y que navegue la totalidad de ella. Cada
vez que incorporemos una novedad, deberemos correr nuevamente el
script PHP e informarlo a Google para que envíe su robot.
Este nos navegará en totalidad y capturará en un tiempo
algo menor a lo normal (o lo que era habitual hasta hace unos años).
De todo esto pueden obtenerse algunas conclusiones
interesantes :
1 - que el PR y otros parámetros
de Google no son solo puntuaciones para nosotros, sino que Google
mismo le da importancia para establecer, por ejemplo, la frecuencia
de visitas y la cantidad de paginas a capturar
2 - que Google está llegando a
un nivel de saturación en aspectos físicos y de programación.
Las simples sentencias lógicas de su robot ya no bastan para
establecer primeros puestos, y nos pide ayuda con la colaboración
de quienes somos webmasters, para cumplir ciertas reglas y criterios
que Google establece para especialistas, y comenzar a diferenciar
/ calificar entre sitios webs, y posicionar. Es tan grande la masa
de webs "primerizas", que precisa que los humanos hagan
méritos siguiendo sus directivas, para posicionar mejor a
los sitios "Google approved".
3 - y lo que resulta más alarmante
de todo, mencionado en estos últimos párrafos, es
que todas estas son muestras de que Google está llegando
a un límite de capacidad. Capacidad física es lo de
menos, se soluciona con más servidores. Pero acá se
trata de capacidad de calificación, y de la inmensidad de
información nueva que surge día a día, que
no puede ser recorrida de modo eficiente en tiempo y espacio. Capturar
nuevas webs lo sigue haciendo... pero quizás de un modo no
tan eficiente como antes, o no dándole el valor que corresponde.
Al establecer criterios extra, que sólo cumplirán
algunos entre muchos, le ayuda a organizar su trabajo, y posiblemente
a premiar a los cumplidores. Si bien es un criterio de calidad y
cooperación, lo cierto es que lo que muestra, es que el límite
de lo infinito está más cerca de lo que habíamos
pensado. |