|
¿Sabía que Google no sólo
es capaz de realizar búsquedas de páginas web e imágenes
sino que además ofrece una gran cantidad de servicios desconocidos?
Podemos encontrar desde un buscador de noticias en tiempo real hasta
un equipo de investigadores para resolver personalmente nuestras consultas,
pasando por buscadores de productos en tiendas virtuales y de catálogos
impresos. Internet no sería
lo mismo sin Google. El proyecto que comenzaron dos jóvenes
estudiantes de la Universidad de Stanford está revolucionando
la forma de usar Internet. Pero Larry Page y Sergey Brin no sólo
han creado el mejor buscador de páginas web, algo que ya
nadie discute, sino que el proyecto es mucho más ambicioso.
Bajo una página principal de apenas 5 KB se esconden docenas
de servicios y nuevos proyectos.
Google fue fundado en 1998. Han sido 4 años
de innovaciones continuas y, sin embargo, sus creadores afirman
que todavía están en la fase inicial del proyecto.
La clave del éxito: los algoritmos de ordenación.
La filosofía: exponer los resultados de forma sencilla, útil
y eficiente. Todos los servicios de Google funcionan sin intervención
humana, desde la clasificación de páginas hasta la
inserción de publicidad.
Complejos algoritmos con capacidades de inteligencia
artificial posibilitan la clasificación de información
más rápida y eficientemente que pudiera hacerlo un
equipo de cientos de personas. Por ejemplo: el nuevo servicio de
clasificación de noticias muestra siempre las últimas
noticias que se han producido en el mundo. Estas noticias son extraídas
de miles de fuentes y clasificadas automáticamente. La información
se renueva con una periodicidad de minutos. ¿Cuántas
personas harían falta para hacer un trabajo tan minucioso?
Probablemente fuese inviable.
Buscador de páginas web
Página: http://www.google.com/
Versión en español: www.google.com/intl/es
Es el servicio original de Google y, habitualmente,
el único que los usuarios conocen. Los resultados de las
búsquedas se devuelven clasificados por orden de relevancia,
establecida mediante el índice PageRank. Este indicador patentado
es el corazón de Google: una página es más
importante que otra si tiene un mayor número de enlaces que
apunten a ella. Las páginas de alta calidad serán
enlazadas por otras muchas páginas y esto generará
un mayor PageRank que, combinado con otros factores, asegura que
las páginas más próximas a nuestra búsqueda
se sitúen en primer lugar.
Aunque el índice PageRank ha demostrado
ser la forma más objetiva de clasificación de páginas,
algunos usuarios han buscado la forma de alterar a su gusto los
resultados de Google: si docenas o cientos de webmasters se pusieran
de acuerdo para situar un enlace en sus respectivas páginas
a un mismo sitio y asociarle una serie de palabras clave, los algoritmos
de Google terminarían ofreciendo la dirección del
enlace como resultado de las palabras de búsqueda. Esta forma
de alterar malintencionadamente los resultados de las búsquedas,
bautizada como Google bombing, fue utilizada en octubre de 2002
para forzar que la búsqueda de las palabras "Go to hell"
ofreciera el web de Microsoft como primer resultado.
Buscador de imágenes
Página: images.google.com
Disponible versión en español
Se pueden buscar imágenes relacionadas
con un determinado tema. Google devolverá un listado de imágenes
en miniatura ordenado por orden de importancia. Para la clasificación
de las imágenes se utiliza el texto que las rodea en la página
original. Estas imágenes en miniatura suelen ocupar menos
de 5 KB cada una y son las únicas que Google almacena en
sus servidores. Si hacemos clic en alguna de ellas se abrirá
la página original donde podremos ver la imagen a tamaño
completo dentro de su contexto.
Grupos de noticias
Página: groups.google.com
Disponible versión en español
Los grupos de noticias Usenet siempre han
sido los grandes desconocidos de Internet debido a que para acceder
a ellos se requería la configuración de un programa
específico y un servidor de news. Pero gracias a Google es
posible el acceso por página web a la enorme base de datos
de mensajes publicados en Usenet. También se permite la publicación
de nuevos mensajes. El servicio, desarrollado originalmente por
Deja.com, fue adquirido por Google en febrero de 2001.
El mensaje más antiguo que se puede
encontrar en el archivo de mensajes está fechado en mayo
del año 1981, año en el que una compañía
llamada Microsoft se daba a conocer por el lanzamiento del sistema
operativo MS-DOS. El archivo completo incluye más de 20 años
de historia. Podemos encontrar mensajes históricos como el
de un joven llamado Linus Torvalds anunciando que había desarrollado
una versión gratuita de apariencia similar a Minix (sistema
operativo creado por el profesor Tanenbaum con fines educativos)
o el famoso debate entre profesor y estudiante acerca de Linux:
"escribir un nuevo sistema operativo sólo para el 386
en 1991 te lleva a obtener tu segundo suspenso para este trimestre.
Pero si el examen final lo haces realmente bien, todavía
puedes aprobar el curso", le dijo Tanenbaum al creador de Linux.
El potente buscador de mensajes es una herramienta
complementaria a la búsqueda de páginas web. Frecuentemente
se encuentra en mensajes información que no está disponible
en ninguna página web. Por ejemplo, reportes de usuarios
acerca de problemas técnicos sobre combinaciones específicas
de hardware y software. También es muy útil para conocer
distintas opiniones sobre un tema o producto concreto.
Corrección de errores
En realidad no es un servicio establecido
como tal en Google, pero es tan útil que merece la pena dedicarle
un apartado. Por ejemplo, suponga que no está seguro de si
la palabra "Washinton" está bien escrita. Basta
hacer una búsqueda de la palabra dudosa y Google nos indicará
la palabra correcta: "Washington". Esta característica
no se basa en un corrector ortográfico sino que parte del
supuesto de que las palabras bien escritas aparecerán más
veces en la web que las incorrectas. La gran velocidad de respuesta
de Google probablemente nos resuelva dudas ortográficas en
un menor tiempo que una consulta a un diccionario o enciclopedia.
Aunque no debemos olvidar el método de funcionamiento de
esta característica para interpretar correctamente la validez
de los resultados
La capacidad de enmienda automática
de errores está patente incluso en el propio nombre de dominio
de Google. ¿A dónde iremos si escribimos http://www.gogle.com/,
http://www.gooogle.com/ o http://www.googel.com/? Pruébelo
y comprobará que Google ha adquirido nombres de dominio similares
para que usuarios despistados sigan llegando al popular buscador.
Configuraciones regionales y traducciones
Página: www.google.com/language_tools?hl=es
Disponible lengua española
Versión beta
Google es un proyecto que pretende ofrecer
a toda la comunidad internacional una web ordenada y accesible.
El esfuerzo para hacer Google cercano a distintas comunidades de
usuarios se observa accediendo a las versiones específicas
del buscador para países como Japón e Israel. También
se pueden encontrar versiones para sitios más exóticos
como Islas Vírgenes o Micronesia.
La interfaz de Google se puede mostrar en
más de 80 idiomas distintos (para español es http://www.google.com/intl/es),
algunos de ellos tan curiosos como el Klingon (la lengua de Star
Trek), el Elmer Fudd (el gruñón de los Looney Tunes)
o el Bork Bork Bork (la jerga que habla el cocinero sueco de los
Muppets). ). Otro "idioma" curioso es el hacker, que fue
el origen de un bulo que circuló por Internet alertando de
una supuesta intrusión en el popular sitio cuando, en realidad,
se trata de una funcionalidad fruto del gran sentido del humor de
sus creadores. Las traducciones están realizadas por voluntarios,
coordinados por la empresa, que pasan a formar parte de proyectos
de traducción.
Pero no sólo se traduce la interfaz
de Google, también se ofrece la posibilidad de traducir textos
o páginas web completas.
Directorio
Página: directory.google.com
Disponible versión en español
Los buscadores se pueden clasificar en
motores de búsqueda (indexación automática),
índices (un grupo de personas clasifican las páginas
en categorías) y metabuscadores (buscador que utiliza otros
buscadores). Google ha pertenecido siempre al primer grupo, aunque
con la inclusión del directorio, ahora también al
segundo. Sin embargo, no cabe en la filosofía de Google tener
un grupo de empleados realizando las tareas de clasificación
(como es el caso de http://www.yahoo.com/).
¿Cómo funciona entonces
el directorio de Google? Muy sencillo: se basa en Dmoz.org, un proyecto
abierto gestionado por Netscape para la ordenación de la
web por voluntarios. Al contrario que otros buscadores que venden
las primeras posiciones de cada categoría, el directorio
de Google ordena las páginas objetivamente, según
su índice PageRank. De esta forma se combina la selección
humana de páginas con los algoritmos automáticos de
Google.
Froogle: buscador de productos en tiendas
virtuales
Página: http://www.froogle.com/ o
froogle.google.com
Versión en español: no disponible
Versión beta
El último servicio ofrecido por la
compañía es Froogle. Permite encontrar productos que
se estén vendiendo actualmente en tiendas virtuales. Froogle
extrae automáticamente el nombre del producto, una fotografía,
precio y descripción. Permite navegar por un directorio de
categorías de productos o realizar búsquedas directas.
Los resultados de las búsquedas están clasificados
por importancia según los algoritmos de Google. Una vez que
hemos realizado una búsqueda, podemos acotar los resultados
indicando un precio mínimo y uno máximo. Actualmente
Froogle trabaja únicamente con dólares.
Por ejemplo, podemos obtener un listado de
cámaras digitales de menos de 300 dólares o también
un listado de las tiendas virtuales que ofrecen la cámara
Canon PowerShot G2.
Noticias clasificadas
Página: news.google.com
Versión en español: no disponible
Versión beta
Si Froogle se especializa en productos de
tiendas virtuales, Google News clasifica la información de
la prensa digital. Cada uno de estos dos servicios contempla partes
específicas del web, aunque no se limitan a realizar búsquedas
sino que aportan un verdadero valor añadido. El caso de Google
News es la prueba de cómo una idea sencilla puede ser utilizada
para obtener resultados espectaculares. La primera impresión
que obtenemos es que Google entiende lo que dicen los titulares.
Las noticias son extraídas automáticamente
de miles de fuentes, clasificadas en categorías y relacionadas
entre sí. Además se muestra una imagen de cada noticia
destacada. Las mismas noticias en distintos medios aparecen juntas,
bajo el titular del medio más destacado. En ocasiones el
número de fuentes que tratan el mismo tema puede ser de varios
cientos. La información se renueva cada pocos minutos, generándose
las portadas de las secciones sin intervención humana alguna.
Google News es todavía un producto
en fase beta. Sería interesante que en un futuro se incluyesen
secciones de noticias por países, así como que se
habilitasen más idiomas. Esto nos permitiría ver exclusivamente
las noticias de ámbito nacional en nuestro propio idioma.
Es más: si este servicio se combinara con la traducción
de textos sería posible relacionar automáticamente
una noticia nacional en nuestro idioma con la misma noticia tratada
en medios internacionales.
Por último, otra característica
interesante de Google News es la creación de trazas por fechas
de todas las noticias que se han publicado sobre un mismo tema.
Catálogos
Página: catalogs.google.com
Versión en español: no disponible
Versión beta
Google Catalogs clasifica los catálogos
comerciales en papel que las tiendas envían por correo postal.
Es un servicio completamente distinto a todos los demás ofrecidos
por Google: no clasifica información digital publicada en
Internet como el resto de servicios, sino que clasifica documentos
en papel. La aplicación de la tecnología para la clasificación
de documentos a catálogos de venta por correo es sólo
una pequeña muestra de su verdadero potencial.
Google Catalogs ofrece una dirección
de correo postal para que los comerciantes la añadan a la
lista de distribución de sus catálogos con precios.
Estos catálogos son digitalizados y convertidos a texto para
permitir búsquedas. Por una vez sí es necesaria la
intervención humana, al menos para recoger los catálogos
del correo y situarlos en el escáner, porque entendemos que
el resto del proceso está completamente automatizado.
La novedad del sistema es que los textos
buscados aparecen resaltados en el catálogo original (una
imagen) no en la versión de texto, que permanece invisible
para el usuario. El resaltado de textos en la versión textual
del documento ya fue utilizada con los archivos de Adobe Acrobat,
en los cuales Google únicamente almacena la versión
convertida. Sin embargo, en este caso se almacena tanto la imagen
como su conversión a texto.
La búsqueda se realiza en las versiones
de texto, aunque se muestra la imagen asociada. En el momento de
mostrar la imagen, Google la transforma para recuadrar el texto
que estamos buscando. Pero, ¿cómo sabe en qué
posición debe hacer el recuadro? Esto sería posible
haciendo de nuevo un OCR a la imagen, aunque lo más probable
es que la versión textual, creada al incluir el catálogo
a la base de datos, almacene las coordenadas dentro de la imagen
donde está situada cada palabra.
Puede probar Google Catalogs haciendo una
búsqueda, por ejemplo, de catálogos de juguetes.
Investigación de consultas
Página: answers.google.com
Versión en español: no disponible
Versión beta
Mediante Google Answers podemos formular
preguntas a investigadores especializados que tratarán de
ofrecernos la mejor respuesta, realizando búsquedas por Internet
u otros medios. Es el único servicio (aparte de la publicidad
y soluciones profesionales) que tiene un coste para el usuario final.
¿Cuánto vale formular una pregunta? Lo que el usuario
estime que vale la respuesta, desde un mínimo de 2 dólares
hasta un máximo de 200 dólares. Debido a que los investigadores
deciden las respuestas que desean responder, darán prioridad
a aquellas que tengan un precio mayor. Los investigadores son consultores
independientes que reciben el 75% del precio que el usuario abona.
Una vez que el experto decide investigar una pregunta, ésta
queda bloqueada para otros investigadores y así evitar que
se superpongan sus trabajos (durante un máximo de 2 horas).
La satisfacción del usuario está
garantizada: si no está conforme con la respuesta recibida
puede dar una puntuación baja al investigador o bien, solicitar
la devolución de su dinero justificando adecuadamente el
motivo. Aquellos investigadores cuya media de puntuaciones caiga
por debajo de un mínimo establecido serán excluido
del equipo de investigadores de Google.
Las preguntas ya respondidas quedan publicadas
por categorías en Google Answers y se pueden consultar libremente.
Actualmente el cupo de investigadores está
cubierto, aunque en un futuro es probable que se acepten solicitudes.
Los candidatos deben superar un cuestionario de evaluación
como requisito para incorporarse al equipo. A partir de este momento,
deben cuidar que los usuarios estén satisfechos con las preguntas
respondidas.
Todos los detalles de Google Answers están
cuidados al máximo, generando beneficios tanto para usuarios,
investigadores como para Google. La mayor parte de las consultas
son respondidas satisfactoriamente en apenas unas horas.
¿Qué se cocina en Google?
En el laboratorio de Google podemos encontrar
nuevos proyectos con un desarrollo muy avanzado. Por ejemplo, un
buscador de definiciones de términos (Google Glossary), un
generador de términos relacionados indicando al menos dos
del conjunto (Google Sets) y un buscador de referencias o explicaciones
del sitio que estamos buscando en otros sitios (Google WebQuotes).
Los proyectos de Google Labs pueden evolucionar a una versión
beta y posteriormente, a una versión final. En el momento
en que lea estas líneas puede que los proyectos abiertos
sean distintos y por lo tanto no funcione algún enlace.
Veamos algunos ejemplos de utilización
de los tres proyectos anteriores. Con Google Glossary podemos buscar
la definición de las siglas XML o de la palabra sniffer.
Ahora vamos a utilizar Google Sets para obtener marcas de automóviles,
ofreciendo como muestra del conjunto los términos "Audi"
y "Renault". Finalmente, queremos encontrar comentarios
de lo que dicen otros sitios sobre tutoriales de HTML.
¿Pero estos chicos no van a parar?
Parece que no y es que en Google están
dispuestos a continuar revolucionando la búsqueda de información
desde todos los frentes sin conformarse con su situación
actual de liderazgo. Mostrar la información de forma clara,
ordenada y accesible es su objetivo. Y la información no
tiene fin. Después de conocer Google Catalogs tenemos la
sensación de que Internet parece insuficiente para Google.
Puede que más adelante se decidan por clasificar otro tipo
de documentos escritos o incluso, información multimedia
como sonidos o vídeos. Desde luego, esto es sólo el
principio pero los comienzos no pueden haber sido más acertados. |