|
¿Sabía que Google no sólo es capaz
de realizar búsquedas de páginas web e imágenes
sino que además ofrece una gran cantidad de servicios
desconocidos? Podemos encontrar desde un buscador de noticias
en tiempo real hasta un equipo de investigadores para
resolver personalmente nuestras consultas, pasando por
buscadores de productos en tiendas virtuales y de catálogos
impresos.
Internet no sería lo mismo sin Google. El proyecto
que comenzaron dos jóvenes estudiantes de la
Universidad de Stanford está revolucionando la
forma de usar Internet. Pero Larry Page y Sergey Brin
no sólo han creado el mejor buscador de páginas
web, algo que ya nadie discute, sino que el proyecto
es mucho más ambicioso. Bajo una página
principal de apenas 5 KB se esconden docenas de servicios
y nuevos proyectos.
Google fue fundado en 1998. Han sido 4 años
de innovaciones continuas y, sin embargo, sus creadores
afirman que todavía están en la fase inicial
del proyecto. La clave del éxito: los algoritmos
de ordenación. La filosofía: exponer los
resultados de forma sencilla, útil y eficiente.
Todos los servicios de Google funcionan sin intervención
humana, desde la clasificación de páginas
hasta la inserción de publicidad.
Complejos algoritmos con capacidades de inteligencia
artificial posibilitan la clasificación de información
más rápida y eficientemente que pudiera
hacerlo un equipo de cientos de personas. Por ejemplo:
el nuevo servicio de clasificación de noticias
muestra siempre las últimas noticias que se han
producido en el mundo. Estas noticias son extraídas
de miles de fuentes y clasificadas automáticamente.
La información se renueva con una periodicidad
de minutos. ¿Cuántas personas harían
falta para hacer un trabajo tan minucioso? Probablemente
fuese inviable.
Buscador de páginas web
Página: http://www.google.com/
Versión en español: www.google.com/intl/es
Es el servicio original de Google y, habitualmente,
el único que los usuarios conocen. Los resultados
de las búsquedas se devuelven clasificados por
orden de relevancia, establecida mediante el índice
PageRank. Este indicador patentado es el corazón
de Google: una página es más importante
que otra si tiene un mayor número de enlaces
que apunten a ella. Las páginas de alta calidad
serán enlazadas por otras muchas páginas
y esto generará un mayor PageRank que, combinado
con otros factores, asegura que las páginas más
próximas a nuestra búsqueda se sitúen
en primer lugar.
Aunque el índice PageRank ha demostrado ser
la forma más objetiva de clasificación
de páginas, algunos usuarios han buscado la forma
de alterar a su gusto los resultados de Google: si docenas
o cientos de webmasters se pusieran de acuerdo para
situar un enlace en sus respectivas páginas a
un mismo sitio y asociarle una serie de palabras clave,
los algoritmos de Google terminarían ofreciendo
la dirección del enlace como resultado de las
palabras de búsqueda. Esta forma de alterar malintencionadamente
los resultados de las búsquedas, bautizada como
Google bombing, fue utilizada en octubre de 2002 para
forzar que la búsqueda de las palabras "Go
to hell" ofreciera el web de Microsoft como primer
resultado.
Buscador de imágenes
Página: images.google.com
Disponible versión en español
Se pueden buscar imágenes relacionadas con un
determinado tema. Google devolverá un listado
de imágenes en miniatura ordenado por orden de
importancia. Para la clasificación de las imágenes
se utiliza el texto que las rodea en la página
original. Estas imágenes en miniatura suelen
ocupar menos de 5 KB cada una y son las únicas
que Google almacena en sus servidores. Si hacemos clic
en alguna de ellas se abrirá la página
original donde podremos ver la imagen a tamaño
completo dentro de su contexto.
Grupos de noticias
Página: groups.google.com
Disponible versión en español
Los grupos de noticias Usenet siempre han sido los
grandes desconocidos de Internet debido a que para acceder
a ellos se requería la configuración de
un programa específico y un servidor de news.
Pero gracias a Google es posible el acceso por página
web a la enorme base de datos de mensajes publicados
en Usenet. También se permite la publicación
de nuevos mensajes. El servicio, desarrollado originalmente
por Deja.com, fue adquirido por Google en febrero de
2001.
El mensaje más antiguo que se puede encontrar
en el archivo de mensajes está fechado en mayo
del año 1981, año en el que una compañía
llamada Microsoft se daba a conocer por el lanzamiento
del sistema operativo MS-DOS. El archivo completo incluye
más de 20 años de historia. Podemos encontrar
mensajes históricos como el de un joven llamado
Linus Torvalds anunciando que había desarrollado
una versión gratuita de apariencia similar a
Minix (sistema operativo creado por el profesor Tanenbaum
con fines educativos) o el famoso debate entre profesor
y estudiante acerca de Linux: "escribir un nuevo
sistema operativo sólo para el 386 en 1991 te
lleva a obtener tu segundo suspenso para este trimestre.
Pero si el examen final lo haces realmente bien, todavía
puedes aprobar el curso", le dijo Tanenbaum al
creador de Linux.
El potente buscador de mensajes es una herramienta
complementaria a la búsqueda de páginas
web. Frecuentemente se encuentra en mensajes información
que no está disponible en ninguna página
web. Por ejemplo, reportes de usuarios acerca de problemas
técnicos sobre combinaciones específicas
de hardware y software. También es muy útil
para conocer distintas opiniones sobre un tema o producto
concreto.
Corrección de errores
En realidad no es un servicio establecido como tal
en Google, pero es tan útil que merece la pena
dedicarle un apartado. Por ejemplo, suponga que no está
seguro de si la palabra "Washinton" está
bien escrita. Basta hacer una búsqueda de la
palabra dudosa y Google nos indicará la palabra
correcta: "Washington". Esta característica
no se basa en un corrector ortográfico sino que
parte del supuesto de que las palabras bien escritas
aparecerán más veces en la web que las
incorrectas. La gran velocidad de respuesta de Google
probablemente nos resuelva dudas ortográficas
en un menor tiempo que una consulta a un diccionario
o enciclopedia. Aunque no debemos olvidar el método
de funcionamiento de esta característica para
interpretar correctamente la validez de los resultados
La capacidad de enmienda automática de errores
está patente incluso en el propio nombre de dominio
de Google. ¿A dónde iremos si escribimos
http://www.gogle.com/, http://www.gooogle.com/ o http://www.googel.com/?
Pruébelo y comprobará que Google ha adquirido
nombres de dominio similares para que usuarios despistados
sigan llegando al popular buscador.
Configuraciones regionales y traducciones
Página: www.google.com/language_tools?hl=es
Disponible lengua española
Versión beta
Google es un proyecto que pretende ofrecer a toda la
comunidad internacional una web ordenada y accesible.
El esfuerzo para hacer Google cercano a distintas comunidades
de usuarios se observa accediendo a las versiones específicas
del buscador para países como Japón e
Israel. También se pueden encontrar versiones
para sitios más exóticos como Islas Vírgenes
o Micronesia.
La interfaz de Google se puede mostrar en más
de 80 idiomas distintos (para español es http://www.google.com/intl/es),
algunos de ellos tan curiosos como el Klingon (la lengua
de Star Trek), el Elmer Fudd (el gruñón
de los Looney Tunes) o el Bork Bork Bork (la jerga que
habla el cocinero sueco de los Muppets). ). Otro "idioma"
curioso es el hacker, que fue el origen de un bulo que
circuló por Internet alertando de una supuesta
intrusión en el popular sitio cuando, en realidad,
se trata de una funcionalidad fruto del gran sentido
del humor de sus creadores. Las traducciones están
realizadas por voluntarios, coordinados por la empresa,
que pasan a formar parte de proyectos de traducción.
Pero no sólo se traduce la interfaz de Google,
también se ofrece la posibilidad de traducir
textos o páginas web completas.
Directorio
Página: directory.google.com
Disponible versión en español
Los buscadores se pueden clasificar en motores de búsqueda
(indexación automática), índices
(un grupo de personas clasifican las páginas
en categorías) y metabuscadores (buscador que
utiliza otros buscadores). Google ha pertenecido siempre
al primer grupo, aunque con la inclusión del
directorio, ahora también al segundo. Sin embargo,
no cabe en la filosofía de Google tener un grupo
de empleados realizando las tareas de clasificación
(como es el caso de http://www.yahoo.com/).
¿Cómo funciona entonces el directorio
de Google? Muy sencillo: se basa en Dmoz.org, un proyecto
abierto gestionado por Netscape para la ordenación
de la web por voluntarios. Al contrario que otros buscadores
que venden las primeras posiciones de cada categoría,
el directorio de Google ordena las páginas objetivamente,
según su índice PageRank. De esta forma
se combina la selección humana de páginas
con los algoritmos automáticos de Google.
Froogle: buscador de productos en tiendas virtuales
Página: http://www.froogle.com/ o froogle.google.com
Versión en español: no disponible
Versión beta
El último servicio ofrecido por la compañía
es Froogle. Permite encontrar productos que se estén
vendiendo actualmente en tiendas virtuales. Froogle
extrae automáticamente el nombre del producto,
una fotografía, precio y descripción.
Permite navegar por un directorio de categorías
de productos o realizar búsquedas directas. Los
resultados de las búsquedas están clasificados
por importancia según los algoritmos de Google.
Una vez que hemos realizado una búsqueda, podemos
acotar los resultados indicando un precio mínimo
y uno máximo. Actualmente Froogle trabaja únicamente
con dólares.
Por ejemplo, podemos obtener un listado de cámaras
digitales de menos de 300 dólares o también
un listado de las tiendas virtuales que ofrecen la cámara
Canon PowerShot G2.
Noticias clasificadas
Página: news.google.com
Versión en español: no disponible
Versión beta
Si Froogle se especializa en productos de tiendas virtuales,
Google News clasifica la información de la prensa
digital. Cada uno de estos dos servicios contempla partes
específicas del web, aunque no se limitan a realizar
búsquedas sino que aportan un verdadero valor añadido.
El caso de Google News es la prueba de cómo una
idea sencilla puede ser utilizada para obtener resultados
espectaculares. La primera impresión que obtenemos
es que Google entiende lo que dicen los titulares.
Las noticias son extraídas automáticamente
de miles de fuentes, clasificadas en categorías
y relacionadas entre sí. Además se muestra
una imagen de cada noticia destacada. Las mismas noticias
en distintos medios aparecen juntas, bajo el titular
del medio más destacado. En ocasiones el número
de fuentes que tratan el mismo tema puede ser de varios
cientos. La información se renueva cada pocos
minutos, generándose las portadas de las secciones
sin intervención humana alguna.
Google News es todavía un producto en fase beta.
Sería interesante que en un futuro se incluyesen
secciones de noticias por países, así
como que se habilitasen más idiomas. Esto nos
permitiría ver exclusivamente las noticias de
ámbito nacional en nuestro propio idioma. Es
más: si este servicio se combinara con la traducción
de textos sería posible relacionar automáticamente
una noticia nacional en nuestro idioma con la misma
noticia tratada en medios internacionales.
Por último, otra característica interesante
de Google News es la creación de trazas por fechas
de todas las noticias que se han publicado sobre un
mismo tema.
Catálogos
Página: catalogs.google.com
Versión en español: no disponible
Versión beta
Google Catalogs clasifica los catálogos comerciales
en papel que las tiendas envían por correo postal.
Es un servicio completamente distinto a todos los demás
ofrecidos por Google: no clasifica información
digital publicada en Internet como el resto de servicios,
sino que clasifica documentos en papel. La aplicación
de la tecnología para la clasificación
de documentos a catálogos de venta por correo
es sólo una pequeña muestra de su verdadero
potencial.
Google Catalogs ofrece una dirección de correo
postal para que los comerciantes la añadan a
la lista de distribución de sus catálogos
con precios. Estos catálogos son digitalizados
y convertidos a texto para permitir búsquedas.
Por una vez sí es necesaria la intervención
humana, al menos para recoger los catálogos del
correo y situarlos en el escáner, porque entendemos
que el resto del proceso está completamente automatizado.
La novedad del sistema es que los textos buscados aparecen
resaltados en el catálogo original (una imagen)
no en la versión de texto, que permanece invisible
para el usuario. El resaltado de textos en la versión
textual del documento ya fue utilizada con los archivos
de Adobe Acrobat, en los cuales Google únicamente
almacena la versión convertida. Sin embargo,
en este caso se almacena tanto la imagen como su conversión
a texto.
La búsqueda se realiza en las versiones de texto,
aunque se muestra la imagen asociada. En el momento
de mostrar la imagen, Google la transforma para recuadrar
el texto que estamos buscando. Pero, ¿cómo
sabe en qué posición debe hacer el recuadro?
Esto sería posible haciendo de nuevo un OCR a
la imagen, aunque lo más probable es que la versión
textual, creada al incluir el catálogo a la base
de datos, almacene las coordenadas dentro de la imagen
donde está situada cada palabra.
Puede probar Google Catalogs haciendo una búsqueda,
por ejemplo, de catálogos de juguetes.
Investigación de consultas
Página: answers.google.com
Versión en español: no disponible
Versión beta
Mediante Google Answers podemos formular preguntas
a investigadores especializados que tratarán
de ofrecernos la mejor respuesta, realizando búsquedas
por Internet u otros medios. Es el único servicio
(aparte de la publicidad y soluciones profesionales)
que tiene un coste para el usuario final. ¿Cuánto
vale formular una pregunta? Lo que el usuario estime
que vale la respuesta, desde un mínimo de 2 dólares
hasta un máximo de 200 dólares. Debido
a que los investigadores deciden las respuestas que
desean responder, darán prioridad a aquellas
que tengan un precio mayor. Los investigadores son consultores
independientes que reciben el 75% del precio que el
usuario abona. Una vez que el experto decide investigar
una pregunta, ésta queda bloqueada para otros
investigadores y así evitar que se superpongan
sus trabajos (durante un máximo de 2 horas).
La satisfacción del usuario está garantizada:
si no está conforme con la respuesta recibida
puede dar una puntuación baja al investigador
o bien, solicitar la devolución de su dinero
justificando adecuadamente el motivo. Aquellos investigadores
cuya media de puntuaciones caiga por debajo de un mínimo
establecido serán excluido del equipo de investigadores
de Google.
Las preguntas ya respondidas quedan publicadas por
categorías en Google Answers y se pueden consultar
libremente.
Actualmente el cupo de investigadores está cubierto,
aunque en un futuro es probable que se acepten solicitudes.
Los candidatos deben superar un cuestionario de evaluación
como requisito para incorporarse al equipo. A partir
de este momento, deben cuidar que los usuarios estén
satisfechos con las preguntas respondidas.
Todos los detalles de Google Answers están cuidados
al máximo, generando beneficios tanto para usuarios,
investigadores como para Google. La mayor parte de las
consultas son respondidas satisfactoriamente en apenas
unas horas.
¿Qué se cocina en Google?
En el laboratorio de Google podemos encontrar nuevos
proyectos con un desarrollo muy avanzado. Por ejemplo,
un buscador de definiciones de términos (Google
Glossary), un generador de términos relacionados
indicando al menos dos del conjunto (Google Sets) y
un buscador de referencias o explicaciones del sitio
que estamos buscando en otros sitios (Google WebQuotes).
Los proyectos de Google Labs pueden evolucionar a una
versión beta y posteriormente, a una versión
final. En el momento en que lea estas líneas
puede que los proyectos abiertos sean distintos y por
lo tanto no funcione algún enlace.
Veamos algunos ejemplos de utilización de los
tres proyectos anteriores. Con Google Glossary podemos
buscar la definición de las siglas XML o de la
palabra sniffer. Ahora vamos a utilizar Google Sets
para obtener marcas de automóviles, ofreciendo
como muestra del conjunto los términos "Audi"
y "Renault". Finalmente, queremos encontrar
comentarios de lo que dicen otros sitios sobre tutoriales
de HTML.
¿Pero estos chicos no van a parar?
Parece que no y es que en Google están dispuestos
a continuar revolucionando la búsqueda de información
desde todos los frentes sin conformarse con su situación
actual de liderazgo. Mostrar la información de
forma clara, ordenada y accesible es su objetivo. Y
la información no tiene fin. Después de
conocer Google Catalogs tenemos la sensación
de que Internet parece insuficiente para Google. Puede
que más adelante se decidan por clasificar otro
tipo de documentos escritos o incluso, información
multimedia como sonidos o vídeos. Desde luego,
esto es sólo el principio pero los comienzos
no pueden haber sido más acertados. |