Information Retrieval (2): la información


Tal y como se describe muy bien en el libro "The Search" the John Battelle, la mayor parte de las acciones realizadas por el ser humano parten de un concepto tan sencillo como es "buscar". Para realizar documentos, preparar los planes del fin de semana, aprender un trabajo, hobby, ... necesitamos encontrar los elementos más importantes y claves que nos permitan optimizar nuestra tarea. ¿Qué películas echan este fin de semana? ¿Qué universidades en Madrid imparten la carrera de biblioteconomía? ¿Quién ha sido el ganador del último Tour de Francia -bueno, a estas horas, no está muy claro :) -?

El primer tema antes de plantearse qué significa buscar es qué estamos buscando y cómo se define: INFORMACIÓN

La Wikipedia define Información como:
"Information is the state of a system of interest (curiosity)."
y
"Information is a quality of a message that is sent from a sender to one or more receivers. Information is always about something (size of a parameter, occurrence of an event, ...)."

La RAE, por otra parte:
"Enterar, dar noticia de algo."

Es curioso lo difícil que es definir información, pero queda claro que la información proviene de un emisor, y que se refiere a algo.

Así que, es verdad que cuando buscamos, buscamos información. Buscamos que el sistema nos notifique algo de interés para nosotros. Esto nos lleva a la necesidad de diferenciar entre DATOS, INFORMACIÓN y CONOCIMIENTO.
  • DATOS: aunque el límite siempre es relativo, yo diría que los datos son la representación del conocimiento, sin contexto. De hecho, la información está conformada por datos, pero dispuestos de manera que cobran sentido.
  • CONOCIMIENTO: la representación de un problema-solución en la mente humana, a partir de información previa.
Un buscador web, al menos tal y como lo entendemos en la actualidad, utiliza datos para devolvernos (con suerte) información, a partir del cuál, con suerte, generemos conocimiento (algunos creo que nos quedamos muchas veces en los datos internos al conocimiento, sobre todo cuando llevas n horas currando :) ).

El desafío, por tanto, es cómo optimizar los datos a introducir que nos permita obtener la información más relevante en un contexto determinado que nos permita inferir mejor y más rápidamente el conocimiento que requerimos.

Obviamente, esto permite muchísimas interpretaciones, discusiones tanto tecnológicas como etimológicas, etc. Pero para lo que nos interesa -es decir, entender un poco cómo funcionan los sistemas actuales de búsqueda y hacia dónde pueden estar yendo-, creo que nos vale.

Comments