7/29/2006

Tengo un mes para evitar que esta tira se haga realidad...


Bueno, quizá estoy exagerando un poco, pero ... :)
Un poco más en serio, imagino que mi proceso de creación de una tesis doctoral no ha seguido los estándares más habituales. Primero, no he sido en ningún momento un estudiante de doctorado al uso, ni para bien ni para mal; desde que terminé la carrera he estado trabajando, compaginando primero mis cursos en la Autónoma (saliendo pronto del trabajo para llegar tarde a las clases durante dos años :) ). Después, buscando un tema de tesis en algunos de los proyectos en los que he trabajado (esa tolerancia a fallos en el nivel de red de sistemas de gestión TMN...). Posteriormente, en mi etapa de docencia universitaria, que es cuando por fin empecé el tema de tesis que finalmente voy a terminar, pillé dos años de altísima cantidad de trabajo en los que tuve que seguir sacando huecos los fines de semana. Y para terminar, mi vuelta a Denodo, donde pude avanzar más, principalmente debido a que el día a día tenía mucho que ver con mi tema, pero con el mismo tiempo libre, o menos. Donde más noté la diferencia fue cuando en mi defensa del D.E.A. Aparte de que no tenía absolutamente ningún tipo de nervios, mi presentación se resume básicamente en "esto es lo que pretendo hacer, lo tengo muy claro, tanto que ya llevo dos años trabajando en ello".

Ahora estoy ya en la recta final, una parte dura en la que me faltan fuerzas, me cunde poco o nada, e intento cumplir un hito autoimpuesto bastante complicado. Pero merecerá la pena.

Chulo, ¿no? :)

P.D. Por cierto que estos cómics reflejan increíblemente bien la vida académica. Para mí es el Dilbert de los doctorandos :)

7/27/2006

Information Retrieval (2): la información


Tal y como se describe muy bien en el libro "The Search" the John Battelle, la mayor parte de las acciones realizadas por el ser humano parten de un concepto tan sencillo como es "buscar". Para realizar documentos, preparar los planes del fin de semana, aprender un trabajo, hobby, ... necesitamos encontrar los elementos más importantes y claves que nos permitan optimizar nuestra tarea. ¿Qué películas echan este fin de semana? ¿Qué universidades en Madrid imparten la carrera de biblioteconomía? ¿Quién ha sido el ganador del último Tour de Francia -bueno, a estas horas, no está muy claro :) -?

El primer tema antes de plantearse qué significa buscar es qué estamos buscando y cómo se define: INFORMACIÓN

La Wikipedia define Información como:
"Information is the state of a system of interest (curiosity)."
y
"Information is a quality of a message that is sent from a sender to one or more receivers. Information is always about something (size of a parameter, occurrence of an event, ...)."

La RAE, por otra parte:
"Enterar, dar noticia de algo."

Es curioso lo difícil que es definir información, pero queda claro que la información proviene de un emisor, y que se refiere a algo.

Así que, es verdad que cuando buscamos, buscamos información. Buscamos que el sistema nos notifique algo de interés para nosotros. Esto nos lleva a la necesidad de diferenciar entre DATOS, INFORMACIÓN y CONOCIMIENTO.
  • DATOS: aunque el límite siempre es relativo, yo diría que los datos son la representación del conocimiento, sin contexto. De hecho, la información está conformada por datos, pero dispuestos de manera que cobran sentido.
  • CONOCIMIENTO: la representación de un problema-solución en la mente humana, a partir de información previa.
Un buscador web, al menos tal y como lo entendemos en la actualidad, utiliza datos para devolvernos (con suerte) información, a partir del cuál, con suerte, generemos conocimiento (algunos creo que nos quedamos muchas veces en los datos internos al conocimiento, sobre todo cuando llevas n horas currando :) ).

El desafío, por tanto, es cómo optimizar los datos a introducir que nos permita obtener la información más relevante en un contexto determinado que nos permita inferir mejor y más rápidamente el conocimiento que requerimos.

Obviamente, esto permite muchísimas interpretaciones, discusiones tanto tecnológicas como etimológicas, etc. Pero para lo que nos interesa -es decir, entender un poco cómo funcionan los sistemas actuales de búsqueda y hacia dónde pueden estar yendo-, creo que nos vale.

7/26/2006

Information Retrieval (1): un intento

Debido tanto a intereses personales como profesionales, y también por dar de vez en cuando un toque "techie" a este blog (que al fin y al cabo, así es como empezó), voy a dedicar unos cuantos (¿cuántos? Entre 1 y n) posts al tema de recuperación de información desde sus componentes básicos hasta donde llegue.

En principio los recursos básicos que utilizaré (además del conocimiento de algunos de mis compañeros de trabajo, claro :) ) son:
  1. Curso de Matti Hearst, ya comentado en otros posts
  2. Un libro básico (de "base" ;) ): Modern Information Retrieval, de Ricardo Baeza-Yates.
  3. Algunos cursos universitarios de la web, como el de Stanford.
Empezaré con conceptos básicos, aunque siempre centrado en Information Retrieval para búsqueda, sobre todo en internet.

Bueno, a ver si es verdad.

7/24/2006

Tengo unas horas para sorprender

Cómo se innova? Es un proceso disruptivo, radical o se puede basar de manera genérica en un proceso definido? Siendo así es la innovación generada sostenida o puede ser disruptiva? Son preguntas a las que no sé responder todavía pero cuya solución en momentos como el actual, en el que, de alguna manera, necesito "innovar disruptivamente" en un tiempo limitado, me gustaría atisbar...