|
Aunque disfrutaba
con la ciencia, como tal, me desencantó
la vida de estudiante pre-doctoral. La
financiación constituía
siempre un problema, y no estaba satisfecho
con el progreso que iba realizando como
investigador a tiempo parcial. No perdí
la ilusión por obtener el título
de doctor - de hecho, era muy consciente
de que se me cerrarían muchas puertas
en el futuro sin él. No obstante,
sentía que la tesis tenía
que dejar de ser mi prioridad. Necesitaba
un cambio y un nuevo reto con el que entusiasmarme.
Más o menos
por aquella época, mi Universidad
fundó el Laboratorio de Informática
y Biología Computacional (CBIL),
entre otras cosas para proporcionar apoyo
informático a su Centro del Genoma,
que estudia el cromosoma 22. Los directores
del citado laboratorio eran biólogos
doctores que habían cursado Masters
en informática en la misma Universidad
de Pensilvania de forma simultánea
a la realización de sus post-docs.
Un buen día, vi un anuncio de empleo
en el periódico de la facultad
que se adaptaba bien a mis habilidades
e intereses. El CBIL necesitaba contratar
a alguien con experiencia en representación
del conocimiento, con el objeto de diseñar
módulos automatizados de aprendizaje
y razonamiento para llevar a cabo inferencias
a partir de gigantescas bases de conocimientos
y todo ello con vistas a estudiar la regulación
génica. Las características
del dominio me resultaban muy familiares.
Al igual que con el razonamiento del sentido
común, el objetivo es razonar,
con efectividad, sobre bases de datos
de enormes dimensiones.
Mi intuición
de que el puesto era adecuado para mí
se confirmó el día de la
entrevista. La regulación génica
se puede entender como el ente inteligente
que está detrás de cada
cuerpo en correcto funcionamiento, controlando
los niveles de expresión de genes
diferentes en células diferentes
durante las distintas etapas de desarrollo.
La idea de que estaría estudiando
la inteligencia del cuerpo, en lugar de
la inteligencia de la mente, me resultó
profundamente atractiva. También
encontré muchos vínculos
concretos entre las exigencias del puesto
ofertado y mi trayectoria profesional
previa como informático. Por ejemplo:
yo tenía mucha experiencia en el
área de razonamiento analógico,
una técnica poderosa cuando es
aplicada a sistemas biológicos
homólogos, y como la homología
está enraizada en la teoría
evolucionista, tenemos aquí una
analogía brutal. Asimismo, en mi
etapa de estudiante pre-doctoral, me había
dedicado durante algún tiempo a
investigar el problema de estabilizar
la memoria en redes neuronales recurrentes.
Desarrollé un método para
"refrescar" la memoria decadente,
que consistía en impedir que el
conocimiento que fluyese por los vínculos
recurrentes se disipase a través
de las brechas, los "huecos",
de las secuencias de datos. Esta técnica
concreta tiene una gran relevancia datos
genómicos, donde los elementos
de interés biológico son
subsecuencias separadas por "huecos"
en la secuencia subyacente de amino ácidos
o ácidos nucleicos.
Empecé a trabajar
para el CBIL en noviembre de 1991. Mi
tarea giró, fundamentalmente, en
torno a la transformación de datos.
Me sorprendió lo difícil
que podía llegar a ser la identificación
y la extracción de los objetos
de datos que deseábamos estudiar,
de las bases de datos públicas.
Nuestra actividad científica se
centraba, sobre todo, en el desarrollo
de modelos de estructuras génicas
para la normalización de datos,
y de lenguajes de consulta capaces de
operar sobre la forma normalizada, extrayendo
rasgos genéticos e identificando
genes de interés.
Una vez transformados
los datos, se podía proceder al
análisis de forma relativamente
sencilla. Esta fue una lección
importante, y el tiempo que invertí
manejando los datos me sirvió de
excelente introducción a la disciplina.
Los muchos meses que pasé manipulando,
buscando y extrayendo secuencias y textos
de varias bases de datos de biología
molecular me proporcionaron una visión
muy amplia y profunda de las fortalezas
y debilidades de muchas de las fuentes
de datos más importantes de este
campo.
Tras siete años
trabajando en un contexto universitario,
tenía claro que la vida académica
no iba conmigo. En aquel entonces, la
industria farmacéutica comenzaba
a responder ante la explosión de
datos genómicos, y varias empresas
empezaban a prepararse internamente para
beneficiarse económicamente de
estas informaciones y facilitar las primeras
etapas del proceso de descubrimiento de
fármacos. En la primavera de 1994,
me incorporé al departamento de
bioinformática del Laboratorio
de Investigación Merck, división
de Merck & Co. Inc, con sede en Whitehouse
Station (Nueva Jersey, EE.UU.).
La ingeniería
de datos siempre estará en el corazón
de la bioinformática, pero en un
entorno industrial, la ingeniería
de software también es necesaria
desde el punto de vista investigador.
El vasto volumen de datos existentes hace
que, para el biólogo, la identificación
del sub-conjunto de datos relevantes para
su área de investigación
sea una actividad realmente impráctica.
El papel de la bioinformática consiste
en permitir al biólogo centrarse
directamente en los datos que le son relevantes,
presentar dichos datos de forma integrada,
completa e intuitiva, y proporcionarle
métodos sencillos para llevar a
cabo diversos análisis detallistas
(downstream). Esto exige que muchos
esfuerzos se focalicen hacia la resolución
de problemas de escala. El tiempo mejor
invertido es aquel que se consagra a la
elaboración de técnicas
normalizadas de integración de
datos, al trabajo de minería de
datos (data mining) sobre corpus
inmensos y al proporcionamiento de un
entorno de datos con valor añadido
a multitud de proyectos y cientos de usuarios
de laboratorios de investigación.
En la actualidad,
me he vuelto a matricular en el programa
doctoral CIS de la Universidad de Pensilvania,
y estoy trabajando sobre una tesis de
biología computacional. Mi empresa,
Merck, ha apoyado mi decisión.
En 1994, la Universidad de Pensilvania
estableció un programa interdisciplinar
de formación en biología
computacional con el fin de introducir
y formar a informáticos y biólogos
en este campo emergente. Animo fervientemente
a otros estudiantes a que consideren programas
de este tipo. Esté uno más
inclinado hacia lo teórico o hacia
lo aplicado, son muchas las áreas
de investigación que pueden encontrarse
dentro de la bioinformática. Es
un campo emocionante, en continua expansión
y queda muchísimo trabajo por hacer
en lo que se refiere a la conversión
de datos en información. Y lo más
importante: le garantizo que habrá
un trabajo esperándole cuando se
gradúe.
|