Agenda investigación | Investigación | Catalogadores | Becas y ayudas | Asociaciones | Jobs Net | Contacta | Versión en Portugués  
Google
Presentación del proyecto
  Rincón del doctorando
  Diario de una doctoranda   estadounidense
  Carrera investigadora
  Testimonios de   científicos en el   extranjero
  Mujeres científicas
  El rincón español
  El rincón latinoamericano
  Emigración
  Desarrollo profesional
  La ética en la ciencia
   · Biotecnología
   · Ciencia      medioambiental
   · Consultoría      empresarial
   · Cooperación      humanitaria
   · Derecho de patentes
   · Edición científica
   · Informática
   · Medicina alternativa
   · Nanotecnología
   · Traducción e      interpretación científica
   · Otras salidas

El abecedario de la bioinformática 

KAREN EILBECK

UNIVERSIDAD DE CALIFORNIA – BERKELEY

ESTADOS UNIDOS

03/09/04


 

Lea este artículo en inglés.

Las ideas computacionales pueden ser aplicadas a la biología de maneras diversas; por lo tanto, una carrera profesional en el ámbito de la bioinformática siempre entrañará una multiplicidad de caminos posibles. La vía que escogí yo me ha conducido gradualmente al área concreta de las ontologías biológicas.

Una ontología es una descripción de todo el conocimiento existente en torno a un tema. En ella se definen una serie de conceptos clave y las relaciones entre ellos. Las antologías pueden utilizarse metodológicamente para clasificar datos científicos en función de distintas categorías; se convierten así en herramientas poderosas para estudiar dichos datos en base a las relaciones establecidas entre unos y otros. El desarrollo de ontologías biológicas y del software necesario para realizarlas y utilizarlas, me ha permitido perseguir, simultáneamente, dos grandes intereses míos: la biología, por una parte, y la representación del conocimiento, por otra.

Mis comienzos

Empecé mi trayectoria académica estudiando ciencias biológicas y bioquímicas en el Reino Unido y tuve la gran suerte de poder participar en un programa de intercambio con una universidad estadounidense. Durante mi estancia en el extranjero, pasé una temporada en un laboratorio de parasitología. Fue mi primera experiencia de investigación dentro de un laboratorio y me forzó a aprender a utilizar el ordenador, para más cosas aparte del correo electrónico. A lo largo de este primer periodo fuera de mi país, aprendí tres cosas importantes:

  • La biología es más interesante de lo que creía hasta entonces.
  • El trabajo dentro del laboratorio no está hecho para mí.
  • Los ordenadores no dan tanto miedo, una vez que aprendes a encenderlos.

Cuando regresé a mi universidad de origen, en Inglaterra, para completar mi licenciatura, escogí asignaturas prácticas que me ayudasen a seguir desarrollando mis incipientes destrezas en el área de la bioinformática.Las clases a las que asistí sobre búsquedas de semejanzas entre secuencias y plegación de proteínas me hicieron la boca agua, y acabé matriculándome en un Master en Bioinformática en la Universidad de Manchester. Este curso me expuso a un par de lenguajes de programación, Perl y C; a algunos algoritmos, y a nuevas (para mí) maneras de pensar, como por ejemplo el paradigma de programación orientada al objeto y la utilización de ontologías para describir el conocimiento. Continué en el laboratorio de bioinformática para hacer el doctorado, donde me centré en tecnologías de secuenciado post-genoma.

Lo mejor de ambos mundos

Aunque pertenecía al departamento de bioquímica, también tenía un tutor en el de informática. Como lo que yo quería aprender abarcaba dos departamentos distintos, este “puente” entre ambos fue fundamental. Uno de los temas “biológicos” que más me interesaban era la captura, la representación y el análisis de datos derivados de la interacción proteica. Para familiarizarme con resultados reales, pasé no poco tiempo en el laboratorio realizando experimentos con híbridos de levadura, experiencia vital que me ayudó a conocer en profundidad los requisitos del sistema.

¿Cómo procedí? Básicamente describí una serie de casos de usos, que podríamos definir como objetivos o metas discretas para el usuario, cuando interacciona con el sistema. El enfoque que adopté a continuación fue crear una base de datos orientada al objetoutilizando el lenguaje de programación Java. Aprender a utilizar Java, por cierto, fue particularmente divertido, porque me pareció la introducción perfecta a las técnicas orientadas al objeto. (Desde entonces, he pasado a utilizar otros lenguajes, como Perl). La experiencia de mezclar biología e informática ya va siendo un común denominador en las diversas etapas de mi vida académica; me da la sensación de que resido en algún lugar en la interfaz de ambas disciplinas.

Tras finalizar mi doctorado, me volví a trasladar a los Estados Unidos, en esta ocasión para trabajar en una empresa de genómica durante dos años. La decisión de meterme en la industria sin experiencia postdoctoral fue, a lo menos, poco convencional, pero no me arrepiento de ella. Aprendí muchísimo y fue interesante obtener la perspectiva del análisis a gran escala en un entorno industrial.

El año pasado, me incorporé al Berkeley Drosophila Genome Project para trabajar en la Ontología de Secuencias (SO), que es parte del proyecto OBO - Open Biological Ontologies(véase el recuadro).

 

El proyecto OBO

El objetivo del proyecto OBO es proporcionar antologías a la comunidad científica para su uso compartido entre los profesionales de los diversos ámbitos de la biología. La antología más conocida es la génica, en la cual los diversos genes se clasifican en categorías en función de su ubicación celular, su función molecular y los procesos biológicos a los que están vinculados. La antología génica fue un éxito rotundo porque ofreció a los investigadores un sistema rápido de clasificación génica; también resulta muy útil en el análisis de muchos análisis a gran escala (por ejemplo, los experimentos microarreglo).

Entre otras cosas, la antología génica ha permitido a los investigadores hacerse eficazmente la siguiente pregunta: ¿Qué tipo de genes están sobreregulados bajo determinadas condiciones? Los proyectos OBO pueden abarcar desde descripciones de secuencias biológicas y tipos de células, a temas de desarrollo y anatomía. Para que una antología pueda incorporarse al proyecto OBO, ha de satisfacer los siguientes requisitos:

  1. Ser de fuente abierta y poder ser utilizada sin restricción alguna.
  2. Utilizar una sintaxis común.
  3. No solaparse ni competir con ninguna otra antología.
  4. Tener identificadores y definiciones únicas.

El proyecto SO

El objetivo del proyecto SO es producir una antología con la que catalogar / clasificar las partes de la anotación genómica y describir las relaciones entre ellas. Las anotaciones genómicas son el punto focal de la secuenciación, el análisis bioinformático y la biología molecular. Son el medio a través del cual establecemos correspondencias entre lo que sabemos de un genoma, y su secuencia. El proyecto SO tiene dos cuestiones importantes en consideración:

En primer lugar, la ambigüedad de los términos biológicos. A menudo, co-existen muchas maneras de describir la misma cosa: muchos dialectos, o casos en los que una misma palabra puede tener varios significados distintos. Incluso cuando creemos que estamos describiendo el mismo objeto, podemos toparnos con dificultades. Por ejemplo: “¿Esta secuencia a traducir contiene un codón de terminación o no?”. El SO unifica la terminología que utilizamos para describir las secuencias biológicas, de forma que podamos comunicarnos y hablar de los mismos conceptos del mismo modo.

En segundo lugar, han de tenerse muy en cuenta las relaciones entre los términos. El SO especifica las siguientes relaciones:kind_of (un tipo de), part_of (parte de) y derived_from (derivado de). Por ejemplo, un promotor es un kind_of (tipo de) región_ reguladora, y un exón es part_of (parte de) una transcripción.

Básicamente, la clasificación, catalogación o etiquetado de datos genómicos con términos SO permite, en última instancia, al software, la comprensión de dichos datos. Cuando el software de visualización se encuentra el término exón, por ejemplo, lo rodeará con un recuadro azul si dicho exón es parte de (part_of) un RNAm; o con uno verde si el exón es” parte de” un RNAnc. Del mismo modo, un programa de validación de las anotaciones genómicas puede encontrar la transcripción a la que pertenece el exón en cuestión, y comprobar si sus coordenadas - la información que poseemos sobre éste - son congruentes. La catalogación de datos genómicos con SO nos permite hacernos muchas preguntas relevantes. Asimismo, la utilización de SO como parte de un compendio de bases de datos garantiza que preguntas como éstas significan lo mismo en bases de datos diferentes.

 

La puesta en práctica de mi conocimiento

En mi trabajo diario en el proyecto SO utilizo múltiples destrezas. Necesito tener conocimientos amplios de genómica y biología, y también la habilidad de adquirir nueva información rápidamente conforme se va ampliando la antología. Además, tengo que estar al tanto de los nuevos avances – filosoficos e informáticos – en el campo de las antologías y su diseño, así que leo continuamente y procuro mantener debates con otros profesionales del gremio. Últimamente utilizo sobre todo Perl, ya que me estoy enfrentando fundamentalmente con problemas basados en textos. El trabajo también tiene un lado administrativo: la coordinación de la comunidad de usuarios, la actualización de la página web y de las listas de correo, y la organización de reuniones y encuentros de usuarios.

Mi consejo para todos aquellos interesados en el campo es la siguiente: adquieran un conocimiento profundo de la biología, y compleméntenlo con destrezas informáticas. Una cosa es ir a clases sobre bases de datos relacionales, y otra muy distinta es sentarse y diseñar una para tus propios datos, e implementarla en tu sistema. Como canta el viejo refrán chino: “Léelo y olvídalo; velo y recuérdalo; hazlo y entiéndelo”. No se quede en los abstracto; concretice sus conocimientos.

Si su carrera científica le pone en bandeja la oportunidad de viajar, no la desperdicie. Los viajes abren la mente; se expondrá a nuevas ideas y a personas interesantes. La asistencia a congresos, las presentaciones, las comunicaciones... son todas buenas maneras de obtener retroalimentación sobre su trabajo y de desarrollar canales de comunicación con otros grupos e individuos. Finalmente, si se pasa todo el día delante del ordenador, su cuerpo le pasará factura, así que salga a la calle de vez en cuando y haga ejercicio.

La Dra. Karen Eilbeck es programadora y analista en el Berkeley Drosophila Genome Project de la Universidad de California, Berkeley.

 

 

 

 

 

 

 

 

--------------------------------
Copyright © 2003 Portal Universia S.A. Todos los derechos reservados
(Avda. de Cantabria s/n - Edif. Arrecife, planta 00.28660 Boadilla del Monte) - Madrid. España.
Contacta con nosotros: Usuarios | Empresas-Instituciones-Medios comunicación
Código Ético | Aviso Legal | Política de confidencialidad | Quiénes somos: Sala de Prensa