Agenda investigación | Investigación | Catalogadores | Becas y ayudas | Asociaciones | Jobs Net | Contacta | Versión en Portugués  
Google
Presentación del proyecto
  Rincón del doctorando
  Diario de una doctoranda   estadounidense
  Carrera investigadora
  Testimonios de   científicos en el   extranjero
  Mujeres científicas
  El rincón español
  El rincón latinoamericano
  Emigración
  Desarrollo profesional
  La ética en la ciencia
   · Biotecnología
   · Ciencia      medioambiental
   · Consultoría      empresarial
   · Cooperación      humanitaria
   · Derecho de patentes
   · Edición científica
   · Informática
   · Medicina alternativa
   · Nanotecnología
   · Traducción e      interpretación científica
   · Otras salidas

La red semántica: ¿cambiará la ciencia? 

TIM FININ & JOEL SACHS

ESTADOS UNIDOS

10/09/04

 

Lea este artículo en inglés.

La ciencia prospera cuando las ideas, las hipótesis, los datos y el conocimiento se comparten rápida y fácilmente entre disciplinas y comunidades distintas. En el pasado, esto se hacía a través de la interacción personal, la carta, la conferencia, el artículo en la revista especializada... El advenimiento de Internet aceleró las dinámicas de distribución de la información mediante harramientas tales como el correo electrónico, la publicación en línea, las bibliotecas digitales y los buscadores tipo Google. En la actualidad, se está explorando otra alternativa que, según muchos, permitirá a la comunidad científica compartir su conocimiento de forma todavía más eficaz: la Red Semántica.

 

¿Qué es la Red Semántica y cuál es su razón de ser?

La idea de la Red Semántica surgió a partir de la confluencia de intereses de varias comunidades de expertos (especialistas en inteligencia artificial e hipertexto, desarrolladores Web...), así que sus motivaciones y objetivos pueden definirse de múltiples maneras distintas, en función del punto de mira adoptado. En cualquier caso, una forma sencilla de transmitir lo que supone o puede suponer la Red a personas que no pertenecen a ninguno de los gremios previamente citados es enfatizar el hecho de que mucho de lo que queremos saber (y que, de hecho, se sabe) está disponible en la Red. La Red es, pues, potencialmente, un gran recurso para los agentes de software, que estarían programados para extraer y fusionar información de fuentes heterogéneas, en respuesta a una pregunta.

No obstante, la extracción del significado a partir de texto no es, en absoluto, una tarea que los programas informáticos puedan realizar fácilmente. Aunque se ha progresado algo en la materia, pasarán décadas, si no generaciones, antes de que tengamos una solución consistente para esta cuestión desafiante. Así que, aclarado esto, la Red Semántica viene a ser un enfoque a la codificación y a la publicación de información; se trata, en definitiva, de encontrar una manera que permita que los ordenadores puedan “comprender los textos” más fácilmente, y que ayude a los agentes en su trabajo con y en la Red. ¿Qué queremos decir con “facilitarle la comprensión a los ordenadores”? En la Red Semántica, esta facilitación supone pasar de los recursos web a las ontologías: descripciones formales de dominios particulares.

¿Qué es una ontología?

La ontología es la rama de la filosofía que aspira a responder a la pregunta de “¿Qué es lo que hay?”. En el campo de la informática, utilizamos el término “ontología” para referirnos a la conceptualización formal de un dominio. Normalmente, las ontologías especifican las clases de objetos que existen dentro del cominio en cuestión, las relaciones entre dichas clases, las posibles relaciones entre casos concretos ubicables dentro de una misma clase, y las restricciones aplicables a estos casos. Las ontologías también definen términos que denotan estas clases y relaciones, además de objetos individuales. Los lenguajes de ontologías Web (OWL) actuales, diseñados para codificar información en y para la red, utilizan XML (eXtensible Markup Language), tanto para especificar ontologías como para hacer afirmaciones acerca del mundo utilizando términos definidos en ontologías. Las página web semánticas incluyen, en primer lugar, un listado con la ubicación específica (en forma de URLs) de cada ontología utilizada, y después pasan a usar dichas antologías para hacer afirmaciones acerca de grupos de datos, seres humanos, artículos a la venta, etc. (lo que fuere). Con una página de este tipo, un agente de software puede importar las ontologías mencionadas y utilizar esa información para comprender la semántica de las consiguientes afirmaciones.

Las ontologías en la Red

El World Wide Web Consortium (W3C) o “Consorcio para la World Wide Web”ha desarrollado estándares para la publicación de ontologías en la red, así como para poder codificar datos y otras afirmaciones utilizando términos sacados de cualquiera de las ontologías publicadas. Estos estándares permiten a tanto programas informáticos como agentes de software comprender información publicada en la Red sin la ambigüedad y el procesamiento complejo inherente a las formas no estructuradas tradicionales (ej. el lenguaje natural) y sin la rigidez y la falta de flexibilidad característica de las representaciones estructuradas (ej. las bases de datos relacionales).

El Resource Description Framework (RDF) es un lenguaje sencillo basado en XML que sirve para definir vocabulario “comprensible por el ordenador”, que luego pueda ser utilizado por personas y/o programas para describir “objetos” de interés: páginas web, artículos de periódico, mensajes de correo electrónico, personas, libros, acontecimientos, servicios en línea... El RDF imita a los lenguajes humanos en tanto que permite la introducción de nuevos términos, definidos (al menos parcialmente) en función de términos ya existentes.

El Lenguaje de Ontologías Web (LOW o OWL,) basado en el RDF, presenta propiedades avanzadas, tales como inferencia lógica y traducción de las descripciones mediante la utilización de ontologías diversas. Dos ejemplos de estas prestaciones serían la descripción de una cadena alimenticia en términos de la jerarquía de organismos en un ecosistema, y la ubicación en el mapa de un lugar concreto a partir de un código postal, utilizando las variables de la latitud y la longitud.

La Ilustración 1 muestra una porción de un documento OWL que utiliza términos definidos en un número de ontologías para describir una cadena alimenticia: un esquema de qué organismos comen qué organismos en un ecosistema específico.

Muchos mundos, muchas ontologías

Un problema que surge a la hora de formalizar (u “ontologizar”) dominios científicos es la multlipicidad de maneras distintas de proceder. Dentro de una misma disciplina, puede haber desacuerdos en cuanto a cómo describir el mundo. Además, las disciplinas científicas se sobreponen, y a menudo analizan el área solapada desde distintos puntos de vista. Una manera de abordar la heterogeneidad ontológica consiste en crear un esquema global que sirva como interlingua para agentes tanto humanos como programas informáticos. En nusotro proyecto SPIRE (Semantic Prototype in Research Ecoinformatics), estamos utilizando otro enfoque, más ilustrativo del espíritu de la Red Semántica. No creemos que el espacio conceptual ocupado por cualquier dominio de investigación activa e interdisciplinar pueda ser capturado por una sola ontología consistente. Así que nuestro objetivo no es construir un único esquema global.

En su lugar, aspiramos a desarrollar una serie de ontologías relativamente pequeñas, algunas de las cuales podrían solaparase e incluso entrar en cierto conflicto. Logramos la mediación semántica mediante la construcción de mapeados binarios entre ontologías relevantes. Confiamos en que una característica futura de los repositorios de ontologías online (por ejemplo, las Open Biological Ontologies, de las que ya hemos hablado en un artículo anterior de Next Wave) sea la capacidad de hacer afirmaciones sobre relaciones entre conceptos pertenecientes a ontologías distintas. Ya estamos experimentando con ello en SPIRE.

Aunque todavía habrá que ver si este enfoque podría funcionar con la Red en su totalidad (debido al vasto número de micromodelos que la gente emplea para expresarse), hay motivos importantes para creer que que funcionará en los dominios científicos, en los que típicamente existe un acuerdo general en cuanto a un paradigma subyacente, ligado a unas cuantas formalizaciones de varios aspectos de dicho paradigma. Esperamos poder emitir nuestros primeros informes sobre este enfoque, en los dominios de la biocomplejidad y la biodiversidad, a lo largo del próximo año.

Otros ingredientes de la Red Semántica

La información codificada en los lenguajes de la Red Semántica sólo constituye una parte de la ecología de la Red Semántica. Otros componentes serían los buscadores capaces de encontrar contenido en el seno de la Red Semántica (como por ejemplo, Swoogle y Ontaria, de W3C), parsers y motores de razonamiento capaces de comprender páginas web semánticas y de extraer conclusiones a partir de afirmaciones realizadas dentro de ellas (ej. Jena, un marco para redes semánticas, para el lenguaje de programación Java, y RDFStore, para la creación y la gestión de modelos RDF), y agentes que le sacarían partido a la infraestructura de la Red Semántica para llevar a cabo tareas útiles.

SemWebCentral y SemanticWeb.org proporcionan completos listados de herramientas para la Red Semántica, bien ya disponibles o en fase de producción. La construcción de herramientas y sistemas para descubrir, interpretar, integrar, evaluar y responder a información de la Red Semántica es un área de investigación activa en la que todavía queda mucho por faenar.

Echa una mano, gana una camiseta

Uno de los objetivos principales del proyecto SPIRE es facilitar la publicación a escala amplia de datos científicos en RDF y OWL. Queremos que sea sencillo generar marcación semántica de forma automática para bases de datos locales. Dado que el desarrollo de las ontologías es, de todas las tareas que conforman el proceso de publicación de la Red Semántica, la que lleva más tiempo, estamos promoviendo un proceso casual de desarrollo ontológico que permite que ontologías sencillas, básicas, puedan ser utilizadas para fines editoriales específicos. Invitamos a los lectores a seleccionar un grupo de datos (u otra fuente de información) que querrían compartir, a utilizar Swoogle para buscar ontologías que les permitan marcar los datos en OWL, a crear una ontología apropiada (de no existir ya una), y a remitirnos su grupo de datos marcados. Nos interesa mucho ver los diferentes modos en que se pueden ontologizar dominios semejantes; y nos comprometemos a publicar todas las ontologías, además de los mapeos de conceptos idénticos y relacionados. Si desea leer instrucciones más detalladas al respecto, acuda a la página web metodológica de SPIRE. Las diez primeras entregas que nos lleguen recibirán una camiseta con el logo de SPIRE, y la satisfacción de haber participado en un experimento importante. Si necesita asesoramiento o tiene dudas sobre cómo elaborar su anotlogia, o sobre el proceso de marcado, le rogamos se ponga en contacto con Joel Sachs.

¿Cómo están respondiendo los científicos?

Entre los primeros padres adoptivos y co-creadores de la Red Semántica hay científicos que ven en este nuevo enfoque tres promesas: la de un sistema de recuperación de la información basado en el contenido, la de un eficiente minado de datos distribuidos, y la de una coreografía automatizada de servicios web. Otra aplicación de la Red Semántica para la comunidad científica sería la consecución de un marco de anotación que permitiese dar a conocer el trabajo del ciudadano científico de a pie (ese aficionado entregado que ha llegado a observaciones potencialmente significativas, en las áreas de la astronomía o la ecología, por poner un ejemplo), y de integrarlo en el flujo del discurso científico dominante.

En el concurso Semantic Web Challengedel año pasado, uno de los premios lo recibió AnnoTerra, un sistema que extrae palabras clave de la sección de noticias del Observatorio de la Tierra de la NASA, y las utiliza para llevar a cabo búsquedas basadas en ontologías en el Global Change Master Directory. En otras palabras: sirve para emparejar datos científicos relevantes con las últimas novedades. Otros ejemplos de proyectos de investigación que exploran la utilidad de la Red Semántica en la ciencia son el SPIRE, el Science Environment for Ecological Knowledge, el Semantic Web for Earth and Environmental Terminology(SWEET), y el proyecto Semantic Grid.

Algunos observadores opinan que la idea de la Red Semántica se ha vendido en exceso, y que en realidad es poco probable que pueda ser una realidad en el corto plazo. Por supuesto, está claro que es difícil hacer predicciones, pero nosotros creemos que la Red Semántico tendrá un impacto importante en multitud de áreas y vemos indicios claros de que ya está siendo adoptada, aunque sea de forma incipiente. Los productos de Adobe utilizan RDF para codificar y manipular metadatos en varios formatos distintos; documentos PDF e imágenes, por ejemplo. Hemos elaborado un prototipo de motor de recuperación e indización de la información, Swoogle, que rastrea la red en búsqueda de documentos de la Red Semántica, y podemos constatar que el número de documentos de este tipo está en aumento. Asimismo, dos ontologías sencillas, el RDF Site Summary y el proyecto Friend of a Friend están siendo utilizadas actualmente por millones de páginas web.

 

 

 

 

 

 

 

 

 

--------------------------------
Copyright © 2003 Portal Universia S.A. Todos los derechos reservados
(Avda. de Cantabria s/n - Edif. Arrecife, planta 00.28660 Boadilla del Monte) - Madrid. España.
Contacta con nosotros: Usuarios | Empresas-Instituciones-Medios comunicación
Código Ético | Aviso Legal | Política de confidencialidad | Quiénes somos: Sala de Prensa