Skip to main content
European Commission logo print header

Article Category

Story
Contenido archivado el 2024-04-23

Article available in the following languages:

Reportaje - Salvar los ecosistemas naturales con ecosistemas de infraestructuras electrónicas y de datos abiertos

Si, por un lado, se toman mapas de la biodiversidad marina y, por otro lado, registros de capturas de peces, y sus datos se cruzan, se puede observar con claridad en qué punto es más grave el riesgo para las poblaciones de peces. Este ejercicio podría servir para salvar los océanos del planeta, pero requiere procesar y analizar una cantidad inmensa de datos complejos. Un equipo de investigadores financiados con fondos europeos trabaja para hallar una solución a este problema aplicando a las infraestructuras electrónicas un planteamiento innovador e inspirado en la naturaleza y estudiando formas de integrar distintas iniciativas basadas en la idea de los datos abiertos.

Economía digital icon Economía digital

Las infraestructuras electrónicas, basadas en computación en grid y en la nube, permitirán aprovechar la capacidad de almacenamiento, procesado y el software repartidos por una amplia gama de recursos distribuidos. Pongamos por ejemplo a un grupo de investigadores en biología que establece una infraestructura electrónica para estudiar un problema dado. Con esa infraestructura, estos biólogos podrían crear un «entorno virtual de investigación» (Virtual Research Environment, VRE) en el que colaborar y con el que aprovechar recursos de computación en grid a fin de procesar la información procedente de una fuente y analizarla con las herramientas informáticas de minería de datos suministradas desde otra fuente. Supongamos ahora que, en el transcurso de su labor, se proponen cruzar los datos de los que disponen con la información con la que cuentan otros investigadores, los cuales utilizan sistemas de datos, software y computación diferentes, e incluso recursos públicos de datos abiertos diferentes. «La integración de recursos ubicados en distintas infraestructuras electrónicas resulta muy difícil y lenta; en muchos casos obliga a construir una nueva infraestructura electrónica, lo cual no es rentable desde el punto de vista de los costes ni del tiempo», aseguró Donatella Castelli, investigadora del Instituto de Ciencias y Tecnologías de la Información, integrado en el Consejo Nacional de Investigación de Italia. Si esas infraestructuras electrónicas diferentes existieran en un ecosistema en el que, como sucede en la naturaleza, cada una fuera «consciente» de las demás y capaz de cooperar e incluso competir entre sí, resultaría radicalmente más simple, sencillo y barato compartir recursos. Esta fue precisamente la idea que animó a un consorcio de universidades, institutos de investigación, empresas y un organismo de las Naciones Unidas a poner en marcha el proyecto D4Science-II («Ecosistema de infraestructuras de datos al servicio de la ciencia»). En el marco de este proyecto, dotado de un presupuesto de 4,3 millones de euros por la Comisión Europea, se creó un marco de compatibilidad entre infraestructuras electrónicas configuradas a modo de un ecosistema en el que se pueden compartir recursos de datos, computación y software pertenecientes a distintas infraestructuras electrónicas sin importar su ubicación, tecnología, formato, idioma, protocolo ni sistema de trabajo. Esta compatibilidad, o interoperabilidad, entre infraestructuras electrónicas en el «Ecosistema de Conocimientos de D4Science-II», es posible gracias al uso de estándares comunes a todas las infraestructuras abarcadas y, sobre todo, a los llamados «marcos de mediación». Dichos marcos consisten en software o programas informáticos que traducen y transforman datos y procesos heterogéneos de tal modo que puedan ser utilizados en distintos contextos por infraestructuras electrónicas diferentes, lo cual posibilita la cooperación. La espina dorsal del sistema es gCube, un marco de software escalable que hace posible la compatibilidad y que fue sometido a pruebas por 4D SOFT, socio húngaro de este proyecto. La infraestructura electrónica D4Science no sólo aglutina recursos y los hace compatibles; también los pone al alcance de otras infraestructuras electrónicas, pues les permite acceder de forma dinámica a datos, herramientas de software y potencia de computación. «En este sentido, las infraestructuras electrónicas integradas en el ecosistema pueden ser competitivas. Los investigadores pueden elegir, de entre los recursos disponibles, aquellos que se ajustan mejor a sus necesidades en cada momento», apuntó la Dra. Castelli. El potencial que ofrece este planteamiento se puede observar en los VRE y en las aplicaciones de gCube (VRE de acceso abierto) establecidas como parte del proyecto D4Science-II, a las que se puede acceder a través del portal de D4Science . «D4Science-II tiene su origen en dos proyectos anteriores, DILIGENT y D4Science, donde se empezó a desarrollar infraestructuras para bibliotecas digitales construidas sobre la base de una infraestructura electrónica capacitada por grid. No obstante, nos percatamos de que ya existe un gran número de infraestructuras electrónicas dedicadas a fines específicos, y de que es más conveniente hacer uso de los recursos con los que cuentan y permitir que «cooperen» que construir una infrastructura electrónica nueva en cada caso. En D4Science-II pasamos de centrarnos en habilitar infraestructuras electrónicas a construir un ecosistema formado por éstas», señaló la Dra. Castelli. Desde la biodiversidad y la pesca hasta la física de alta energía Este ecosistema ha sido utilizado para respaldar VRE en campos como la física de alta energía, la biodiversidad, la pesca y la acuicultura. Ha ayudado a abrir nuevas áreas de investigación en la encrucijada entre estos campos y ya se está ampliando a nuevas disciplinas. AquaMaps, proyecto dedicado a crear mapas de la distribución mundial de las especies marinas, se vale de recursos de infraestructuras electrónicas de datos y en grid a través de un VRE establecido sobre la infraestructura de D4Science. La generación de mapas de alta resolución que muestren la distribución de especies pesqueras es una tarea muy intensa desde el punto de vista computacional, ya que la reproducción de cada mapa multiespecie requiere 125 millones de computaciones. Si no se contase con una infraestructura electrónica potenciada por grid, generar la serie de mapas necesaria para sustentar determinada actividad de investigación podría durar días, pero gracias a la computación en grid lleva apenas unas horas. Dentro del ecosistema de D4Science, tres VRE distintos pero afines que trabajan con datos de pesca pudieron utilizar la información y los recursos proporcionados por distintas infraestructuras electrónicas de datos (GENESI-DEC, de datos de observación de la Tierra; GBIF, de datos de biodiversidad; y FIGIS, de información pesquera). Gracias a esta capacidad, pudieron llevar a cabo procesos innovadores de análisis estadístico que, sencillamente, antes resultaban imposibles. Para ello se combinó información sobre especies pesqueras y ubicación de capturas con datos ambientales y geoespaciales, entre otros. «Recabamos estadísticas sobre pesquerías de todas clases desarrolladas en todos los países, siendo la calidad de los datos muy variopinta. D4Science nos ayuda a unificar todos estos datos», informó Anton Ellenbroek, del Departamento de Pesca y Acuicultura de la Organización de las Naciones Unidas para la Agricultura y la Alimentación (FAO), en Roma. «Se trata de una infraestructura realmente importante [...] nos permite analizar estadísticas de formas que antes eran imposibles. Nos resulta fácil compartir información con otros entornos virtuales de investigación.» La FAO celebró un taller en colaboración con el proyecto dedicado al tema «Repositorios digitales: datos abiertos vinculados» con el fin de estudiar posibles soluciones para la publicación de repositorios digitales como datos abiertos vinculados empleando instrumentos avanzados tales como los VRE de D4Science. La exitosa experiencia de los VRE dedicados a datos de pesca y biodiversidad en el marco de D4Science-II motivó el inicio de dos proyectos complementarios en este campo. En i-Marine, sus investigadores aplican el método ecosistémico a la gestión pesquera y la conservación del entorno marino. Utilizan una plataforma abierta basada en la infraestructura D4Science para trabajar con un conjunto de fuentes de datos y conocimientos mucho más amplio que el usado en la gestión pesquera convencional. Y en el proyecto (EUBrazilOpenBio), investigadores europeos y brasileños han aplicado el método de ecosistema de infraestructuras electrónicas para poner en marcha una plataforma de acceso abierto que integra recursos e infraestructuras electrónicas ya existentes en Europa y Brasil para el estudio de la biodiversidad. «La cooperación entre varias infraestructuras electrónicas abre posibilidades y áreas de investigación radicalmente nuevas. Ahora se pueden analizar datos científicos contrastándolos con estadísticas económicas, por ejemplo, de manera que se obtiene una perspectiva rabiosamente nueva e inédita hasta ahora», destacó la Dra. Castelli. Enlaces útiles: - sitio web del proyecto D4Science-II - ficha informativa de D4Science-II en CORDIS - sitio web del proyecto EUBrazilOpenBio - ficha informativa de EUBrazilOpenBio en CORDIS - discurso de la Comisaria europea Neelie Kroes sobre los datos abiertos Artículos relacionados: - D4Science-II impulsa una revolución en los recursos científicos electrónicos - La infraestructura Grid paneuropea inicia una nueva etapa - Computación en grid contra el Alzheimer - EELA fomenta la computación en grid en Iberoamérica y EELA-2 la populariza