Cerrar la brecha digital entre la poesía y la tecnología
En un mundo digital, todo se reduce a datos, y la poesía no es ninguna excepción. «Al hacer que la poesía esté disponible en línea como datos que puede leer una máquina, abrimos la puerta a nuevas posibilidades de enlazar, indexar y extraer nueva información», afirma Elena González-Blanco, directora de investigación de IE University y directora y fundadora del LINHD, el Laboratorio de Innovación en Humanidades Digitales de la Universidad Nacional de Educación a Distancia. Con el apoyo del proyecto POSTDATA, financiado con fondos europeos, González-Blanco trabaja para remediar la brecha digital existente entre la poesía y la tecnología. «Combinar la investigación vanguardista en filología e informática nos permite construir un mundo virtual de poesía con enlaces semánticos», explica González-Blanco. «Con ello, aspiramos a transformar los estudios tradicionales sobre poesía en un entorno de investigación en humanidades digitales».
Un modelo ontológico innovador
En este proyecto, respaldado por el Consejo Europeo de Investigación y centrado en el análisis, la clasificación y la publicación de poesía, se construyó un modelo ontológico innovador para estudiar la interoperabilidad de diferentes colecciones de poesía. El modelo se ajusta por completo a FRBRoo, una ontología formal: «Está destinado a capturar y representar la semántica subyacente de la información bibliográfica y a facilitar la integración, la mediación y el intercambio de información bibliográfica y museística. Utilizamos tecnologías de la web semántica para enlazar y publicar conjuntos de datos literarios de forma estructurada y vincularlos a la nube de datos», afirma González-Blanco. Sin embargo, POSTDATA va un paso más allá y aplica la inteligencia artificial a la poesía. «Para seguir ayudando al personal académico a analizar la poesía española de forma automatizada, estamos construyendo también una serie de herramientas que utilizan el procesamiento del lenguaje natural».
Digitalizar la poesía ofrece diversas ventajas
¿Por qué digitalizar la poesía? Según González-Blanco, hacer que la poesía esté disponible en línea con datos enlazados que puede leer una máquina ofrece una serie de ventajas. «Ante todo, la comunidad académica ahora cuenta con una plataforma digital accesible para trabajar con corpus poéticos y puede contribuir a su enriquecimiento con textos propios», señala. «Este mismo recurso también estará disponible para su uso, por ejemplo, en la educación, la difusión cultural o el ocio». González-Blanco continúa diciendo que, gracias al uso de tecnologías estándar y «software» de código abierto, este método de codificar y estandarizar información sobre poesía garantiza también su conservación. «Mucha poesía se encuentra solo en libros antiguos o se transmite únicamente por vía oral», añade. «Al digitalizar y almacenar el texto como archivos XML, ayudamos a garantizar el lugar que le corresponde en nuestro registro cultural».
Un gran paso hacia un repositorio de poesía completo
Según González-Blanco, el proyecto POSTDATA representa un gran paso hacia la construcción de un repositorio de poesía completo, accesible e interoperable. «No solo hemos construido la ontología, sino que también hemos creado herramientas de última generación que utilizan la inteligencia artificial y el procesamiento del lenguaje natural para analizar la poesía automáticamente», concluye. «Los resultados son poco más que sorprendentes». El proyecto es un trabajo en curso, actualmente centrado en la construcción de un sitio web que permita poner sus herramientas y resultados a disposición del público. Los investigadores también están desarrollando nuevos paradigmas informáticos para seguir analizando el campo poético, incluido el análisis de letras de canciones.
Palabras clave
POSTDATA, brecha digital, poesía, tecnología, tecnologías digitales, inteligencia artificial, aprendizaje automático, procesamiento del lenguaje natural, datos, investigación computacional, ontológico