Skip to main content

Poetry Standardization and Linked Open Data

Article Category

Article available in the folowing languages:

Combler le fossé numérique entre la poésie et la technologie

Les chercheurs utilisent une panoplie de technologies numériques – recherche computationnelle, modèles du web sémantique, intelligence artificielle, apprentissage automatique et traitement du langage naturel – pour créer une nouvelle approche du savoir traditionnel en poésie.

Économie numérique
Société

Dans un monde numérique, tout se résume à des données – et la poésie ne fait pas exception. «En rendant la poésie accessible en ligne sous forme de données lisibles par machine, nous ouvrons la porte à de nouvelles possibilités de liaison, d’indexation et d’extraction de nouvelles informations», explique Elena González-Blanco, directrice de recherche à l’IE University et directrice et fondatrice de LINHD, le laboratoire d’innovation en humanités numériques de l’Université nationale d’enseignement à distance d’Espagne. Avec le soutien du projet POSTDATA financé par l’UE, Elena González-Blanco s’efforce de combler le fossé numérique qui sépare la poésie de la technologie. «En combinant des recherches philologiques et informatiques de pointe, nous construisons un monde virtuel de poésie sémantiquement liée», explique-t-elle. «Ce faisant, nous visons à transformer la recherche traditionnelle sur la poésie en un environnement de recherche en sciences humaines numériques.»

Un modèle ontologique innovant

En se concentrant sur l’analyse, la classification et la publication de la poésie, ce projet soutenu par le Conseil européen de la recherche a construit un modèle ontologique innovant destiné à étudier l’interopérabilité de différents recueils de poésie. Le modèle est entièrement aligné sur l’ontologie formelle FRBRoo: «Destinée à capturer et à représenter la sémantique sous-jacente des informations bibliographiques et à faciliter l’intégration, la médiation et l’échange d’informations bibliographiques et muséales», explique-t-elle. «Nous utilisons les technologies du web sémantique pour relier et publier des ensembles de données littéraires de manière structurée et les relier au cloud de données», précise Elena González-Blanco. Mais POSTDATA va plus loin et applique l’intelligence artificielle à la poésie. «Pour aider davantage les chercheurs à analyser la poésie espagnole de manière automatisée, nous construisons également un certain nombre d’outils faisant appel au traitement du langage naturel.»

La numérisation de la poésie offre un certain nombre d’avantages

Alors, pourquoi numériser la poésie? Selon Elena González-Blanco, rendre la poésie accessible en ligne avec des données liées lisibles par machine offre un certain nombre d’avantages. «Tout d’abord, la communauté académique dispose désormais d’une plateforme numérique accessible pour travailler avec des corpus poétiques et contribuer à les enrichir avec leurs propres textes», fait-elle remarquer. «Cette même ressource sera également disponible pour être notamment utilisée dans le domaine de l’éducation, de la diffusion culturelle, ou même du divertissement.» Elena González-Blanco ajoute que, grâce à l’utilisation de technologies standard et de logiciels libres, cette méthode d’encodage et de standardisation de l’information poétique est également garante de sa préservation. «Une grande partie de la poésie ne se retrouve que dans des livres anciens ou ne s’est simplement transmise qu’oralement», ajoute-t-elle. «En numérisant et en stockant le texte sous forme de fichiers XML, nous contribuons à assurer sa place dans nos archives culturelles.»

Un grand pas vers un référentiel complet de la poésie

Selon Elena González-Blanco, le projet POSTDATA représente un grand pas vers la constitution d’un référentiel de poésie complet, accessible et interopérable. «Non seulement avons-nous construit l’ontologie, mais nous avons également créé des outils de pointe qui recourent à l’intelligence artificielle et au traitement du langage naturel pour l’analyse automatique de la poésie», conclut-elle. «Les résultats sont tout simplement stupéfiants.» L’équipe du projet travaille désormais à la création d’un site web où elle pourra mettre ses outils et ses résultats à la disposition du public. Les chercheurs développent également de nouveaux paradigmes informatiques pour approfondir l’analyse du domaine poétique, notamment l’analyse des paroles de chansons.

Mots‑clés

POSTDATA, fossé numérique, poésie, technologie, technologies numériques, intelligence artificielle, apprentissage automatique, traitement du langage naturel, données, recherche computationnelle, ontologique

Découvrir d’autres articles du même domaine d’application