Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

An Application for leveraging large-scale historical textbases

Descripción del proyecto

La aplicación de la minería de datos en documentos históricos

Si bien la digitalización ha hecho accesibles los textos históricos, académicos y estudiantes siguen encontrando dificultades a la hora de trabajar con instituciones que albergan vastos repositorios digitales. El equipo del proyecto HistText, financiado por el Consejo Europeo de Investigación, pretende desarrollar una aplicación innovadora para la extracción de datos a gran escala en corpus textuales históricos. Esta iniciativa colaboración entre historiadores e informáticos se centra en el empleo de técnicas de aprendizaje automático para analizar extensos archivos de texto. La aplicación está diseñada para gestionar bases de datos que contienen miles de millones de palabras en millones de documentos multilingües. Cuenta con una interfaz sencilla, métodos avanzados de análisis de textos y sólidas funciones de visualización de datos. Con su énfasis en el análisis avanzado de textos y la accesibilidad para el usuario, el equipo de HistText pretende revolucionar el análisis textual a gran escala y ofrecer un nuevo método para comprender los documentos históricos.

Objetivo

HistText is a groundbreaking application developed to address the complex challenges of large-scale data mining in textual corpora, with a particular focus on historical documents. Created in the context of the ERC-funded ENP-China project, which aims to study the evolution of Chinese elites from the 19th century to 1949, HistText is the result of a synergistic collaboration between historians and computer scientists exploring machine learning applications for extensive text archives. Designed to manage databases containing billions of words across millions of multilingual documents, HistText offers a robust and versatile platform that streamlines the process of extracting and visualizing valuable insights. The application features a user-friendly interface, advanced text analysis techniques, and powerful data visualization capabilities. It provides a simplified approach for novice users to conduct complex data queries and analyses, while also offering a comprehensive R-library for more expert users. The main challenge that the proof of concept aims to tackle is to make HistText a fully packageable and transferable tool that can cater to the specialized needs of scholars and institutions holding vast digital repositories. With its focus on advanced text analysis and user accessibility, HistText stands as an invaluable resource not only for academics in the digital humanities but also for students and the general public. In terms of broader applications, HistText has the potential to be integrated into a wide range of institutions (libraries, digital content providers, etc.). The platform is exceptionally well-suited for analyzing a wide range of text genres, including newspapers, periodicals, directories, and diaries, among others. By offering a scalable, user-friendly, and methodologically rigorous tool, HistText aims to revolutionize how we approach large-scale textual analysis, providing a new pathway for understanding historical documents.

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

HORIZON-ERC-POC - HORIZON ERC Proof of Concept Grants

Ver todos los proyectos financiados en el marco de este régimen de financiación

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

(se abrirá en una nueva ventana) ERC-2024-POC

Ver todos los proyectos financiados en el marco de esta convocatoria

Institución de acogida

UNIVERSITE D'AIX MARSEILLE
Aportación neta de la UEn

Aportación financiera neta de la UE. Es la suma de dinero que recibe el participante, deducida la aportación de la UE a su tercero vinculado. Considera la distribución de la aportación financiera de la UE entre los beneficiarios directos del proyecto y otros tipos de participantes, como los terceros participantes.

€ 150 000,00
Dirección
BOULEVARD CHARLES LIVON 58 LE PHARO
13284 Marseille
Francia

Ver en el mapa

Región
Provence-Alpes-Côte d’Azur Provence-Alpes-Côte d’Azur Bouches-du-Rhône
Tipo de actividad
Higher or Secondary Education Establishments
Enlaces
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

Sin datos

Beneficiarios (1)

Mi folleto 0 0