Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
Contenu archivé le 2024-06-18

Longitudinal Analytics of Web Archive data

Description du projet


Future Internet Experimental Facility and Experimentally-driven Research

To understand what is required to support new innovative Internet applications, a solid understanding of Internet content characteristics (size, distribution, form, structure, evolution, dynamic) is necessary. The LAWA project (LAWA - Longitudinal Analytics of Web Archive data) will build an Internet-based experimental testbed for large-scale data analytics. Its emphasis is on developing a sustainable infrastructure, scalable methods, and easily usable software tools for aggregating, querying, and analyzing heterogeneous data at Internet scale. For decades, compute power and storage have become steadily cheaper, while network speeds, although increasing, has not kept up. The result is that data is becoming increasingly local and thus distributed in nature. It has become necessary to move more analysis to the data, not the reverse. The Internet is already, a long-scaled heterogeneous complex system.LAWA will federate distributed FIRE facilities with the rich centralized Web repository of the European Archive, to create a Virtual Web Observatory and use Web data analytics as a use case study to validate our design. The outcome of our work will enable Web-scale analysis of data, to unlock large-scale study of the content aspect of the Internet and bring this dimension on the roadmap of Future Internet Research. In four workpackages we will extend the open-source Hadoop parallel query management software by novel methods for data access and import, develop new methods of distributed storage with indexing, offer scalable aggregation, mine metadata and text along the time dimension, and advance the art of automatic classification of Web contents.LAWA adds value to the FIRE community by offering access to very large datasets across thousands of storage and processing nodes, with advanced methods and open-source tools for intelligently analysis at Internet scale enabling research for the Future Internet to take into account the challenge of content explosion.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.

Vous devez vous identifier ou vous inscrire pour utiliser cette fonction

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

FP7-ICT-2009-5
Voir d’autres projets de cet appel

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

CP - Collaborative project (generic)

Coordinateur

MAX-PLANCK-GESELLSCHAFT ZUR FORDERUNG DER WISSENSCHAFTEN EV
Contribution de l’UE
€ 652 400,00
Coût total

Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.

Aucune donnée

Participants (5)

Mon livret 0 0