Objectif
The project will evaluate and compare the current methods for editing and imputation to establish current best practice methods. In addition, new methods for editing and imputation based on neural networks, support vector machine, fuzzy logic methodology and robust statistical methods will be developed and compared with the current best practice methods. The evaluation of different methods will require, (a) the creation of common data sets with known type of errors to be used by all the methods, and (b) the establishment of sound statistical criteria for the objective evaluation of the methods. Based on our evaluation, recommendations for the use of different methods for editing and imputation for different kinds of data sets will be made. A CD ROM containing the algorithms for different selected methods will be produced and widely disseminated for use by the NSIs and other private and public sector organisations interested in editing and imputation.
Objectives:
1. To establish a standard collection of data sets for EUREDIT
2. To develop a methodological evaluation framework and develop evaluation criteria
3. To establish a baseline by evaluating currently used methods for data editing and imputation.
4. To develop and evaluate a selected range of new techniques for data editing and imputation.
5. To evaluate different methods for edit and imputation and establish best methods for different types of data.
6. To disseminate the best methods via a single package for wider dissemination, and in a conference proceedings.
Work description:
In order to evaluate the editing and imputation methods, a set of representative data sets arising in social sciences (household surveys, business surveys, censuses, panel data) with known types of errors will be produced. The criteria for the evaluation of the methods in terms of Fellegi-Holt (1976) principles and operational efficiency will be established and agreed among the participants. Based on a review of currently used methods, a selection will be evaluated. This will establish the current best practice methods and also provide benchmark for the later phase of the project. Alongside the investigation of traditional methods, new methods for editing and imputation based upon advanced statistical and information technology techniques will be developed. Specifically, methods based upon: outlier robust methods and non-parametric regression, MLP neural networks, Radial Basis Function (RBF) neural networks, Correlation Matrix Memory (CMM) neural networks, Self-Organising Map (SOM) neural networks and Support Vector Machines (SVM), will be developed. This will involve the establishment of appropriate methodology, development of algorithms and application of methods to the selected data sets. All the methods (new and old) will be comparatively evaluated. This will form the basis for detailed recommendations about the optimal choice of methods in a wide range of common situations. The "best methods" will be selected for wider dissemination. This will be achieved through the development of portable software for the selected (best) methods. The CD containing the software will be produced and made available to the organisations interested in editing and imputation.
Milestones:
1. Selection and compilation of datasets for evaluating methods
2. Determination objective quality criteria for evaluating methodsL%3. Development and testing of selected new methods for error localisation
4. Development and testing of selected new methods for imputation
5. Evaluation of all (new and old) editing and imputation methods
6. Integration of the individual edit and imputation methods into a single
Champ scientifique (EuroSciVoc)
CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.
CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.
- sciences naturelles informatique et science de l'information logiciel
- sciences sociales sociologie démographie recensement
- sciences naturelles informatique et science de l'information intelligence artificielle intelligence de calcul
Vous devez vous identifier ou vous inscrire pour utiliser cette fonction
Programme(s)
Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.
Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.
Thème(s)
Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.
Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.
Appel à propositions
Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.
Données non disponibles
Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.
Régime de financement
Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.
Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.
Coordinateur
SW1V 2QQ LONDON
Royaume-Uni
Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.