Skip to main content
European Commission logo print header

Pattern Recognition in High Dimensional Data

Article Category

Article available in the following languages:

Zuverlässige Clusteranalysen für biomedizinische Daten

Die enormen Datenmengen, die derzeit generiert werden, sind nicht immer besonders aussagefähig. EU-finanzierte Forscher entwickelten daher modernste Methoden der Mustererkennung, um sinnvolle Informationen zu Infektionskrankheiten oder Hirnfunktionen zu liefern.

Gesundheit icon Gesundheit

Mengen und Inhalte biomedizinischer Daten sind außerordentlich vielfältig und häufig kaum standardisiert. Damit eine sinnvolle Auswertung der Daten erfolgen kann, wird ein rationaler Ansatz zur Kategorisierung in Gruppen bzw. Teilmengen mit gemeinsamen Merkmalen benötigt. Die Bildung von Clusterdatensätzen ist ein erster Schritt bei der Auswertung hochdimensionaler Daten, indem jede Dimension ein bestimmtes Attribut (Variable) repräsentiert. Zwar sind Mustererkennungstechniken für geringere Dimensionen durchaus praktikabel, bei höherer Dimensionalität ergeben sich aber zunehmend Probleme. Europäische Forscher widmeten sich nun mehreren Problemen beim Clustering hochdimensionaler Daten und fokussierten zunächst auf niedrigdimensionale Strukturen, um sich den gegebenen Daten zu nähern. So sollte das EU-finanzierte Projekt PRINHDD (Pattern recognition in high dimensional data) neue Methoden zur Datenanalyse für die Bereiche Artenvielfalt und Infektionsforschung entwickeln. Mit Interpolationsverfahren (Nearest Neighbour, NN) können Rückschlüsse auf räumliche Muster gezogen werden. Zwei häufig untersuchte räumliche Muster bei verschiedenen Arten und deren Merkmalen (Geschlecht, Existenzstatus) sind Segregation und Assoziation. Die Forscher testeten auch Muster für Reflexivität und artübergreifende Übereinstimmung. Anhand zweier entfernungsabhängiger Segregationsindikatoren wurden Krankheits-Cluster bei Individuen einer homogenen und einer inhomogenen Population ausgewertet. Die Forscher untersuchten die Sensitivität der Tests in Abhängigkeit von Größe, Hintergrundmuster, Clusterlevel und Clusteranzahl. Weiterhin soll eine neue Methode morphometrische Informationen aus markierten kortikalen Distanz-Mapping-Daten ableiten. Über Pooling und Distanzmessungen zwischen Zellkörpern der grauen Substanz und der Cortexoberfläche wurden Unterschiede beim Planum temporale (Schläfenlappen) von Patienten mit Schizophrenie und bipolarer Störung aufgezeigt. PRINHDD veröffentlichte 11 Beiträge in renommierten Fachzeitschriften. Auf internationalen Konferenzen wurden die Ergebnisse Wissenschaftlern vorgestellt, die ebenfalls zu hochdimensionalen Datenanalysen und Mustererkennung forschen. Die Weiterführung der Ergebnisse von PRINHDD in Kooperationsprojekten, die sich mit Klassifizierung und Clustering befassen, können statistische Methoden und Anwendungen befördern.

Schlüsselbegriffe

Clustering, Biomedizin, Datenanalyse, hochdimensionale Daten, Mustererkennung, PRINHDD

Entdecken Sie Artikel in demselben Anwendungsbereich