Skip to main content

Pattern Recognition in High Dimensional Data

Article Category

Article available in the folowing languages:

Niezawodne tworzenie klastrów w analizie danych biomedycznych

Obecnie dostępne są olbrzymie ilości danych, lecz nie jest to równoznaczne z użytecznymi informacjami. Przy użyciu przełomowych narzędzi do identyfikacji wzorców, finansowani przez UE naukowcy mogli wybierać użyteczne informacje spośród danych dotyczących chorób zakaźnych i obrazowania mózgu.

Zdrowie

Dane wygenerowane w badaniach biomedycznych są rozległe, zróżnicowane pod względem zawartości i niedostępne w standardowych formatach. Racjonalna metoda reorganizacji podzestawów tych danych w grupy o wspólnych cechach jest niezwykle ważnym elementem skutecznego przeszukiwania zasobów wiedzy. Tworzenie klastrów jest jedynie punktem wyjścia w przypadku danych wielowymiarowych, gdzie każdy wymiar stanowi odrębny atrybut (zmienną). Technika rozpoznawania wzorca, odpowiednia w przypadku niższych wymiarów, często nie sprawdza się wraz ze wzrostem wymiarowości analizowanych danych. Finansowani przez UE naukowcy zajęli się wyzwaniami związanymi z tworzeniem klastrów danych wielowymiarowych, skupiając się na niskowymiarowych strukturach, które mogą przybliżyć określone dane. W ramach projektu PRINHDD (Pattern recognition in high dimensional data) stworzono nowe metody analizy danych dotyczących między innymi zmienności gatunkowej i badań nad chorobami. Zaproponowano najbliższe sąsiednie metody wyciągania wniosków na temat wzorców przestrzennych. Dwa często badane wzorce przestrzenne między różnymi gatunkami i ich cechami charakterystycznymi (płeć, żywotność itp.) to segregacja i asocjacja. Naukowcy badali również wzorce wzajemnych oddziaływań międzygatunkowych. Wykorzystano dwa bazujące na segregacji wskaźniki, aby dokonać ewaluacji wyników tworzenia klastrów choroby wśród osobników z populacji homogenicznych i niehomogenicznych. Naukowcy badali czułość wielkości tych testów na leżące u podstaw wzorce tła, poziom sklastrowania i liczbę klastrów. Ponadto nowe metody mogą dostarczyć więcej informacji morfometrycznych zawartych w oznakowanych danych mapowania odległości korowych. Zbieranie i ocena odległości wokseli istoty szarej z powierzchni kory mózgowej może ujawnić różnice w planum temporale między schizofrenią a zaburzeniami dwubiegunowymi. Badanie PRINHDD rozpowszechniono w 11 artykułach opublikowanych w prestiżowych, recenzowanych czasopismach naukowych. Podczas międzynarodowych konferencji zespół projektu miał okazję zademonstrować swoje wyniki naukowcom pracującym w dziedzinie analizy danych wysokowymiarowych i rozpoznawania wzorców. Dalsze prace uczestników projektu PRINHDD nad klasyfikacją i tworzeniem klastrów, dzięki nawiązanej współpracy powinny poszerzyć się zarówno w sferze metod statystycznych, jak i zastosowań.

Słowa kluczowe

Tworzenie klastrów, biomedyczny, analiza danych, dane wielowymiarowe, rozpoznawanie wzorca, PRINHDD

Znajdź inne artykuły w tej samej dziedzinie zastosowania