Optimierungsalgorithmen optimieren
Internet-Traffic-Logs und Finanztransaktionen sind nur zwei Beispiele von massiven Datenmengen, die immer häufiger in verschiedenen Anwendungen vorkommen. Die Analyse und Verwaltung solcher Datensätze zwingt Wissenschaftler dazu, die herkömmlichen Ansätze zur Entwicklung effizienter Optimierungsalgorithmen zu überdenken. Optimierungsalgorithmen werden verwendet, um Entwurfskompensationen zu bewerten und Muster in Datensätzen zu finden. Maschinenlernalgorithmen versuchen oft Merkmale zu identifizieren, die bei Klassifikationsaufgaben helfen. Die Suche nach dem kleinsten Satz von Merkmalen mit dem größten Vorhersagewert ist ein Optimierungsproblem. Die Wissenschaftler des EU-geförderten Projekts SUBLINEAROPTML (Sublinear optimization for machine learning) entwickelten Algorithmen, die zur Lösung solcher Optimierungsprobleme in sublinear Zeit ablaufen. Diese basieren auf einer Kombination von fortschrittlichen Sampling-Techniken und einer randomisierten Umsetzung von Online-Lernalgorithmen. Online-Lernalgorithmen machen eine Vorhersage für jedes Element in einem Datenstrom, und mit dem daraus resultierendem Feedback wird ihre Genauigkeit für die nachfolgenden Vorhersagen verbessert. Im Gegensatz zum statistischen maschinellen Lernen machen sie keine Annahmen zu den Eingabedaten. Die neuen Algorithmen nutzen Randomisierung, um die Daten zu beschneiden und korrekte Lösungen zu produzieren, obwohl ihre Ausführung kürzer ist, als die Datendarstellung selbst - die sogenannte sublineare Zeit. Die Wissenschaftler des Projekts haben gezeigt, dass die Laufzeiten der meisten dieser Algorithmen bei RAM-Modellen (random access machine oder Direktzugriffsmaschine) am besten ist. Die Algorithmen des Projekts können auch auf Kernel-Versionen dieser Probleme erweitert werden, einschließlich Optimierungsproblemen für Support-Vektor-Maschinen, für die Lösungen in sublinearer Zeit nicht zur Verfügung standen. Diese Fortschritte im Bereich des maschinellen Lernens wurden auf mehreren internationalen Konferenzen vorgestellt. SUBLINEAROPTML führte zu einer potenziell effizienteren Art und Weise, wie man Computern helfen kann, einige der schwierigsten Optimierungsprobleme zu lösen. Ein Router könnte die neuen Algorithmen eines Tages nutzen, um den schnellsten Weg durch ein stark belastetet Netzwerk zu berechnen.
Schlüsselbegriffe
Optimierungsalgorithmen, maschinelles Lernen, massive Datenmengen, Optimierungsproblem, Lernalgorithmen