Webanwendung bietet Instrumente zur Textanalyse für alle
Instrumente zur Textanalyse(öffnet in neuem Fenster) werden verwendet, um unstrukturierte Daten in Form von Text abzubauen und diese in strukturierte, umsetzbare Informationen umzuwandeln. Dazu gehören Instrumente zur Vorbereitung und Verarbeitung von Texten sowie Instrumente zur Analyse von Daten, die sich aus dieser Verarbeitung ergeben. „Diese Instrumente werden von Forschenden verwendet, die über große Mengen digitaler Informationen verfügen“, erklärt Kenneth Benoit, Projektkoordinator von QUANTEDA(öffnet in neuem Fenster) und Professor für rechnergestützte Sozialwissenschaften an der britischen London School of Economics and Political Science(öffnet in neuem Fenster). „Diese Informationen können in Form von historischen Dokumenten, Literatur, Regierungsdokumenten oder Beiträgen aus sozialen Medien vorliegen. Analyseinstrumente könnten verwendet werden, um Unterschiede im Sprachgebrauch zu ermitteln oder um die in den Texten zum Ausdruck gebrachten psychologischen Perspektiven zu untersuchen und zu bewerten.“ Die bestehenden Lösungen lassen sich grob in zwei Kategorien aufteilen: Softwarebibliotheken für Computerprogrammierende und Endbenutzeranwendungen, für die keine Programmierkenntnisse erforderlich sind. „Während Softwarebibliotheken umfangreiche technische Funktionen bieten, steht diese Leistung nur Programmierenden mit einem hohen technischen Wissen zur Verfügung“, erklärt Benoit. „Benutzerfreundliche Software bietet dagegen nur eingeschränkte Funktionen.“ Benoit erkannte die Notwendigkeit, Instrumente zur Textanalyse einer breiteren Zielgruppe zugänglich zu machen – mit einer einfachen Bedienung, aber mit einem hohen Maß an Flexibilität und Leistung.
Leistungsstarke Textanalyse
Das Projekt QUANTEDA hatte die Entwicklung quelloffener Software zur Deckung dieses Bedarfs zum Ziel. Ein früheres, vom Europäischen Forschungsrat(öffnet in neuem Fenster) finanziertes Projekt namens QUANTESS war für die Backend-Entwicklung der Anwendung von entscheidender Bedeutung. Benoit wollte darauf aufbauen und einen marktfähigen Prototyp entwickeln, der keine Programmiererfahrung erfordert. Die neu entwickelte Software läuft vollständig auf einem Cloud-Server und ist über einen Webbrowser zugänglich. Das heißt, dass leistungsstarke Analysen großer Textmengen nicht durch die Hardwarekapazität eines Nutzenden eingeschränkt werden. Dadurch werden diese weitaus zugänglicher. Anschließend wurden Schnittstellenkomponenten entwickelt, die problemlos in jede Sprache übersetzt werden können. Das Programm kann in Hindi, Chinesisch, Spanisch oder in eine beliebige Sprache umgewandelt werden, für welche die Menüs und Hilfeseiten übersetzt wurden. „Wir wollten auch sicherstellen, dass diese Webanwendung für Studierende, Nachwuchsforschende und Nutzende aus Entwicklungsländern finanziell erreichbar ist“, fügt Benoit hinzu. „Dazu wurde eine flexible, kostengünstige Preispolitik entwickelt.“ Benoit stellt fest, dass viele Online-Anwendungen wie Dropbox, GitHub, RStudio und Slack ein solches Modell erfolgreich verwenden.
Für alle verfügbare Instrumente
Die Anwendung für dieses neueste Projekt mit dem Namen Quanteda Guru(öffnet in neuem Fenster) kann jetzt getestet oder gekauft werden. „Neben der Forschung haben wir eine weitere mögliche Nutzerschaft ermittelt, die reich an Daten, aber arm an Informationen sind“, erklärt Benoit. „Dazu gehören medizinische Fachkräfte, insbesondere in der Branche für Gesundheitsdienstleistungen, und Regierungsabteilungen wie Justiz- oder Gesundheitsministerien.“ Andere mögliche Endnutzende sind Unternehmen für Geschäftsanalytik und Marketingfirmen, die häufig soziale Medien nutzen, sowie Versicherungsunternehmen. Diese müssen Risiko- und Unfallberichte analysieren und bewerten. Strafverfolgungsbeamte müssen auch schriftliche Berichte analysieren, während Angestellte in der Kundenbetreuung und im Callcenter häufig Vorfälle analysieren und protokollieren müssen. „Wir arbeiten derzeit daran, neue Funktionen hinzuzufügen, die Nutzungserfahrung zu verbessern und die Leistung zu steigern“, fügt er hinzu. „Das Tolle ist, dass diese Anwendung auf einer quelloffenen Softwarebibliothek basiert. Das heißt, dass der Quellcode der Analytic Engine überprüft, wissenschaftlich validiert, kontinuierlich weiterentwickelt und verbessert werden kann.“
Schlüsselbegriffe
QUANTEDA, Online, Web, Analyse, Text, historisch, Software, Benutzeroberfläche, Browser