Modelle maschinellen Lernens für Phonologie von Neugeborenen
Säuglinge lernen phonotaktische Regeln sehr früh und können bereits wenige Monate nach der Geburt bestimmte sprachspezifische Merkmale unterscheiden. Neun Monate alte Säuglinge wissen dann schon, ob die gehörte Lautsequenz den phonotaktischen Regeln der eigenen Sprache entspricht oder nicht. Zudem können sie zwischen häufigen und seltenen (gleichwohl phonotaktisch korrekten) Sequenzen unterscheiden. Laut fehlerbezogenem Lernmodell besitzt der Lernende eine revidierbare Auffassung über richtige phonotaktische Regeln, die er beständig aktualisiert, und zwar immer, wenn eingehende Informationen seine bisherige phonotaktische These widerlegen. Obwohl dieses Lernmodell kognitiv plausibel ist und damit der Optimalitätstheorie entspricht, existiert noch immer kein Computermodell, das fehlerbezogenes Lernen genau beschreiben kann. Das EU-finanzierte Projekt MODACQUPHON (Modeling the acquisition of phonotactics) lieferte signifikante Ergebnisse, die die Forschungsthese zu fehlerbezogenem Lernen und Constraint-basierter Phonologie stützen. Die Forschungsarbeit behandelte weitere Schwerpunkte der computergestützten Phonologie, etwa Konsistenz und Konvergenz. Dabei untersuchte man, ob Phonotaktik, die nach dem fehlerbezogenen Lernmodell gelernt wird, konsistent mit den Trainingsdaten ist, und ob das Modell schließlich Fehler vermeidet und sich auf endgültige grammatikalische Regeln festlegt. Ein weiterer Studienabschnitt behandelte ein anspruchsvolleres Thema als Konsistenz: Richtigkeit. Vor allem sollte untersucht werden, ob das Modell zwischen richtigen und falschen Lauten und Lautkombinationen unterscheiden und schließlich falsche Formen entsprechend der erwachsenen Zielsprache ausschließen kann, d.h. ob die letztendliche Grammatik der erwachsenen Phonotaktik entspricht. Die jeweiligen phonologischen Eigenschaften wurden über eine Reihe allgemeingültiger Constraints extrahiert, die messen, wie Lautstrukturen von der idealen Form abweichen (Constraints sind Ausprägung und Genauigkeit). Erstellt wurde der erste Satz hinreichender Bedingungen für die Richtigkeit einer Klasse phonotaktischer Zielmuster, bei der das relative Ranking der Genauigkeits-Constraints eine Unterscheidung zwischen richtigen und falschen Formen ermöglicht. Das Team bestätigte auch, dass das fehlerbezogene Lernmodell das Erlernen phonotaktischer Regeln beim Kind nur dann hinreichend beschreiben kann, wenn auch Genauigkeits-Constraints existieren. Kleinkinder erlernen phonotaktische Regeln in einer Phase, in der sie noch zu klein sind, um phonologische Veränderungen aufzunehmen. Die Wissenschaftler vermuten, dass der Vorteil des fehlerbezogenen Modells darin liegt, dass es mit Oberflächenregeln gelernt wird und daher zugrunde liegende Formen außer Acht lassen kann. Dies ist eine mögliche Erklärung dafür, dass Phonotaktik morphologischen Regeln vorausgeht. MODACQUPHON sollte belegen, dass fehlerbezogenes Lernen ein geeignetes Modell für den phonotaktischen kindlichen Spracherwerb ist, sowohl mit computergestützten als auch Modellmethoden. Die Projektergebnisse wurden in zahlreichen wissenschaftlichen Beiträgen veröffentlicht.
Schlüsselbegriffe
Maschinelles Lernen, Säuglinge, Spracherwerb, Phonotaktik, fehlerbezogenes Lernen, MODACQUPHON