Diese Seite steht in folgenden Sprachen zur Verfügung:
Sie befinden sich: Home » Multimedia-Processing » Übung 3
Inhalt dieser Seite:
Wählen Sie eine weitere Seite:
Sprachsignalstatistik und Phoneme
3.1 Zur statistischen Beschreibung von Sprache
Die statistische Häufigkeit von Amplitudenwerten ergibt sich aus der Amplitudendichteverteilung (ADV).
[ nach oben ] [ Website-Navigation ]
Schreibe ein Matlab-Skript zur Berechnung eines Histogramms für eine Sprachdatei (Wertebereich -1 -> 1, Intervallgröße 0,1). Zeichne für jedes Gruppenmitglied mit PRAAT einen Satz (ca. 10 Wörter) auf und berechne jeweils die Histogramme (Pausen vor und hinter dem Sprachsignal mit PRAAT abschneiden). Zeichne diese für die einzelnen Dateien graphisch in das selbe Diagramm (x-Achse: Amplituden-Wertebereiche, y-Achse: Prozentangaben). Wie unterscheiden sich die ADVs der einzelnen Dateien? Aus dem Histogramm läßt sich auch ablesen, wie gut die Aufnahmen ausgesteuert sind und ob das Signal einen DC-Offset hat. Wie?
[ nach oben ] [ Website-Navigation ]
3.2 Phoneme sind die kleinsten bedeutungsunterscheidenden Elemente einer Sprache. In dieser Übung werden wir sogenannte Minimalpaare, d.h. Wörter, die sich genau in einem Phonem unterscheiden, suchen, diese aufzeichnen und die Oszillogramme, d.h. die Zeitsignale, segmentieren und vergleichen. Genaugenommen sind es nicht immer Minimalpaare, sondern oft Tripel und Quadrupel etc. die sich jeweils an einer Stelle unterscheiden (vgl. Anne vs. Amme vs. Affe vs. Asche etc.). Wer findet die meisten Varianten? Alle Beispiele von jedem Gruppenmitglied sprechen lassen!!!
Die "Minimalpaare" sollen folgendes Aussehen haben ("C" steht hier für Konsonant, "V" für Vokal):
Am besten plaziert man alle Beispiele zu einem Bildungsmuster in einer Datei, das erleichtert den Vergleich.
[ nach oben ] [ Website-Navigation ]
"Segmentieren", d.h. die Lautgrenzen markieren, werden wir mit dem Labeltool in PRAAT (Praat objects->Label & segment->To TextGrid). Das Grid dann mit dem Wave-File zusammen für spätere Anwendungen abspeichern (mit dem Cursor Wave und TextGrid invertieren, unter "Write->Write to binary file" als "praat.Collection" abspeichern, eindeutigen Namen vergeben!).
Wenn sämtliche Beispiele markiert sind, wollen wir die Unterschiede zwischen den Vokalen, bzw. Konsonanten im Oszillogramm untersuchen.
[ nach oben ] [ Website-Navigation ]
In welchen Merkmalen unterscheiden sich die von euch gewählten Konsonanten und wie drücken sich diese im Oszillogramm aus? Beachtet besonders genau die Übergänge V->C C->V. Welche Artikulationsart, bzw. -stelle bezeichnet die von euch gewählten Konsonanten? Am besten probiert man das an sich selbst aus, d.h. die Lautfolge langsam sprechen und darauf achten, wie sich die Zungen im Rachen bewegt (vor->zurück, hoch->tief) etc.
Wie unterscheiden sich die von euch gewählten Vokale (Zungenposition, Länge ->ausmessen, Lippenrundung +/-)? Vergleicht die Oszillogramme verschiedener Sprecher, ähneln sich diese für den gleichen Laut?
Protokoll: Beispiele als Text und Transkription, Plot der Beispiele (mit TextGrid) und Wave-Audio, kurze Beschreibung zu den Eigenschaften der variierten Laute. Plots der Lautübergänge mit den gemachten Beobachtungen.
[ nach oben ] [ Website-Navigation ]
Informationen zu dieser Seite:
Letzte Änderung: 29-Juli-2006
URL dieser Seite: http://public.beuth-hochschule.de/~mixdorff/Processing/uebung2
•Seitenende•