Ich stehe gerade vor einem Problem bei meinem aktuellen Projekt und wollte mal fragen, ob das jemandem ähnlich geht. Ich versuche, aus einer Reihe von Kundengesprächen, die wir als Audio aufgezeichnet haben, sinnvolle Muster abzuleiten. Die Rohdaten sind aber ein riesiges Chaos aus verschiedenen Dialekten, Hintergrundgeräuschen und Themenwechseln. Ich habe das Gefühl, ich verbringe mehr Zeit mit dem Säubern und Sortieren dieser Audioaufnahmen als mit der eigentlichen Analyse. Irgendwie fehlt mir der richtige Ansatz, um aus diesem unstrukturierten Material überhaupt erst brauchbare Features zu machen. Wie geht ihr mit so etwas um, wenn ihr kaum strukturierte Daten habt?
Das klingt echt frustrierend Der ganze Lärm und die Dialekte machen Mustererkennung zu einer Geduldsprobe Manchmal reicht schon eine grobe Orientierung statt einer perfekten Sauberkeit
Eine analytische Idee wäre in kurze Segmente zu arbeiten Dann die akustischen Merkmale wie Energie Spektrum Formanten und Sprechtempo extrahieren und diese Features über die Zeit vergleichen So lassen sich trotz Rauschen wiederkehrende Muster sichtbar machen
Skeptisch könnte man sagen ob das überhaupt klappt Vielleicht ist das Chaos zu groß um brauchbare Muster zu extrahieren Und manchmal reicht es zu akzeptieren dass einige Gespräche sich nicht in Features fassen lassen
Vielleicht reicht es auch den Blick umzudrehen Und statt Musterzuordnungen die Daten als Experiment zu behandeln So entsteht Spielraum fuer Hypothesenwechsel und neue Rahmungen