Ich stecke gerade in einem Projekt fest, wo ich versuche, aus einer riesigen Menge an unstrukturierten Kundentexten sinnvolle Muster zu extrahieren. Eigentlich dachte ich, mit ein paar gängigen NLP-Methoden komme ich da durch, aber die Qualität der Ergebnisse schwankt so stark, dass ich mir nicht sicher bin, ob mein Ansatz überhaupt stimmt. Besonders bei der Erkennung von impliziten Stimmungen hapert es immer wieder. Vielleicht liegt es an meiner Vorverarbeitung oder ich übersehe etwas Grundlegendes. Hat jemand ähnliche Erfahrungen gemacht, als er versucht hat, aus solchen Daten brauchbare Erkenntnisse zu gewinnen?
Ich kenne das nur zu gut wenn die Ergebnisse bei der Stimmungserkennung durch unstrukturierten Text wackeln und sich das wie Nebel anfühlt.
Vielleicht liegt es an der Vorverarbeitung und an der Wahl der Repräsentation TFIDF oder Embeddings die Domäne trifft es oft nicht.
Du willst implizite Stimmungen erkennen und glaubst der Text trägt die Stimmung in sich doch Muster im Satzbau oder in der Wortwahl könnten das Signal überdecken.
Wärst du bereit die Frage zu stellen ob das Projekt eigentlich die richtige Zielsetzung hat oder ob man lieber nach Themen statt Stimmungen suchen sollte?
Ich bleibe skeptisch gegenüber Standardmethoden aus der Stimmungsanalyse wenn der Kontext fehlt und frage mich ob eine Mischung aus Regeln und gelernten Merkmalen wirklich hilft.
Vielleicht lohnt es sich das Thema neu zu rahmen und nicht nach Stimmungen zu suchen sondern nach Spannungen oder Widersprüchen im Text.