Was ist der richtige umgang mit ausreißern in der datenanalyse?
#1
Ich sitze gerade über meinen Daten und frage mich, ob ich mir vielleicht zu viele Gedanken über Ausreißer mache. In meiner letzten Analyse habe ich einen Punkt entfernt, der mir einfach falsch vorkam, aber jetzt plagt mich das Gefühl, dass ich vielleicht zu subjektiv gehandelt habe. Wo zieht man da die Grenze zwischen berechtigter Bereinigung und dem Verfälschen der eigentlichen Geschichte, die die Daten erzählen?
Zitieren
#2
Ausreißer entfernen ist kein Verbrechen, solange die Entscheidung nachvollziehbar begründet ist und die Geschichte der Daten nicht verzerrt wird. Prüfe zuerst, ob der Punkt offensichtlich fehlerhaft gemessen wurde oder ob er aus legitimer Varianz stammt. Dann dokumentiere die Entscheidung in der Methodenbeschreibung und führe eine Sensitivitätsanalyse durch, damit sichtbar wird, wie stark sich Ergebnisse verändern, wenn der Punkt dabei bleibt oder nicht. Wichtig ist Transparenz. Es geht nicht darum, die Daten zu perfektionieren, sondern zu verstehen, wie robust deine Befunde sind.
Zitieren
#3
Es fühlt sich manchmal an, als würde man dem Bauchgefühl der Zahlen folgen und das Ergebnis entsprechend formen. Der Gedanke, den Ausreißer doch zu belassen, statt ihn zu entfernen, macht dich nervös, weil du befürchtest, die Geschichte zu verfälschen. Vielleicht hilft es, kurz innezuhalten und zu prüfen, ob der entfernte Punkt wirklich eine Ausnahme war oder ob er eine andere Geschichte erzählt, die die Daten ernst nimmt.
Zitieren
#4
Vielleicht meinst du, Ausreißer seien einfach stumme Fehlerquellen, die man mit einem Mausklick wegwischen kann. In Wirklichkeit klingen Ausreißer oft wie versteckte Hinweise, dass irgendwo ein Mechanismus fehlt oder der Messprozess eine andere Regel hat. Wenn du den Punkt entfernst, zwingst du die Geschichte in eine Form, die sie so nicht hat. Vielleicht erzählt sie nachher etwas ganz anderes als vorher gedacht.
Zitieren
#5
Ich frage mich, ob wir die Gier nach sauberen Ergebnissen wirklich brauchen oder ob Ausreißer einfach Teil der Wahrheit sind?
Zitieren
#6
Vielleicht lohnt es sich, das Thema aus einer anderen Perspektive zu betrachten. Anstatt Ausreißer zu entfernen könnte man Gewichte setzen oder robuste Maße verwenden, die nicht von einzelnen Punkten getrieben werden. So erzählt die Geschichte der Daten immer noch eine Wahrheit, nur gefiltert oder gewichteter. Es ist eine Frage der Perspektive, nicht der Moral.
Zitieren


[-]
Schnellantwort
Nachricht
Geben Sie hier Ihre Antwort zum Beitrag ein.

Bestätigung
Bitte den Code im Bild in das Feld eingeben. Dies ist nötig, um automatisierte Spambots zu stoppen.
Bestätigung
(Keine Beachtung von Groß- und Kleinschreibung)

Gehe zu: