Wie entscheide ich, wann datenaufbereitung zu viel zeit frisst?
#1
Ich stehe gerade vor einer kniffligen Entscheidung bei einem Projekt und wollte mal fragen, ob jemand ähnliches durchgemacht hat. Wir haben monatelang Daten gesammelt und aufbereitet, aber jetzt, wo es ans eigentliche Modellieren geht, frage ich mich, ob wir nicht zu viel Zeit in die Vorverarbeitung gesteckt haben. Irgendwie habe ich das Gefühl, dass die Perfektionierung der Eingabedaten uns von der eigentlichen Fragestellung entfernt. Wie geht ihr damit um, wenn ihr merkt, dass ihr in der Datenaufbereitungsphase feststeckt?
Zitieren
#2
Ja, das kenne ich gut. Man sitzt in der Datenaufbereitung fest, weil jede neue Feature Idee sofort das Signal verbessern soll, und am Ende kommt man nicht mehr zum eigentlichen Modellieren. Wichtig ist, sich daran zu erinnern, dass saubere Eingaben hilfreich sind, aber kein Ersatz für Experimente.
Zitieren
#3
Ich bin da eher skeptisch. Perfektion in der Vorverarbeitung ist oft Self Deception, die eigentliche Fragestellung schmilzt langsam dahin. Vielleicht lohnt es sich, gezielt mit einem belastbaren Basissatz zu starten statt weiter an der Eingabeseite zu perfektionieren.
Zitieren
#4
Setze dir eine klare Frist. Zwei Wochen für Datenaufbereitung, danach rennt der Prototyp. Man sammelt Daten, aber Modelle brauchen eine Frage, keine endlose Puzzleteile.
Zitieren
#5
Welche Frage soll das Modell überhaupt beantworten? Ich probiere oft die Problemstellung neu zu rahmen statt die Daten zu perfektionieren. Vielleicht ist der Kern die Messlatte der Evaluation.
Zitieren
#6
Gut genug ist oft schon gut genug. Weitergehen, bevor man sich in der Hall of Fame der Cleanliness verliert.
Zitieren
#7
Ich würde mit einem Basissatz starten und dann schrittweise erweitern, so dass jede Veränderung am Modell auch eine Veränderung am Ergebnis nachweist.
Zitieren
#8
Manchmal ist der Versuch kein Misserfolg, sondern ein Umweg, der eine andere Frage sichtbar macht
Zitieren


[-]
Schnellantwort
Nachricht
Geben Sie hier Ihre Antwort zum Beitrag ein.

Bestätigung
Bitte den Code im Bild in das Feld eingeben. Dies ist nötig, um automatisierte Spambots zu stoppen.
Bestätigung
(Keine Beachtung von Groß- und Kleinschreibung)

Gehe zu: