Zeige Ergebnis 1 bis 6 von 6
  1. #1
    Community-Forum Benutzerbild von Benrath
    Registriert seit
    Mai 2003
    Beiträge
    15.296
    Likes
    1061

    Fragebogen Daten reinigen

    ALso ich versuchs einmal hier, auch wenn es wohl dafür keine schönere Lösung als manuelle Korrektur gibt.

    Ich hab blöderweise Fragebögen die nach Typen unterscheiden in eine Reihe erhalten, wo einzelne Fragen sich über die Fragebögentypen gleichen.
    Beispiel
    Firma Var1_A Var2_A Var2_B
    Schmidt 4 5 NA
    Meier 4 3 3

    Das kann ich in ne Art Long Datensatz mit Typ als Variable umwandeln

    Firma Typ Var1 Var2
    Schmidt A 4 5
    Schmidt B NA NA
    Meier A 4 3
    Meier B NA 3

    Jetzt kann ich mit einer anderen Datenbank abgleichen ob der Typ der Firma wirklich der ist den sie ausgefülllt bzw. angeben haben.

    Der einfach Fall ist bei "Meier" die beides ausgefüllt haben obwohl sie nur eins hätten ausgefüllt haben. Ich behalte einfach nur die Reihen für die gilt Typ== True.Typ und gut ist.

    Blöder ist der Fall für "Schmidt", die für Typ= A ausgefüllt haben, obwohl sie Typ= B sind. Jetzt könnte ich das identifizieren, aber sehe gerade keine schöne Variante, wie ich die falsche Zeile lösche und die richtige behalte als der neue Typ.

    Im Endeffekt ist es dann einfacher, wenn mein Hiwi im Fragebogen die Antworten manuell verschiebt.
    Oder hat jemand ne coole Idee? Ist das Problem verständlich erklärt?
    Geändert von Benrath (30. April 2018 um 14:11 Uhr)
    "Wenn ihr nicht wisst wovon ihr redet, sprecht von einem System."


    "Wenn jeder an sich denkt, ist an alle gedacht !"

    "wollen wollen ist die höchste Form der Unterdrückung"


  2. #2
    Benutzerbild von BaBaUTZ
    Registriert seit
    Aug 2000
    Beiträge
    852
    Likes
    230
    Wenn ich richtig verstanden habe, wird für Schmidt zunächst per Abgleich heraus gefunden, dass sein wahrer Typ B ist, daraufhin soll der Datensatz entsprechend angepasst werden. Ich würde intuitiv per for/foreach Schleife alle Variablen abklappern und den Wert von A zu B kopieren, falls B einen Fehlwert aufweißt und A nicht. In welchem Dateiformat liegen die Datensätze vor?

  3. #3
    Community-Forum Benutzerbild von Benrath
    Registriert seit
    Mai 2003
    Beiträge
    15.296
    Likes
    1061
    Excel, bzw ändere die Daten jetzt in R

    Hab mir jetzt was überlegt, wie ich die Anzahl der Fälle eingrenzen kann, weil eigentlich jeder nur einen Fragebogentyp hätte beantworten sollen. jetzt sind es 20+ Fragebögen die man korrigieren muss, die so offensichtliche Fehler haben, dass die identische Frage aus mehreren Typen beantwortet wurde, aber auch so dume Fehler hat, dass man zu einem Teil Fragebogen 1 und zu einem anderen Fragebogen 2 ausgefüllt hat... Idioten..


    Ich geh jetzt von wide auf Long um die Fragen die über mehrere Typen identisch sind zu konsolidieren und kann dann wieder auf wide gehen und prüfen, ob die Anzahl Beobachtungen gleich bleibt, daher jeder nur einen Fragebogen ausgefüllt hat. Dann kann ich entweder im Long oder Wide Format den Typ ändern, wenn ich denke, dass er falsch war.
    "Wenn ihr nicht wisst wovon ihr redet, sprecht von einem System."


    "Wenn jeder an sich denkt, ist an alle gedacht !"

    "wollen wollen ist die höchste Form der Unterdrückung"

  4. #4
    Benutzerbild von BaBaUTZ
    Registriert seit
    Aug 2000
    Beiträge
    852
    Likes
    230
    Auch wenn ich den Reiz einer automatisierten Lösung nachvollziehen kann, aber bei 20 Fragebögen sollte eine manuelle Variante doch nicht länger als ne Stunde dauern, oder?

    Als jemand der keine genaue Vorstellung vom Aufbau des Datensatzes hat, würde ich immer noch sagen, meine vorgeschlagene Variante sollte funktionieren. Wenn mal A, mal B ausgefüllt wurde, muss man halt nur vorher prüfen, was leer ist und was nicht, und entsprechend kopieren (mein Vorschlag bezieht sich aufs long Format). Ich persönlich arbeite hauptsächlich mit Stata, kann also leider kein anschauliches Syntaxbeispiel für R liefern (für excel weigere ich mich )
    Geändert von BaBaUTZ (30. April 2018 um 20:00 Uhr)

  5. #5
    Community-Forum Benutzerbild von Benrath
    Registriert seit
    Mai 2003
    Beiträge
    15.296
    Likes
    1061
    Jo ich verfolge jetzt auch die Manuelle Lösung, die falsch ausgefüllten Fragebögen manuelle zu korrigieren, so dass tatsächlich nur ein Typ pro Firma verbleibt. Dann ist das anpassen des Typs wenn er falsch ausgefüllt wurde leicht.
    "Wenn ihr nicht wisst wovon ihr redet, sprecht von einem System."


    "Wenn jeder an sich denkt, ist an alle gedacht !"

    "wollen wollen ist die höchste Form der Unterdrückung"

  6. #6
    Benutzerbild von FORYOUITERRA
    Registriert seit
    Jul 2002
    Beiträge
    2.917
    Likes
    2739
    jo bei so wenigen fragebögen würde ich es auch definitiv noch manuell machen, geht schneller als sich einen algorithmus zu überlegen und zu programmieren
    WinterSprinter.de http://wintersprinter.de

Forumregeln

  • Es ist dir nicht erlaubt, neue Themen zu verfassen.
  • Es ist dir nicht erlaubt, auf Beiträge zu antworten.
  • Es ist dir nicht erlaubt, Anhänge hochzuladen.
  • Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.
  •