Datenfusion in der sozialwissenschaftlichen Wahlforschung – Begründeter Verzicht oder ungenutzte Chance? Theoretische Vorüberlegungen, Verfahrensüberblick und ein erster Erfahrungsbericht

Johann Bacher, Dimitri Prandner

Abstract

Datenarchive stellen umfangreiches Individualdatenmaterial in hoher Qualität zur Verfügung. Theoretisch böte sich damit die Möglichkeit für eine Datenfusion: Auf Ebene der Befragten wird ein neuer Datensatz erzeugt, der Variablen aus unterschiedlichen Datensätzen enthält. Dieses Potential wird in den Sozialwissenschaften aber kaum genutzt. Es existieren nur wenige Ausnahmen, in denen das Verfahren der Datenfusion zur Anwendung kommt.

Der Beitrag geht daher der Frage nach, ob dieser Verzicht begründet ist oder ob dadurch Chancen ungenutzt bleiben. Zur Beantwortung wird zunächst ein formales Modell entwickelt, das aufzeigt, unter welchen Bedingungen eine Datenfusion zu einer Verbesserung oder Verschlechterung der Datenqualität führen kann. Daran anschließend wird ein Überblick zu den Techniken der Datenfusion gegeben, bevor anhand eines konkreten Beispiels aus der Wahlforschung die Frage untersucht wird, ob Datenfusion mit einem der derzeit verfügbaren Standardstatistikpaketen möglich ist und zu welchen Ergebnissen sie führt.

Schlagworte

Datenfusion, Record Linkage, Statistical Matching, Multiple Imputation, Wahlforschung

Volltext:

PDF

Refbacks

  • Im Moment gibt es keine Refbacks