Implementing Rubins Alternative Multiple Imputation Method for Statistical Matching in StataReport as inadecuate




Implementing Rubins Alternative Multiple Imputation Method for Statistical Matching in Stata - Download this document for free, or read online. Document in PDF available to download.

1 CES - Centre d-économie de la Sorbonne

Abstract : This paper introduces two new commands, smpred and smmatch, that implement the statistical matching procedure proposed by Rubin 1986. The purpose of statistical matching in Rubin-s procedure is to generate a single dataset from various datasets, where each dataset contains a specific variable of interest and all contain some variables in common. For two variables of interest that are not observed jointly for any unit, smpred generates the predicted values of each as a function of the other variable of interest and a set of control variables by assuming a partial correlation value defined by the user between the two variables of interest while current programs assume that they are conditionally independent given the control variables. The smmatch command, on the other hand, matches observations of different datasets according to their predicted values using a minimum distance criterion conditional on a set of control variables, and it imputes the observed value of the match for the missing.

Résumé : Cet article introduit deux nouvelles commandes, smpred et smmatch, qui implémentent la procédure d-appariement statistique de Rubin 1986. La procédure de Rubin consiste à générer une seule base de données à partir de plusieurs, où chaque base de données contient une variable d-intérêt spécifique et tous contiennent des variables en commun. Pour deux variables d-intérêt qui ne sont pas observées conjointement dans la même base de donnée, smpred génère la valeur prédite de la variable d-intérêt en fonction de l-autre variable d-intérêt et des variables de contrôle en supposant une valeur définie par l-utilisateur de la corrélation partielle entre les deux variables d-intérêt alors que les programmes actuels supposent que ces deux variables sont conditionnellement indépendantes. La commande smmatch apparie les observations des différentes bases de données selon les valeurs prédites en se basant sur la distance minimale conditionnellement à un ensemble de variables de contrôle et ensuite smmatch impute la valeur observée de « l-appariée » à la variable manquante.

en fr

Keywords : data combination missing data multiple imputation statistical matching

Mots-clés : appariement de données appariement statistique combinaison de données imputation multiple smmatch smpred





Author: Anil Alpman -

Source: https://hal.archives-ouvertes.fr/



DOWNLOAD PDF




Related documents