Essays in Panel Data Econometrics

Martin Mugnier

Résumé

This thesis consists of five chapters dealing with some identification, estimation, and inference problems in a class of semiparametric panel data models for econometric analysis. The first four chapters focus on fixed effects models, in which unobserved heterogeneity (to the econometrician) is approximated by introducing latent variables defined on low-dimensional manifolds (relative to the dimension of the data) and whose distribution conditional on the exogenous variables is left unrestricted. In the first chapter, we generalize some of Johnson (2004) and Chamberlain (2010)'s results by showing that the slope parameter in a static binary choice model with three periods or more can be point identified even if the idiosyncratic shocks do not follow the restrictive logistic distribution. We provide a conditional moment restriction, which can be used to obtain an asymptotically normal estimator at the parametric rate, when the number of units diverges to infinity, by applying the Generalized Method of Moments (GMM). We illustrate this new method by revisiting the relationship between budget deficits and reelections studied in Brender and Drazen (2008). The significant positive effect of budget deficits on the probability of reelection is robust to departures from the logistic assumption. In the second chapter, we present identification conditions for a class of nonlinear two-way fixed effects models with heterogeneous coefficients for large and long panels. We provide a fast estimation procedure based on a Gauss-Siedel coordinate-wise gradient descent algorithm which exploits additive separability in the fixed effects. In the semiparametric case, we prove the numerical equivalence of our method to the maximum likelihood estimator, we report considerable gains in execution time without loss in precision with respect to existing packages (e.g., logitfe/probitfe in Stata), and we revisit two empirical applications in innovation (Aghion et al., 2013) and international trade (Helpman et al., 2008). We find significant heterogeneity in estimated slopes for the independent variables in each case. The third and fourth chapters consider a special case of factor models, in which individual factor loadings are assumed discrete. This assumption generates a group structure that can rationalize a wide variety of economic settings (e.g., clubs of countries, trading partners, types of consumers, goods, financial assets). The third chapter proposes a new two-step estimator for the linear model, which has several theoretical and computational advantages. By solving a convex optimization program and using an agglomerative clustering procedure, we generalize Bonhomme and Manresa (2015) and show that the common slope parameter, the fixed effects, and the number of groups can be consistently estimated without a known upper bound on the number of groups while reducing algorithmic complexity to the order of the cube of the number of units against an exponential complexity for the estimator relying on the k-means algorithm. The fourth chapter extends some of these results to a class of nonlinear models for discrete outcomes. The fifth and last chapter proves the asymptotic normality of estimators defined as empirical means of the transform of an empirical cumulative distribution function by an empirical quantile process under much weaker assumptions than what is currently known. One popular example is the “Changes-in-Changes” estimator proposed in Athey and Imbens (2006). Monte Carlo simulations suggest that our assumptions cannot be improved.

Cette thèse comporte cinq chapitres portant sur l'étude de quelques problèmes d'identification, d'estimation et d'inférence au sein de modèles semi-paramétriques pour l'analyse économétrique des données de panel. Les quatre premiers chapitres se concentrent sur une classe de modèles dits « à effets fixes », où l'hétérogénéité inobservée par l'économètre est approximée par des variables latentes de faible dimension (relativement à la taille des données) dont la distribution conditionnellement aux variables exogènes n'est pas restreinte. Dans le premier chapitre, nous généralisons un résultat de Johnson (2004) et Chamberlain (2010) en démontrant que l'identification du paramètre de pente, dans un modèle statique de choix discrets avec hétérogénéité individuelle constante dans le temps et des agents observés plus de deux périodes, reste possible hors du cas restrictif où les erreurs suivent une loi logistique. Nous exhibons une restriction sur un moment conditionnel à partir de laquelle un estimateur asymptotiquement normal à vitesse paramétrique, quand le nombre d'individus tend vers l'infini, est obtenu par la méthode généralisée des moments (GMM). Nous illustrons cette nouvelle méthode en revisitant la relation entre déficits budgétaires et réélections étudiée dans Brender et Drazen (2008). L'effet significatif et positif du déficit budgétaire sur la probabilité de réélection est robuste à une relaxation de l'hypothèse logistique. Dans le second chapitre, nous présentons des conditions d'identification pour une classe de modèles non-linéaires à doubles effets fixes et coefficients hétérogènes séparables lorsque le panel est à la fois long et large. Nous proposons une méthode d'estimation rapide reposant sur une descente de gradient coordonnées par coordonnées exploitant la séparabilité additive des effets fixes. Dans le cas semi-paramétrique, nous démontrons l'équivalence numérique de la méthode avec celle du maximum de vraisemblance, reportons des gains de calcul importants sans perte de précision au regard des méthodes existantes (e.g., logitfe/probitfe dans Stata) et revisitons deux applications empiriques en innovation (Aghion et al., 2013) et commerce international (Helpman et al., 2008). Nous trouvons une hétérogénéité significative des coefficients de pente relatifs aux variables indépendantes dans chacun des modèles. Les troisièmes et quatrièmes chapitres traitent d'un cas particulier de modèles à facteurs où les coefficients individuels associés à chaque facteur temporel sont supposés discrets. Cette hypothèse génère une structure de groupe qui présente un intérêt dans une variété de situations économiques (e.g., clubs de pays, de partenaires commerciaux, types de consommateurs, produits, actifs financiers). Le troisième chapitre propose un nouvel estimateur en deux étapes pour le modèle linéaire qui présente un certain nombre d'avantages théoriques et computationnels. Grâce à la résolution d'un problème convexe et l'utilisation d'une procédure agglomérative, nous généralisons Bonhomme et Manresa (2015) en montrant que le paramètre de pente, les effets fixes, et le nombre de groupes peuvent être estimés de manière convergente sans borne supérieure connue sur le nombre de groupes, tout en réduisant la complexité algorithmique à l'ordre du nombre d'individus au cube contre une complexité exponentielle pour l'estimateur reposant sur l'algorithme des k-means. Le quatrième chapitre étend certains de ces résultats à une classe de modèles non-linéaires discrets. Le cinquième et dernier chapitre démontre la normalité asymptotique d'estimateurs s'exprimant comme la moyenne empirique d'une transformation d'une fonction de répartition empirique par un quantile empirique sous des hypothèses plus faibles que les existantes. Un exemple est l'estimateur « Changes-in-Changes » pour l'effet de traitement moyen proposé dans Athey et Imbens (2006). Des simulations de Monte Carlo suggèrent que nos hypothèses ne sont pas améliorables.

Essays in Panel Data Econometrics

Essais en économétrie des données de panel

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager