J'essaie de faire un test F sur l'importance conjointe des effets fixes (variables fictives individuelles) sur une régression OLS de données de panel (en R), mais je n'ai pas trouvé un moyen d'y parvenir pour un grand nombre d'effets fixes . Idéalement, je voudrais utiliser une fonction dans le paquet plm, mais je n'ai pas trouvé quelque chose qui fait spécifiquement ce test. C'est quelque chose que Stata fait automatiquement lorsque vous utilisez la commande xtreg, fe. Dans Stata, les résultats ressemblent à ceci: Encore une fois, j'essaie de reproduire le résultat de Stata dans R pour un grand nombre de variables fictives, peut-être spécifiées par factor (us. state) en utilisant lm () ou model fe en utilisant plm (). Voici un exemple reproductible: qui est équivalent à ce qui suit dans la régression en utilisant le paquet plm. Ainsi, le test serait le test que toutes les variables fictives d'état sont conjointement différentes de zéro (conjointement significatif). Il s'agit d'une restriction linéaire sur le modèle sans restriction (reg1 et reg1.fe ci-dessus). Ce test F est mieux expliqué dans le document suivant (voir diapositives 5-7). Voici une de mes faibles tentatives de création d'une matrice R pour le test F avec hypothèse nulle: Rb q où b est la matrice des coefficients (chapeau bêta), et q est un vecteur de zéros. Cela ne fonctionne pas Et, j'espère qu'il existe une approche simplifiée pour tester l'importance conjointe de toutes les variables fictives à effet fixe. Tout d'abord, j'aimerais suggérer que votre question pourrait être améliorée en fournissant un exemple reproductible et en décrivant le test précis auquel vous vous référez quand vous dites «test F». Un lien vers les documents Stata peut-être F est la distribution, donc il peut y avoir un gazillion tests appelés un test F. Si votre intérêt de fond réside dans le fait de déterminer si le modèle d'effets fixes s'adapte mieux aux données que les MCO sans effets fixes, vous pouvez toujours utiliser un test de rapport de vraisemblance. Im sûr il ya beaucoup d'implémentations dans R, mais celui fourni par le paquet lmtest est assez commode. Heres un exemple en utilisant un ensemble de données distribué avec le paquet plm (vous semblez avoir installé, il devrait donc être facile à essayer). Je pense que la fonction pFtest () de plm39s peut faire ce que vous voulez (voir ma réponse éditée). Le résultat n'est pas exactement le même que votre sortie Stata, ce qui est probablement dû au fait que le premier paramètre de la distribution F est différent. Mais quand j'installe les deux modèles individuellement avec lm (), je reçois des degrés de liberté de 543 et 498 (différence de 45), donc R semble juste ici. Voir si vous obtenez les mêmes degrés de liberté dans Stata lorsque vous ajustez la mise en commun et dans les modèles individuellement. Le problème avec le logiciel fermé de source comme Stata est we39ll ne sait jamais exactement comment ils calculent leur test de F. Ndash Vincent May 30 11 at 3:50 Je ne pense vraiment pas que ce test est utile du tout. Pourquoi pas un modèle hiérarchique? Le modèle hiérarchique (ou le modèle de pooling partiel) permettra à vos estimations de se rétrécir à la moyenne commune pour les états, mais sans imposer Leur égalité. Morevoer, si vous avez besoin d'évaluer combien d'états varient, vous avez juste besoin d'utiliser la variance estimée entre l'état et intra-état. Si la variance entre l'état est faible (près de zéro), que vous arent gagnant tellement en utilisant un modèle hiérarchique et les interceptions sont à peu près les mêmes. Si la variance est très grande (dans la limite, quand elle passe à l'infini), le modèle hiérarchique ajoute peu et vous pouvez exécuter un modèle séparé pour chaque état. Vous pouvez estimer un modèle hiérarchique en R avec le paquetage lme4. Utilisation de vos données: L'écart-type estimé de l'interception par états est de 4,39 et l'écart-type par individu est de 4,19.Stata: Analyse de données et logiciel statistique Kristin MacDonald, StataCorp Les commandes d'estimation fournissent au test ou z test pour l'hypothèse nulle qu'un coefficient Est égal à zéro. La commande de test peut effectuer des tests de Wald pour des hypothèses linéaires simples et composites sur les paramètres, mais ces tests de Wald sont également limités aux tests d'égalité. Tests t unilatéraux Pour effectuer des tests unilatéraux, vous pouvez d'abord effectuer le test Wald correspondant à deux faces. Ensuite, vous pouvez utiliser les résultats pour calculer la statistique de test et la valeur p pour le test unilatéral. Letrsquos dire que vous effectuez la régression suivante: Si vous souhaitez tester que le coefficient sur le poids. Bêta. Est négatif (ou positif), vous pouvez commencer par effectuer le test de Wald pour l'hypothèse nulle que ce coefficient est égal à zéro. Le test de Wald donné ici est un test F avec 1 degré de liberté de numérateur et 71 degrés de liberté de dénominateur. La distribution de Student est directement liée à la distribution de F en ce que le carré de la distribution de Student avec d degrés de liberté est équivalent à la distribution de F avec un degré de liberté de numérateur et des degrés de liberté de dénominateur. Tant que le test F a un degré de liberté de numérateur, la racine carrée de la statistique F est la valeur absolue de la statistique t pour le test unilatéral. Pour déterminer si cette statistique t est positive ou négative, vous devez déterminer si le coefficient ajusté est positif ou négatif. Pour ce faire, vous pouvez utiliser la fonction sign (). Ensuite, en utilisant la fonction ttail () avec les résultats retournés de la commande test, vous pouvez calculer les valeurs p pour les tests unilatéraux de la manière suivante: Dans le cas particulier où vous souhaitez tester si un coefficient est Supérieur, inférieur ou égal à zéro, vous pouvez calculer les valeurs p directement à partir de la sortie de régression. Lorsque le coefficient estimé est positif, comme pour le poids. Vous pouvez le faire de la manière suivante: p-value 0.008 (donné en sortie de régression) p - value 0.5672 0.284 Par contre, si vous voulez effectuer un test tel que H 0. Beta poids lt 1, vous ne pouvez pas calculer la valeur p directement à partir des résultats de la régression. Ici, vous devez d'abord effectuer le test de Wald. Essais z one-sided Dans la sortie de certaines commandes d'estimation, vous trouverez que z statistiques sont rapportées au lieu de t statistiques. Dans ces cas, lorsque vous utilisez la commande test, vous obtiendrez un test chi-squared au lieu d'un test F. La relation entre la distribution normale normale et la distribution du chi carré est similaire à la relation entre la distribution de Student et la distribution de F. En fait, la racine carrée de la distribution chi-carré avec 1 degré de liberté est la distribution normale normale. Par conséquent, des tests unilatéraux z peuvent être effectués de manière similaire à des tests t unilatéraux. Par exemple, ici, la commande test renvoie r (chi2). Qui peut être utilisé avec la fonction normal () pour calculer les valeurs p appropriées. Enfin, si vous voulez effectuer un test d'inégalité pour deux de vos coefficients, tels que H 0. Beta âge gt bêta grade. Vous devez d'abord effectuer le test de Wald suivant: Calculez ensuite la valeur de p appropriée: Encore une fois, cette approche (en effectuant un test de Wald et en utilisant les résultats pour calculer la valeur de p pour un test unilatéral) Statistique a 1 degré de liberté dans le numérateur ou le Wald chi-carré statistique a 1 degré de liberté. Les relations de distribution discutées ci-dessus ne sont pas valides si ces degrés de liberté sont supérieurs à 1.
No comments:
Post a Comment