WOODRIDGE – exemples et exercices du chapitre 2

bonjour

je vous aide pas à pas à avancer avec SAS et le livre d’introduction à l’économétrie , toutes les question se posent dans les commentaires et on vous répond dans les 48 heures

 

Catherine baron –  Révisions Econometrics Woodbridge été 2016  

Ch1 –

 

 

–          c1chapitre1

 

Procédure MEANS

Variable Libellé N Moyenne Ecart-type Minimum Maximum
educ
wage
_female
educ
wage
female
526
526
526
12.5627376
5.8961027
0.4790875
2.7690224
3.6930860
0.5000380
0
0.5300000
0
18.0000000
24.9800000
1.0000000

Réponses aux questions C1 chapitre 1

  • niveau d’études moyen dans l’échantillon : 12.5 années d’études (+- 2.76) minimum 0 et maximum 18
  • salaire horaire moyen 5.9 $ , il a un écart type grand de 3.7 soit salaire moyen oscille entre 5.9- 3.7 et 5.9+3.7 soit 2.2 $ de l’heure et 9.6$de l’heure , soit un écart mensuel de 372 à 1622 $
  • nombre de femmes observées dans l’échantillon 47.9%

ch2 :

 

[2.5] E(u) = 0 distribution des facteurs non observés est nulle

[2.6] E(u/x) =E(u) distribution de u étant donné x valeurs espérées de u pour les x

Pour aller plus loin 2.1

Score = note finale dépend de l’assiduité aux cours (attend) et d’autres facteurs u ,

score = b0 +b1 (attend) +u

 

dans quelles circonstances l’équation 2.6  est-elle vérifiée ?

si l’étudiant n’assiste à aucun cours score =b0 +u

E(u) = 0 si les élèves ont tous la même origine éducation, CSP et formation

E(u/x) =E(u) correspond à des étudiants de même origine et parcours scolaire sans différence significative autre que la fréquentation des cours.

 

2.2 dérivation des estimateurs MCO

Le terme d’erreur n’est pas corrélé avec la variable x dans la population

E(u)=0

Cov ((x,u) = E ( x,u) = 0

B1 = Z(y-yi) ( x-xi)   = Cov( x,y)/var(x) avecZ(x=xi)²>0

Z(x-xi)²

B0 = y – B1 x

Exemple 2.4 :

Root MSE 3.37839 R carré 0.1648
Moyenne dépendante 5.89610 R car. ajust. 0.1632
Coeff Var 57.29869  

 

Résultats estimés des paramètres
Variable Libellé DDL Valeur estimée
des paramètres
Erreur
type
Valeur du test t Pr > |t|
Intercept Intercept 1 -0.90485 0.68497 -1.32 0.1871
educ educ 1 0.54136 0.05325 10.17 <.0001

 

wage = – 0.9 + 0.54  educ +u

 

 

pour une année de niveau éduc supplémentaire le salaire augmente de 0.54x 1 = 0.54 pour une personne de niveau d’études est 8 années son salaire est donc en 1976 de -0.9 + 0.54x 8 = 3.42$ de l’heure.

 

Pour aller plus loin 2.2

Si 5.9 $ de 1976 sont 19.06 $ de 2003  ratio est donc de 3.23

Lorsque le niveau d’études est de 8 années le salaire en 2003 est de 3.42 x 3.23 = 11.04 $

Cours suite

 

Exemple 2.5

 

Procédure REG

Modèle : MODEL1

Variable dépendante : voteA voteA

Nb d’observations lues 173
Nb d’obs. utilisées 173

 

Analyse de variance
Source DDL Somme des
carrés
Moyenne
quadratique
Valeur F Pr > F
Modèle 1 41486 41486 1017.70 <.0001
Erreur 171 6970.77364 40.76476
Total sommes corrigées 172 48457

 

Root MSE 6.38473 R carré 0.8561
Moyenne dépendante 50.50289 R car. ajust. 0.8553
Coeff Var 12.64230

 

Résultats estimés des paramètres
Variable Libellé DDL Valeur estimée
des paramètres
Erreur
type
Valeur du test t Pr > |t|
.(bo) Intercept 1 26.81254 0.88719 30.22 <.0001
ShareA(b1) shareA 1 0.46382 0.01454 31.90 <.0001

 

L’équation s’écrit : vote A = b0 + b1 (share A ) est le % total des dépenses du candidat A

Avec b0 = 26.8 ,  b1 = 0,46

Donc l’équation s’écrit  Vote A = 26,1 + 0,46 share A

Avec écarts types respectifs         (088)   ( 0,014)

N= observations = 173

R² = 85% ce qui indique que les résultats sont fiables à 85% , on a cette réponse dans 85% de l’échantillon.

Ce qui veut dire que  1% de dépenses supplémentaires entraine une augmentation de 0,46%de voix pour le candidat A.

La question sur l’effet causal ?  je ne saisis pas le sens de cette question ?

Pour aller plus loin 2.3 dans l’exemple 2.5 quel est l’estimation du % de vote que le candidat A capte si shareA =60

Réponse :

L’équation est : voteA = 26.1 + 0.46* shareA soit 26.1 + 0,46* 60 soit 26.1+ 27.6= 53.7 % de votes pour A s’il engage 60% des dépenses . Plus on dépense plus on a de chances d’être élu .

Valeur observée = valeur ajustée + résidu

SCT= SCE +SCR

 

R² SCE/SCT = 1 –(SCR/SCT)

100R² est le % de la variation de y expliqués par x au sein de l’échantillon.

 

Pour aller plus loin 2.3 dans l’exemple 2.5 quel est l’estimation du % de vote que le candidat A capte si shareA =60

Réponse :

L’équation est : voteA = 26.1 + 0.46* shareA soit 26.1 + 0,46* 60 soit 26.1+ 27.6= 53.7 % de votes pour A s’il engage 60% des dépenses . Plus on dépense plus on a de chances d’être élu .

Valeur observée = valeur ajustée + résidu

SCT= SCE +SCR

 

R² SCE/SCT = 1 –(SCR/SCT)

100R² est le % de la variation de y expliqués par x au sein de l’échantillon.

Exemple 2.8 permet de voir que R² = 0,0132 ce qui veut dire que 98,68 % du salaire des PDG est expliqué par autre chose que les variables intégrées dans l’équation suivante : salaire= constante+ x * rendement des capitaux propres. En effet le salaire des PDG ne tient pas compte que de ce rendement .

 

Exemple 2.9 reprenons le vote A = b0 + b1 * shareA le R² est de 0,856 cela indique que les dépenses des candidats expliquent 85,6%des votes pour A ;( belle démocratie !)

 

Changements d’unités : voir fiche ci dessous :

Modèle Variable y à expliquer Variable x explicative Interprétation de β1 (unités)
Niveau- niveau Y X  

∆ y = β1  x ∆ x

 

Niveau – log Y .log (x) ∆y = (b1/ 100 )( %∆x)

 

log – niveau log y x %∆y = (100 ∆ β1) ∆ x

 

log – log log y  log x %∆Y = β1 .% ∆ X

 

 

Absence de biais :

 

Hypotheses RLS 1 à5 ???

 

1 – β0 et β1 sont la cste et la pente dans y = β0 +β1 x +u  [2.47]

2 – échantillon aléatoire issu de la population

3 – les éléments xi n’ont pas tous la même valeur

4 – E(u/x) =0 quelle que soit la valeur de x

Le fait que E(u/x) soit  nul … implique que ui et xi sont non corrélés et donc indépendants ? c’est mon idée

Cette hypothese 4 st déterminante et permet de savoir si la methode des MCO permet d’obtenir des estimateurs sans biais. Je n’ai pas compris le théorème 2.1 ?

Théorème 2.1

E (β^0)=β0 et E(β^1) = β1

Quelle que soient les valeurs de β0 et β1  ce qui veut dire que les estimateurs β^0 etβ^1 sont sans biais de β0 et de β1

 

On voit avec l’exemple 2.12 que la correlation des x avec u biaise les résultats de l’étude exemple 2.12

 

Variance des estimateurs des MCO :

 

5- variance de l’erreur u est constante quelle que soit la valeur de x soit  Var(u/x) = ²

C’est donc la dispersion de l’erreur  qui est regardée ici comme constante  variance de l’erreur ou variance des perturbations . est aussi ce qu’on appelle  homoscédasticité.

Lorsque Var (u/x) dépend de x alors on n’a pas homoscédasticité mais hétéro scédasticité

 

Un exemple pour bien comprendre :

Exemple 2.13

 

En effet wage = β 0 +β1 * educ +u

si on veut obtenir un estimateur sans biais,de l’effet TCEPA, de educ sur wage, Nous devons poser hypothese queE(wage/educ) = β 0 +β1 ,  en faisant appel a l’homoscédasticité on a

Var (u/educ) =  ne dépend pas du niveau d’éduc , soit Var (wage/educ) =   les écarts de salaires autour du salaire moyen doivent  rester inchangés quelque soit le niveau d’instruction ce qui est étonnant ‼

Exercice c1 chapitre 2 woodridge

Enoncé les données 401k.raw sont ici , on cherche à expliquer la participation des travailleurs au plan d’épargne pension ; la variable y prate  est le taux le participation des travailleurs est le % de travailleurs qui ont ouvert un compte épargne pension, mrate est la variable x qui caractérise la générosité de l’entreprise au plan épargne pension, si mrate = 0,50 cela indique que pour un dollar du travailleur l’entrepise donne 0,50 dollar.de contribution ;

  1. calcul du taux de participation moyen et contribution moyenne ( proc means)

attention vérifier que les variables sont numériques et bien écrire le libellé des variables telles que _mrate et prate ‼

 

 

exo_c1ch2ci_moyennes

 

  1. Procédure MEANS
Variable Libellé N Moyenne Ecart-type Minimum Maximum
_mrate
Prate
mrate
prate
1534
1534
0.7315124
87.3629074
0.7795394
16.7165374
0.0100000
3.0000000
4.9100000
100.0000000

Ce qui se traduit par :

 

87.36% des travailleurs sur les 1534  entreprise  il y a 87.36% des travailleurs qui on un plan et il ya 78 des entreprises qui contribuent.

Ii ) equation prate = y = β0 +β1 mrate +u :

Cela donne proc reg data= exo401k ;

Model  prate= mrate ; run ;

Nb d’observations lues 1534
Nb d’obs. utilisées 1534

 

Analyse de variance
Source DDL Somme des
carrés
Moyenne
quadratique
Valeur F Pr > F
Modèle 1 32002 32002 123.68 <.0001
Erreur 1532 396384 258.73617    
Total sommes corrigées 1533 428386      

 

Root MSE 16.08528 R carré 0.0747
Moyenne dépendante 87.36291 R car. ajust. 0.0741
Coeff Var 18.41202    

 

Résultats estimés des paramètres
Variable Libellé DDL Valeur estimée
des paramètres
Erreur
type
Valeur du test t Pr > |t|
Intercept .β0 1 83.07546 0.56328 147.48 <.0001
_mrate .β1 1 5.86108 0.52701 11.12 <.0001

 

 

 

L’équation s’écrit : prate = 83.07 + 5.86 mrate + u :

avec les écart types ( entre parentheses ici dessous)

(0.563)   (0.52)

Donc quand mrate = 3.5 on obtient prate = 83.07+5.86*3.5 = 103.58

Avec 1534 individus et R² =0.074ce qui est peu , seulement 7 % des prate sont expliqués par mrate.

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *