PREUPOTO DO MODELO DE REGREÃO A aplcação do modelo de regressão lnear múltpla (bem como da smples) pressupõe a verfcação de alguns pressupostos que condensamos segudamente.. Os erros E são varáves aleatóras de méda zero;. Os erros E são varáves aleatóras de varânca constante (σ ) hpótese de homocedastcdade; 3. As varáves aleatóras E, E,, E n são ndependentes; 4. As varáves explcatvas X, X,, X k são não correlaconadas hpótese de ausênca de multcolneardade entre as varáves explcatvas; Para conduzr os testes de hpóteses que abordaremos segudamente, necesstamos anda do segunte pressuposto: 5. Os erros E seguem uma dstrbução normal: E ~ N(, σ ).
PROPRIEDADE DO ETIMADORE DO MÍNIMO QUADRADO O método dos mínmos quadrados fornece estmatvas pontuas b, b,...,b k para,,..., k Os estmadores que fornecem estas estmatvas são ( ) Y X X X T T k ˆ ˆ ˆ ˆ M
Verfcadas as hpóteses do modelo (referdas anterormente) pode-se mostrar que os estmadores ˆ ˆ,..., ˆ, k são tas que: E ˆ,...,k; ( ) Var ˆ σ c ( ) onde c é o elemento dagonal da lnha + da matrz ( ) X T X. Na regressão smples estas varâncas podem ser dadas por: Var ( ˆ ) σ e Var( ˆ ) n n x n x n x σ n x nx Cada ˆ tem dstrbução normal: ˆ ~ N(, σ c ) 3
Como, em geral, σ é desconhecdo estmamos Var( ˆ ) por ˆ que se obtém substtundo nas formulas anterores σ pelo seu estmador, E n k Então, ˆ c E n k c 4
TETE DE IPÓTEE TETE OBRE O COEFICIENTE DE REGREÃO Ocasonalmente, poderá ser de suspetar que uma varável explcatva partcular X não é muto útl, sto é, que a sua nfluênca sobre a varável dependente não é sgnfcatva. Para saber se é este o caso, testamos a hpótese nula de que o coefcente para esta varável é nulo: : : abemos que ˆ ~ N(, ˆ σ c),.e. ~ N(,) c σ. 5
ˆ Temos então ~ N(,). σ c Como σ é desconhecdo, substtuímos σ pelo seu estmador ANÁLIE DE REGREÃO E vndo, n k ˆ c ~ t nk. ˆ A estatístca do teste, se é verdadera ( : ), é: ~ t nk c e for rejetada então temos evdênca de que, sto é, a varável explcatva X é útl na predção do valor da varável dependente. e não for rejetada então a varável explcatva X é geralmente retrada da equação de regressão pos não nfluênca sgnfcatvamente a varável resposta Y. 6
7 Mas geralmente, podemos testar a hpótese nula de que o coefcente seja gual a um determnado valor : : : A estatístca do teste, se é verdadera, é: ~ ˆ k n t c. Poderam também ser conduzdos testes unlateras em vez de testes blateras: : : > : : <.
Exemplo ANÁLIE DE REGREÃO Recordemos o exemplo em que se pretende estudar a relação entre o volume de vendas (Y) efectuadas durante um dado período de tempo por um vendedor, os seus anos de experênca (X ) e o seu score num teste de ntelgênca (X ). Com os dados: Vendedor Vendas (Y) Anos de experênca (X ) core no teste de ntelgênca (X ) 9 6 3 6 5 3 4 3 4 3 5 3 4 6 5 3 3 7 8 6 3 8 9 7 4 4 8
9 Obtém-se:, 4 7 8 5 3 3 4 6 9, 4 3 6 3 3 4 3 5 3 6 y X ( ) X X T 64 8 4 8 6 56 4 56 776 944 e ( ) X X T ( ) y X T.338983.745763.67.
Testes para o Exemplo ANÁLIE DE REGREÃO - Vamos testar a hpótese nula do coefcente de regressão assocado a X ser zero. póteses: : : ˆ ˆ ob, T ~ t n k,.e ~ t7. c c Já calculámos anterormente o valor do E (E 7.4835). Então, tem-se: E 7.4835. 69. n k
.69. 3393. 6 c.3393. 666 ˆ. 944 ANÁLIE DE REGREÃO Como o teste é blateral, para o cálculo dos pontos crítcos procura-se t α / tal que α P ( T t α / ). 5 t α /. 365. RC ]-, -.365] [.365, + [.745765 T obs. 86 RC, logo rejetamos..666 Ao nível de sgnfcânca de.5, há pos evdênca para conclur que a varável anos de experênca é útl na predção do volume de vendas, ou seja, a varável X contrbu para a explcação do volume de vendas de um vendedor.
- Vamos verfcar se se pode rejetar a hpótese nula do coefcente ser nulo. póteses: : : ˆ ob, T ~ t7 c 3 ˆ Tem-se: 776 c.3393. 9374 ˆ. 944 RC ]-, -.365] [.365, + [..67 T obs. 8 RC, logo não rejetamos, ao nível de sgnfcânca.9374 de.5.
TETE F PARA TETAR A IGNIFICÂNCIA DA REGREÃO Este teste serve para testar a hpótese nula, : a regressão não é sgnfcatva, que é equvalente às seguntes: : a equação de regressão não explca a varação na varável resposta; : não exste relação lnear entre a varável dependente e o conjunto de varáves ndependentes utlzadas. Matematcamente: :... k : pelo menos um 3
Pode-se mostrar que se for verdadera se tem, R k F ~ F n k E R k ( n k ) k sendo esta a estatístca do teste. Note que, R k n k R n k F E ( n k ) k E k n k R. k R R E T T Rejetamos para valores grandes da estatístca do teste F. 4
F n k k R R À parte da constante n k, a estatístca F é a razão entre a varação explcada e a não k explcada em Y. É natural que dgamos que a regressão é sgnfcatva só quando a proporção da varação explcada é grande. Isto ocorre só quando a razão F é grande. Por esta razão devemos sempre rejetar para valores de F muto grandes. e não for rejetada, então é o mesmo que dzer que o conjunto de varáves explcatvas contrbuem pouco para a explcação da varação da varável dependente. 5
Na regressão smples para testar a sgnfcânca da regressão consderamos as hpóteses, : : e portanto a estatístca teste a usar deve ser, R k R k ˆ F ou ~ tn ~ F n E ( n k ) ˆ ob 6
Os resultados descrtos podem ser convenentemente resumdos na tabela da ANOVA segunte: Fonte de oma dos Quadrados Graus de Quadrados Razão F varação Lberdade Médos Devdo à Regressão n R ( y y) ) k R k F R k Devdo aos resíduos Total n E ( ) n T ( y y) ) n-k- y y n- E n k 7
Exemplo ANÁLIE DE REGREÃO Para o exemplo em estudo, vamos testar a hpótese nula da regressão não ser sgnfcatva. póteses: : : pelo menos um ob, R F ~ F 7 8
Tem-se: 7 f α α ( F ). 5 P f 4. 74 α ANÁLIE DE REGREÃO RC [4.74, + [. R F obs k n k R 7.84697 9. 37 RC, logo rejetamos. k R.533 Ao nível de sgnfcânca de.5, rejetamos a hpótese da regressão não ser sgnfcatva. Então há evdênca para afrmar que exste um relaconamento lnear entre o conjunto de varáves explcatvas e o volume de vendas. 9
Para o Exemplo, temos a segunte Tabela ANOVA: Fonte de oma dos Graus de Quadrados Médos Razão F varação Quadrados Lberdade Devdo à Regressão R4.4695 R 4.4695 F 9..7 37 k Devdo aos resíduos E7.4835 7 n E k 7.4835 7.69 Total T48.9 9