Aálise de Regressão Liear Múltipla I Aula 04 Gujarati e Porter, 0 Capítulos 7 e 0 tradução da 5ª ed. Heij et al., 004 Capítulo 3 Wooldridge, 0 Capítulo 3 tradução da 4ª ed.
Itrodução Como pode ser visto ateriormete, o modelo de regressão liear simples, com uma variável eplicativa (regressor), aplica-se a várias situações. Etretato, diversos problemas evolvem dois ou mais regressores iflueciado o comportameto da variável resposta (depedete),. Chamamos Modelo de Regressão Liear Múltipla a qualquer modelo de regressão liear com duas ou mais variáveis eplicativas.
Itrodução variável resposta 3,,..., : variáveis eplicativas (regressores)
Modelo de regressão liear múltipla Vamos admitir que X, X,..., X sejam as variáveis idepedetes e Y a variável depedete. Dada uma amostra de observações, ( i, i,..., i, i ), i =,,...,, o modelo de regressão liear múltipla será dado por: 4
Modelo de regressão liear múltipla E[ i i, i,..., i ] = 0 + i + i +... + i, i =,,..., ou i = 0 + i + i +... + i + i, i =,,...,. em que > (+). 5
Míimos Quadrados Ordiários
7 i i i i i i 0 Para determiarmos os estimadores de míimos quadrados de 0,,...,, devemos miimizar o erro quadrático total ( i ): Método dos Míimos Quadrados
Método dos Míimos Quadrados O míimo da fução S( 0,,, ) i i i i 0 i i é obtido derivado-a em relação a 0,,...,, e igualado o resultado a zero. Ou seja, 0 S( 0, ) 0,, S(, ) 0 0,,
9 Equações Normais 0 ˆ ˆ ˆ 0 0 0 i i i i,, ), S( 0 ˆ ˆ ˆ 0 0 i i i i i,, ), S( 0 ˆ ˆ ˆ 0 0 i i i i i,, ), S(
Abordagem Matricial Devido à compleidade das fórmulas evolvidas, utilizaremos a abordagem matricial, que os permitirá, etre outras coisas: i. ecotrar o vetor de estimadores; ii. verificar as propriedades estatísticas de (i); iii. obter a distribuição de probabilidades de (i); qualquer que seja o úmero de regressores presetes o modelo. 0
Assim, a equação Abordagem Matricial i = 0 + i + i +... + i + i, i =,,...,. também pode ser escrita como = 0 + + +... + + = 0 + + +... + + 3 = 0 + 3 + 3 +... + 3 + 3 = 0 + + +... + +...
As igualdades ateriores podem ser alocadas facilmete em dois vetores coluas (), descritos a seguir: 0 0 0 Abordagem Matricial
3 Aida, 0 0 0 Abordagem Matricial
4 Fialmete, 0 Abordagem Matricial
5 ε X Vamos defiir: i i i Abordagem Matricial 0
Modelo de regressão liear múltipla Assim, utilizado os resultados do slide aterior, podemos escrever o modelo de regressão liear múltipla como: X ε, que é chamado Modelo Liear Geral. 6
Estimação Método dos Míimos Quadrados Ordiários (MQO)
Estimação Método dos Míimos Quadrados Ordiários Para determiarmos os estimadores de MQO de 0,,...,, devemos miimizar S i i ε ε ou, aida, S ε ε X X 8
9 Estimação Abrido a epressão aterior, vem que Método dos Míimos Quadrados Ordiários X X X X X X X X S
0 X X X Como X e são escalares e etão X X Estimação Método dos Míimos Quadrados Ordiários
Assim Estimação Método dos Míimos Quadrados Ordiários S X X X Logo, osso iteresse, agora, é ecotrar o resultado para S
Derivadas de Formas Lieares e Formas Quadráticas
Derivadas de Formas Lieares e Quadráticas f f f f ) ( ) ( ) ( ) ( Defiição. Cosidere o vetor colua e, uma fução real de,,...,. Assim, a derivada parcial de com relação a é dada por:...,,, f f 3
Derivadas de Formas Lieares e Quadráticas Teorema.(forma liear) Se a,..., a um vetor colua de costates e se f a, a a, f ( ) etão a. Teorema. (forma quadrática) Se f etão A f ( ) A a (forma quadrática, e A matriz simétrica de costates),, que é um vetor colua de elemetos. 4
5 Lembrado que objetivamos miimizar X X X S X X X S e, utilizado os resultados vistos ateriormete, temos que Voltado à Estimação (MQO)
Voltado à Estimação (MQO) E, igualado o resultado aterior a zero, vem que X X X ˆ 0 X X ˆ X que é o sistema de equações ormais a forma matricial. Para ecotrarmos o resultado de iteresse, precisaremos supor que a matriz X X admite iversa (ou seja, precisaremos supor que X X é ão-sigular). Para tato, assumiremos que os regressores ão apresetam relação liear perfeita. 6
Estimação (MQO) Assim, assumido que X X é ão-sigular, a solução do sistema de equações ormais é dada por X X ˆ X que é o vetor de estimadores de míimos quadrados do vetor de parâmetros de iteresse. 7
E Regressão Múltipla Y X X,, 0 abuso de otação Modelo Estimado ˆ ˆ ˆ 0 ˆ Iterpretação do Itercepto Valor médio estimado para a variável resposta, codicioado a = =... = = 0. Muitas vezes pode ão ter sigificado!!!
Iterpretação dos demais parâmetros Cosiderado ˆ ˆ ˆ ˆ se =... = = 0 (ou seja, as outras variáveis são matidas costates), etão o efeito parcial de o valor médio estimado para a variável resposta é dado por ˆ ˆ 9
Aplicação O departameto de RH da empresa TEMCO objetiva estudar o comportameto dos salários dos fucioários dos mais diversos setores da empresa. Para tato, o gerete de RH, baseado-se uma amostra aleatória de 46 empregados, coletou iformações sobre as seguites variáveis: 30
Aplicação id úmero cadastral do fucioário; salario aual, em dólares; aosemp tempo (em aos) a empresa; epprev eperiêcia aterior (em aos); educ aos de estudo após o segudo grau; seo (femiio = 0, masculio = ); dept departameto o qual atua (Compras =, Egeharia =, Propagada = 3, Vedas = 4); super úmero de empregados sob resposabilidade do empregado. 3
Aplicação Quadro - Parte de uma plailha que cotem iformações sobre os 3 empregados da empresa TEMCO.
Aplicação Como parte do estudo, a gerete de RH propôs a estimação dos parâmetros do seguite modelo de regressão múltipla: salario = 0 + educ + aosemp + a) Em termos do problema, 0 apreseta algum sigificado prático? b) Qual o sial esperado para? E para? c) Ecotre as estimativas dos parâmetros, via míimos quadrados ordiários, escreva a equação estimada e iterprete os resultados obtidos, em termos do problema de iteresse. 33
Aplicação Iterpretação dos parâmetros do modelo proposto, em termos do problema: 0 salário médio dos fucioários da empresa TEMCO, que acabaram de etrar a empresa (ou que aida ão completaram um ao) e que ão apresetam ehum ao de escolaridade após o segudo grau; efeito o salário médio dos fucioários da empresa TEMCO, dada a variação de um ao o tempo de escolaridade após o segudo grau, matedo costate a variável aosemp; e efeito o salário médio dos fucioários da empresa TEMCO, dada a variação de um ao o tempo de empresa, matedo costate a variável educ.
Aplicação 35
Aplicação Modelo estimado sa lário ˆ 377,4796,49educ 67,3aosemp Perguta: qual o salário médio estimado para pessoas com 3 aos de escolaridade após o º grau e com 5 aos a empresa? salario ˆ salario ˆ 377., 4796., 49 388,54 * 3 6733, * 5 36
Eercício (para etrega a próima aula) Cosidere o seguite modelo de regressão liear: i = 0 + i + i Aida, sabedo que o vetor de estimadores de MQO para o vetor de parâmetros do modelo de iteresse é dado por X X ˆ X Ecotre as epressões aalíticas para o estimador do itercepto e do coeficiete agular. 37
Leitura Complemetar 38
Posto de uma Matriz Posto de uma Matriz: Seja A uma matriz. O posto de A, deotado por r(a), é a ordem da maior submatriz quadrada ão sigular de A. Propriedades: (i) O determiate de uma matriz quadrada é diferete de zero se, e somete se, a matriz tiver posto completo; (ii) Caso uma matriz quadrada apresete determiate igual a zero, etão tal matriz será dita sigular; (iii) r(a) = r(aa ) = r(a A). 39
Posto de uma Matriz Coseqüêcias: (i) Se r(a) = p, etão A cotém pelo meos um meor p p ão ulo e ehum meor ão ulo de dimesão maior que p; (ii) Se >, r(a) é o úmero de coluas liearmete idepedetes de A, portato r(a) : Se r(a) =, A é de posto completo; (iii) Se <, r(a) é o úmero de lihas liearmete idepedetes de A, portato r(a) : Se r(a) =, A é de posto completo. 40
Observação Tecicamete, foi feita a suposição de que ão eiste coliearidade perfeita etre os regressores, que formam as coluas da matriz X. Ou seja, ehum dos regressores pode ser epresso como uma combiação liear eata dos demais regressores do modelo. Assim, o posto de X é igual a (como é o úmero de coluas da matriz X, estamos supodo que a matriz X é de posto completo, ou seja, as coluas de X são liearmete idepedetes). 4