Método dos mínimos quadrados Wikipédia, a enciclopédia livre



Documentos relacionados
Regressão linear múltipla. Prof. Tatiele Lacerda

Análise de Regressão Linear Simples III

Correlação e Regressão linear simples

Plano da Apresentação. Correlação e Regressão linear simples. Correlação linear. Associação entre hábitos leitura e escolaridade.

Análise de Regressão. Notas de Aula

Regressão Linear Múltipla

Capítulo 4 Inferência Estatística

Como rodar a regressão no gretl. Usando o Console para calcular elasticidade. Elasticidade. Usando o Console para calcular predição

REGRESSÃO. Análise de Correlação

é 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média.

IV Regressão e correlação IV.4. (cont.) Significância Estatística e Regressão Múltipla

Modelos de Probabilidade e Inferência Estatística

Aula 8 Intervalos de confiança para proporções amostras grandes

Para mais de duas variáveis independentes, em função de uma variável dependente.

Capítulo 5. Inferência no Modelo de Regressão Simples: Estimação de Intervalos, Teste de Hipóteses e Previsão

IND 1115 Inferência Estatística Aula 8

ME613 - Análise de Regressão

Aula 6 Propagação de erros

ME613 - Análise de Regressão

Linha Técnica Sessão IV Variáveis Instrumentais

Capacidade preditiva como critério para determinação do número de componentes principais em Seleção Genômica Ampla

Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança

AULA 04 Estimativas e Tamanhos Amostrais

CAPÍTULO 8. de Variância - ANOVA ANOVA. Análise

PLANO DE ENSINO CONTEÚDO PROGRAMÁTICO. Unidade 1: MEDIDAS E GRANDEZAS Introdução Padrões usados para avaliar grandezas físicas

Teste de Hipótese e Intervalo de Confiança. Parte 2

3 Modelos de Simulação

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

Matrizes. matriz de 2 linhas e 2 colunas. matriz de 3 linhas e 3 colunas. matriz de 3 linhas e 1 coluna. matriz de 1 linha e 4 colunas.

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira

Desvio Padrão ou Erro Padrão

Conteúdo. 1 Introdução. Histograma do Quinto Sorteio da Nota Fiscal Paraná 065/16. Quinto Sorteio Eletrônico da Nota Fiscal Paraná

Conteúdo. 1 Introdução. Histograma do 1o Sorteio da Nota Fiscal Paraná 152/15. 1º Sorteio Eletrônico da Nota Fiscal Paraná

Matrizes e Sistemas Lineares. Professor: Juliano de Bem Francisco. Departamento de Matemática Universidade Federal de Santa Catarina.

ANOVA. (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior

BIOESTATÍSTICA. Parte 1 - Estatística descritiva e análise exploratória dos dados

Planejamento e Análise Estatística de Experimentos Fatoriais em blocos completos

Regressão, Interpolação e Extrapolação Numéricas

Contabilometria. Análise Discriminante

Métodos Quantitativos Aplicados a Custos Análise Estatística como um auxiliar valioso nas decisões

Probabilidade III. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período

Álgebra Linear I - Aula 20

SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS DECB

Avaliação e Desempenho Aula 1 - Simulação

AULAS 19, 20, 21 E 22 Análise de Regressão Múltipla com Informações Qualitativas

Aula 1 Variáveis aleatórias contínuas

AULA 11 Experimentos Multinomiais e Tabelas de Contingência

Medidas de Localização

Inversão de Matrizes

Probabilidade e Estatística, 2009/2

Testes de variância e Análise de Variância (ANOVA)

Análise de Regressão Múltipla com informação qualitativa: variáveis binárias (dummy)

Determinantes. ALGA 2008/2009 Mest. Int. Eng. Electrotécnica Determinantes 1 / 17

Teorema do Limite Central e Intervalo de Confiança

Curso de Análise Estatística Comparação entre variáveis contínuas: correlação e regressão Linear

Técnicas estatísticas para análise de dados e de resultados de modelos de simulação

AULA 32 Problemas Adicionais de Especificação e de Dados

Aula 12: Correlação e Regressão

AULA 12 Inferência a Partir de Duas Amostras

Intervalos Estatísticos para Uma Única Amostra

Distribuições Conjuntas (Tabelas de Contingência)

Lição 5 Medidas Descritivas Medidas de Dispersão

A Significância Estatística do Proger na Redução da Taxa de Desemprego por Haroldo Feitosa Tajra

ESCOLA SUPERIOR DE TECNOLOGIA DE VISEU

AULAS 14 E 15 Modelo de regressão simples

25 a 30 de novembro de 2013

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Introdução. Ou seja, de certo modo esperamos que haja uma certa

Erros e Incertezas. Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011.

DIREÇÃO DO VENTO E SEU SIGMA- CALMARIAS

PARTE I - EVOLUÇÃO DO PENSAMENTO. Curso Análise de Dados e Políticas Públicas. Ementa. Metodologia. Plano de Aula

Então, a distribuição de converge para a distribuição normal com média nμ e variância nσ 2

TEORIA E PRÁTICA DO FILTRO DE KALMAN

Exemplo Turbinas de Avião

cuja distribuição é t de Student com n 1 graus de liberdade.

Ficha de Exercícios nº 2

Medidas de dispersão e assimetria

CONHECIMENTOS ESPECÍFICOS

AULAS 06, 07, 08 E 09 Análise de Regressão Múltipla: Estimação e Inferência

Teste de hipóteses para médias e proporções amostrais

Relatório das Provas da 2ª. Fase - Vestibular 2016

Exemplo de heterocedasticidade. Heterocedasticidade. Gráficos residuais. Gráficos residuais. Gráficos residuais. Gráficos residuais

O MODELO CLÁSSICO DE REGRESSÃO LINEAR (MCRL), O TEOREMA DE GAUSS- MARKOV E A VIOLAÇÃO DOS PRESSUPOSTOS.

Departamento de Matemática da Universidade de Coimbra Álgebra Linear e Geometria Analítica Engenharia Civil Ano lectivo 2005/2006 Folha 1.

Exercícios de Aprofundamento Mat Polinômios e Matrizes

Aula 12 Teste de hipótese sobre proporções amostras grandes

Onde: A é a matriz do sistema linear, X, a matriz das incógnitas e B a matriz dos termos independentes da equação

PLANEJAMENTO SIMPLIFICADO DE PROJETOS

Matrizes. Sumário. 1 pré-requisitos. 2 Tipos de matrizes. Sadao Massago a pré-requisitos 1. 2 Tipos de matrizes.

Probabilidade e Estatística - EST0003 Intervalos Estatísticos para uma única Amostra

Critérios Norteadores para o Processo Seletivo ao Programa de Pós-Graduação em Matemática da UFCG, no Curso de Mestrado, Modalidade Acadêmico

Aula Prática: Regressão Linear Simples

Carga Horária: 80 horas (correspondem a aulas e atividades extra-classe)

Lista de Exercícios MMC e MDC

Universidade Federal do Amazonas Instituto de Ciências Exatas Departamento de Estatística

AULAS 08 E 09 Distribuição de Probabilidade Normal

MANUAL DO USUÁRIO SIMPLEX. Prof. Erico Fagundes Anicet Lisboa, M. Sc.

MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE PELOTAS FACULDADE DE AGRONOMIA ELISEU MACIEL DEPARTAMENTO DE ZOOTECNIA MELHORAMENTO ANIMAL

a 21 a a 2n... a n1 a n2... a nn

Transcrição:

1 de 5 25/12/2012 20:27 Método dos mínimos quadrados Origem: Wikipédia, a enciclopédia livre. O Método dos Mínimos Quadrados, ou Mínimos Quadrados Ordinários (MQO) ou OLS (do inglês Ordinary Least Squares) é uma técnica de otimização matemática que procura encontrar o melhor ajuste para um conjunto de dados tentando minimizar a soma dos quadrados das diferenças entre o valor estimado e os dados observados (tais diferenças são chamadas resíduos). [1] É a forma de estimação mais amplamente utilizada na econometria. Consiste em um estimador que minimiza a soma dos quadrados dos resíduos da regressão, de forma a maximizar o grau de ajuste do modelo aos dados observados. Um requisito para o método dos mínimos quadrados é que o fator imprevisível (erro) seja distribuído aleatoriamente, essa distribuição seja normal e independente. O Teorema Gauss-Markov garante (embora indiretamente) que o estimador de mínimos quadrados é o estimador não-enviesado de mínima variância linear na variável resposta. Outro requisito é que o modelo é linear nos parâmetros, ou seja, as variáveis apresentam uma relação linear entre si. Caso contrário, deveria ser usado um modelo de regressão não-linear. Credita-se Carl Friedrich Gauss como o desenvolvedor das bases fundamentais do método dos mínimos quadrados, em 1795, quando Gauss tinha apenas dezoito anos. Entretanto, Adrien-Marie Legendre foi o primeiro a publicar o método em 1805, em seu Nouvelles méthodes pour la détermination des orbites des comètes. Gauss publicou suas conclusões apenas em 1809. [2][3][4] Índice 1 Regressão simples 1.1 Exemplo de regressão simples 2 Regressão múltipla 2.1 Exemplo de regressão múltipla 3 Premissas 4 Coeficiente de determinação R² 4.1 Exemplo de R² e R² ajustado 5 Teste de significância dos coeficientes 5.1 Exemplo de teste de significância dos coeficientes 6 Referências 7 Ver também 8 Ligações externas Regressão simples Queremos estimar valores de determinada variável. Para isso, consideramos os valores de outra variável conforme a fórmula: que acreditamos ter poder de explicação sobre onde: : Parâmetro do modelo chamado de constante (porque não depende de ). : Parâmetro do modelo chamado de coeficiente da variável. : Erro - representa a variação de que não é explicada pelo modelo. Também temos uma base de dados com valores observados de e de. Perceba que, usando a base de dados, e são vetores, ou seja, representam uma lista de valores, um para cada observação da base de dados. O método dos mínimos quadrados ajuda a encontrar as estimativas de e. Como o nome diz, serão somente estimativas desses parâmetros, porque o valor real dos parâmetros são desconhecidos. Portanto, ao fazer a estimativa, mudamos a notação de algumas variáveis: Para ilustrar isso, Heij [5] menciona: We do not know Greek but we can compute Latin Não sabemos grego, mas podemos calcular em latim Desse modo, ao estimar o modelo usando a base de dados, estamos estimando, na verdade: onde indica cada uma das observações da base de dados e passa a ser chamado de resíduo, ao invés de erro. Em alguns livros, a notação para as estimativas dos parâmetros é um pouco diferente. Ao invés de substituir a letra, apenas adiciona-se o símbolo chapéu ( ).

2 de 5 25/12/2012 20:27 O método dos mínimos quadrados minimiza a soma dos quadrado dos resíduos, ou seja, minimiza. A ideia por trás dessa técnica é que, minimizando a soma do quadrado dos resíduos, encontraremos e que trarão a menor diferença entre a previsão de e o realmente observado. Substituindo por, temos: A minimização se dá ao derivar em relação a e e igualar a zero: Distribuindo e dividindo a primeira expressão por temos: onde é a média amostral de e é a média amostral de. Substituindo esse resultado na segunda expressão temos: Alguns livros também usam uma fórmula diferente que gera o mesmo resultado: Exemplo de regressão simples Considere a seguinte base de dados: Consumo Renda 1 122 139 2 114 126 3 86 90 4 134 144 5 146 163 6 107 136 7 68 61 8 117 62 9 71 41 10 98 120

3 de 5 25/12/2012 20:27 Aplicando as fórmulas acima, chega-se em: portanto, Interpretação: Tirando a parte do Consumo que não é influenciada pela Renda, o incremento de $ 1 na Renda causa um incremento esperado de $ 0,4954 no Consumo. Regressão múltipla A regressão múltipla apresenta um funcionamento parecido com o da regressão simples, porém, leva em consideração diversas variáveis explicativas influenciando ao mesmo tempo: Ao usar a base de dados com variáveis explicativas e observações, o modelo pode ser escrito na forma matricial:, onde representa o valor da -ésima variável da -ésima observação. A fórmula também pode ser escrita na forma resumida: A solução de mínimos quadrados continua sendo alcançada através da minimização da soma do quadrado dos erros, que pode ser reescrito como, onde o apóstrofe significa que a matriz foi transposta. Substituindo por, temos: A minimização se dá ao derivar em relação a e igualar a zero. O primeiro termo não depende de, os segundo e terceiro termos são iguais e o terceiro termo é uma forma quadrática dos elementos de. Exemplo de regressão múltipla Considere a base de dados usada no exemplo da regressão simples, porém, acrescente mais uma variável explicativa (taxa de juros): Consumo Renda Taxa de Juros 1 122 139 11,5% 2 114 126 12,0% 3 86 90 10,5% 4 134 144 9,0% 5 146 163 10,0% 6 107 136 12,0% 7 68 61 10,5% 8 117 62 8,0% 9 71 41 10,0% 10 98 120 11,5%

4 de 5 25/12/2012 20:27 Aplicando a fórmula acima, chega-se em: portanto, Interpretação: Tirando a parte do Consumo que não é influenciada pela Taxa de Juros, o incremento de $ 1 na Renda causa um incremento esperado de $ 0,6136 no Consumo; além disso, o incremento de 1 ponto percentual (0,01) na Taxa de Juros causa um decréscimo esperado de $ 10,3441 no Consumo. Premissas Ao usar o método dos mínimos quadrados, assumimos algumas premissas a respeito das variáveis: Os regressores são fixos: As variáveis da matriz não são estocásticas. Erro é aleatório com média 0: O erro é aleatório e sua esperança. Homoscedasticidade: A variância do erro é constante. Ver também: heteroscedasticidade Sem correlação: Não existe correlação entre os erros das observações, ou seja, para qualquer. Parâmetros são constantes: e são valores fixos desconhecidos. Modelo é linear: Os dados da variável dependente foram gerados pelo processo linear. Erro tem distribuição normal: O erro é distribuído conforme a curva de distribuição normal. Caso alguma dessas premissas não seja verdadeira, o método pode gerar resultados sub-ótimos ou com viés. Coeficiente de determinação R² O Coeficiente de determinação, também chamado de R² é uma medida de qualidade do modelo em relação à sua habilidade de estimar corretamente os valores da variável resposta., sendo SQres o Somatório dos Quadrados dos Resíduos e SQtot o Somatório dos Quadrados Total ou R² ajustado: Exemplo de R² e R² ajustado Usando os dados do exemplo de regressão múltipla, podemos calcular: Isso significa que 88,729% da variância de é explicada pela variância de. Teste de significância dos coeficientes Se uma variável realmente possui poder explicativo sobre, seu coeficiente deve ser estatísticamente diferente de zero. Ou seja, deve ser suficientemente maior ou menor do que zero para que tenhamos confiança de que a variável realmente possui poder explicativo. Caso isso não seja verdade, a variável poderia ser retirada do modelo sem que exista grande perda da sua qualidade. Para verificar se os coeficientes são significantes, levamos em consideração que o estimador tem distribuição normal centrada em e com variância, onde é a variância do erro. Ou seja: Porém, como o erro não é observado, usamos a aproximação amostral :, onde representa o número de variáveis explicativas mais a constante. Considerando que a hipótese nula é a de que, então a estatística t para a variável j é:

5 de 5 25/12/2012 20:27, onde é o j-ésimo elemento da diagonal de. Aplicando o valor de na curva acumulada da distribuição t de Student com graus de liberdade, pode-se obter o nível de confiança necessário para que a hipótese nula seja rejeitada. Ver também: Testes de hipóteses Exemplo de teste de significância dos coeficientes Usando os dados do exemplo de regressão múltipla, podemos calcular: Na distribuição t de Student com 7 (10-2-1) graus de liberdade, o valor de que garante um nível de confiança de 95% é 2,3646. Como é maior que 2,3646, a hipótese nula de que é rejeitada com, pelo menos 95% de confiança. O mesmo também ocorre para. Referências 1. Universidade de Berkeley, Econometrics Laboratory Software Archive. Regression Analysis (http://elsa.berkeley.edu/sst/regression.html) (em Inglês). Página visitada em 18/05/2011. 2. (em inglês) Indiana University Bloomington, Human Intelligence, Karl Friedrich Gauss (1777-1855), German Mathematician [1] (http://www.indiana.edu/~intell /gauss.shtml) 3. Memória, José M. P. (2004). Breve História da Estatística (http://www.im.ufrj.br/~lpbraga/prob1/historia_estatistica.pdf) (em Inglês). Embrapa Informação Tecnológica. Página visitada em 11/05/2011. 4. Stigler, S. M.. The History of Statistics: The Measurement of Uncertainty before 1900. [S.l.]: Harvard University Press, 1986. 410 p. 5. HEIJ, Christiaan; DE BOER, Paul; FRANSES, Philip Hans; KLOEK, Teun; VAN DIJK, Herman K. Econometric Methods with Applications in Business and Economics. OXFORD, 2004 Ver também Mínimos quadrados generalizados - MQG Máxima verossimilhança Método dos momentos generalizados - MMG Regressão Econometria Decomposição em Valores Singulares - a técnica computacional moderna para regressão e projeção ortogonal. As funcoes Scilab: svd, sva e contra-barra (backslash) Ligações externas (em inglês) - http://www.physics.csbsju.edu/stats/least_squares.html (em inglês) - http://zunzun.com (em inglês) - http://www.orbitals.com/self/least/least.htm (em inglês) - O operador contrabarra ou '\' no Scilab http://help.scilab.org/docs/5.3.3/en_us/backslash.html Obtida de "http://pt.wikipedia.org/w/index.php?title=método_dos_mínimos_quadrados&oldid=32520782" Categorias: Econometria Álgebra linear Estatística Menu de navegação Esta página foi modificada pela última vez à(s) 17h57min de 10 de outubro de 2012. Este texto é disponibilizado nos termos da licença Atribuição-Partilha nos Mesmos Termos 3.0 não Adaptada (CC BY-SA 3.0); pode estar sujeito a condições adicionais. Consulte as condições de uso para mais detalhes.