PALAVRAS-CHAVE: Análise de regressão; heteroscedasticidade; métodos de estimação. CEP , São Carlos, SP, Brasil.
|
|
- Alana Bergmann
- 5 Há anos
- Visualizações:
Transcrição
1 MODELO DE REGRESSÃO HETEROSCEDÁSTICO Sergio Augusto RODRIGUES 1 Carlos Alberto Ribeiro DINIZ 2 RESUMO: Na teoria clássica de regressão, uma das suposições básicas é a homocesdasticidade dos erros. Quando isso não ocorre, uma alternativa é transformar os dados ou estimar a estrutura heteroscedástica dos mesmos. Este trabalho apresenta o modelo de regressão linear heteroscedástico, bem como uma revisão das alternativas clássicas de estimação e detecção da heteroscedasticidade. PALAVRAS-CHAVE: Análise de regressão; heteroscedasticidade; métodos de estimação. 1 Introdução Na teoria clássica dos modelos de regressão existem suposições básicas para garantir a eficiência e a qualidade de seus estimadores. Quando uma ou mais destas suposições forem violadas é necessário procurar alternativas desejáveis para garantir a eficiência e a qualidade dos estimadores. Uma das suposições do modelo de regressão é a igualdade das variâncias dos erros. Quando esta não ocorre, diz-se que os erros são heteroscedásticos. Este trabalho apresenta uma revisão sobre alguns métodos clássicos de estimação dos parâmetros de um modelo de regressão heteroscesdástico, mostrando suas características, os principais testes para detectar variâncias não constantes dos erros e as estruturas heteroscedásticas mais conhecidas na literatura. 1 Faculdade de Educação São Luis - FESL, CEP , Jaboticabal, SP, Brasil. sergio@saoluis.br 2 Departamento de Estatística, Universidade Federal de São Carlos - UFSCar, Caixa Postal 676, CEP , São Carlos, SP, Brasil. dcad@power.ufscar.br Rev. Mat. Estat., São Paulo, v.24, n.2, p ,
2 2 Modelo de regressão linear heteroscedástico Quando os erros de um modelo de regressão não têm variância constante podese dizer que a suposição de homoscedasticidade não está satisfeita e o modelo pode ser chamado de modelo de regressão heteroscedástico. Algumas vezes é possível eliminar a heteroscedasticidade por meio de uma transformação na variável resposta (Box e Cox, 1964). Mas, como isto nem sempre é possível, é conveniente considerar uma análise com modelagem explícita da variância. Um modelo de regressão linear múltipla amostral heteroscedástico é dado por y i = x i β + e i, i = 1, 2,..., n, (1) onde x é um vetor k 1 de variáveis regressoras, β é um vetor k 1 de parâmetros desconhecidos e os e is são os erros do modelo de regressão, os quais são supostamente independentes e normalmente distribuídos com média zero e variância σi 2. Duas estruturas de heteroscedasticidade são usualmente consideradas: estrutura aditiva ou estrutura multiplicativa. 2.1 Tipos de heteroscedasticidade Considerando que os erros tenham distribuição normal com média zero e variância σi 2, dois tipos de erros heteroscedásticos bastante populares na literatura (Judge et al., 1985), são dados por: (a) Estrutura heteroscedástica aditiva: A variância dos erros é proporcional a uma das variáveis regressoras ao quadrado. Neste caso, para um modelo com um termo constante e uma variável regressora, tem-se V ar(e i ) = σ 2 i = (z iδ) 2 = α 2 0(1 + γx i ) 2 (2) onde δ = (α 0, α 1 ), γ = α 1 α 0 e z i = (1, x i ). Um modelo com essa estrutura é denominado modelo aditivo. Nesta estrutura γ representa o grau ou nível da heteroscedasticidade, α 0 um parâmetro de proporcionalidade da variância reparametrizada dos erros e x i uma das variáveis regressoras do modelo. (b) Estrutura heteroscedástica multiplicativa: A variância dos erros é proporcional a uma potência desconhecida de uma das variáveis regressoras. Neste caso, para um modelo com uma constante e uma variável regressora, a variância é dada por V ar(e i ) = σ 2 i = σ 2 x λ i = exp(z iα) (3) onde α = (log σ 2, λ) e z i = (1, log x i). O parâmetro λ representa o grau ou nível da heteroscedasticidade, x i é uma das variáveis regressoras do modelo e σ 2 é um parâmetro desconhecido representando a variância do erro nos casos onde λ = Rev. Mat. Estat., São Paulo, v.24, n.2, p , 2006
3 Essa estrutura foi discutida por Geary (1966), Park (1966), Lancaster (1968), Kmenta (1971) e Harvey (1976); este último denominou-o de modelo multiplicativo. Esse modelo pode ser considerado um caso especial do modelo aditivo. 2.2 Conseqüências da heteroscedasticidade Quando a suposição de homoscedasticidade ou de independência entre os erros for violada, o modelo de regressão linear clássico pode ser substituído pelo modelo de regressão linear generalizado. As três maiores consequências de se utilizar o estimador de mínimos quadrados ordinários, dado em (6), para os parâmetros do modelo de regressão linear generalizado são: i) as variâncias dos estimadores não são mínimas; ii) embora o estimador de mínimos quadrados ordinários seja não viciado, sua variância é viciada e estimativas intervalares ou testes de hipóteses podem produzir resultados imprecisos ou inválidos. Não é sempre possível detectar se o modelo clássico ou generalizado deva ser empregado, existindo, portanto, um perigo em se fazer inferências falhas usando o estimador de mínimos quadrados ordinários; iii) com a suposição adicional de que os erros são normalmente distribuídos, o estimador de mínimos quadrados ordinários não é o estimador de máxima verossimilhança. Todas essas conseqüências do uso do estimador de mínimos quadrados ordinários quando os erros são heteroscedásticos sugerem o uso de estimador de mínimos quadrados generalizados. No entanto, o problema de se utilizar esse estimador é que a matriz de variâncias e covariâncias dos erros deve ser conhecida. 2.3 Testes para detectar a heteroscedasticidade É possível detectar heteroscedasticidade por meio de uma inspeção visual dos resíduos via diagrama de dispersão. Se parecer que os resíduos absolutos possuem a mesma variabilidade em torno de uma linha imaginária, então, provavelmente, não existe heteroscedasticidade. Caso contrário, uma verificaçã Teste de Goldfeld-Quandt (1965) Neste teste as n observações são primeiramente ordenadas de acordo com os valores da variável regressora, x, responsável pela presença de heteroscedasticidade. Em seguida é necessário dividir a amostra ordenada em três partes, desconsiderando os c s valores do meio (25% aproximadamente). Com as duas partes restantes, ajusta-se dois modelos de regressão, um utilizando somente os valores da primeira parte (menores valores da variável regressora), e o outro utilizando os valores da segunda parte (maiores valores da variável regressora). Em seguida, verifica-se pelo teste F, se as variâncias dos erros nestas duas regressões são iguais contra a hipótese de que a variância dos erros é maior na segunda parte dos dados, ou seja, no conjunto de dados com grandes valores de x. Rev. Mat. Estat., São Paulo, v.24, n.2, p ,
4 É importante notar que, no caso de uma regressão linear múltipla, primeiramente é necessário identificar com qual das variáveis regressoras o resíduo está se relacionando. O teste de Goldfeld-Quandt deve ser realizado utilizando-se cada uma das variáveis regressoras suspeitas de se relacionar com o erro. Esse teste apresenta algumas limitações, entre elas, exige amostra relativamente grande; pressupõe que a heteroscedasticidade seja decorrente da relação entre o erro aleatório e uma ou algumas das variáveis regressoras. Existem, porém, casos em que a heteroscedasticidade é resultante da utilização de dados agrupados e casos que não apresentam indicações sobre a exata relação existente entre a variável regressora e os resíduos Teste de Szroeter (1978) O teste de homoscedasticidade de Szroeter rejeita a hipótese de homoscedasticidade se a estatística Q, T ( h t) Q = [ ] 2 T 1/2, (4) (t t) 2 t=1 for maior que um valor crítico de uma distribuição normal padrão, com t = T t t=1t T e h = tê 2 t t=1 T ê 2 t t=1, onde os t s são constantes representando a ordem dos resíduos e os ê t s são os resíduos gerados pelo modelo. Sob homoscedasticidade, h, que é uma média ponderada dos t s com pesos dados por ê 2 t, é aproximadamente igual a uma média aritmética simples dos t s. Para maiores detalhes sobre a forma deste teste, ver Judge et al. (1985, p ). Griffiths e Surekha (1984) mostraram que o teste de Szroeter é melhor que o teste de Goldfeld-Quandt quando as variâncias dos erros estão ordenadas Teste de Glejser (1969) Esse teste, além da facilidade de uso, permite que se supere a limitação de não poder identificar o tipo de relação existente entre a variável regressora e os resíduos. O teste de Glejser dá indicações sobre o padrão da heteroscedasticidade. Essa informação é útil para a escolha de um método conveniente de estimação do modelo heteroscedástico. Os procedimentos para realização deste teste requer a estimação de um modelo de regressão. Com os resíduos obtidos, estima-se as seguintes regressões: ê i = a 0 +a 1 x h i +v i, sendo x i a variável regressora com a qual se 136 Rev. Mat. Estat., São Paulo, v.24, n.2, p , 2006
5 supõe que e i esteja relacionado, v i o erro aleatório das regressões propostas e h uma potência qualquer, h = 1, 1, 1/2, 2,... Em seguida, teste a hipótese H 0 : a 1 = 0 versus H 1 : a 1 0. Se a hipótese nula H 0 : a 1 = 0 não for rejeitada para todas as regressões estimadas, então não existe heteroscedasticidade. Se, em pelo menos uma das regressões, a hipótese nula é rejeitada, então existe heteroscedasticidade nos dados. A limitação mais importante deste teste é que ele só é válido para verificar a heteroscedasticidade decorrente da relação entre o termo aleatório e alguma das variáveis regressoras Teste de White (1980) Este teste examina se a variância dos erros é afetada por alguma das variáveis regressoras, seus quadrados ou seus produtos cruzados. É baseado na idéia de que a variância do estimador de mínimos quadrados ordinários é igual à variância do estimador de mínimos quadrados generalizados e detecta a heteroscedasticidade somente se a variância desigual dos erros afetar a consistência do estimador da matriz de variâncias e covariâncias dado em (8). White (1980) mostrou que a estatística de teste para detectar a heteroscedasticidade nos dados é igual ao tamanho da amostra, n, multiplicado pela estatística R 2, calculada a partir da regressão ajustada entre os resíduos ao quadrado e o produto cruzado das variáveis regressoras mais a constante. No caso de duas variáveis regressoras, a regressão a ser ajustada seria: ê 2 i = β 0 + β 1 x 1 + β 2 x 2 + β 3 x β 4 x β 5 x 1 x 2. (5) A estatística de White segue, assintoticamente, distribuição qui-quadrado, χ 2, com o número de graus de liberdade igual ao número de variáveis regressoras do modelo usado para calcular a estatística R 2. 3 Métodos de estimação clássica Com as suposições do modelo de regressão satisfeitas, o estimador não viciado e de variância mínima para os coeficientes de um modelo de regressão linear múltiplo, e que minimiza a soma de quadrados de resíduos, é o estimador de mínimos quadrados ordinários (EMQO), dado por β = (X X) 1 X y. (6) onde X é a matriz do modelo e y é o vetor de respostas. A matriz de variânciascovariâncias do EMQO é dada por Cov( β) = (X X) 1 X ΩX(X X) 1, (7) Rev. Mat. Estat., São Paulo, v.24, n.2, p ,
6 onde Ω é a matriz de variâncias e covâriancias dos erros. No caso de homoscedasticidade, um estimador não viciado dessa matriz de variâncias e covariâncias é dado por onde Ĉov( β) = S 2 (X X) 1, (8) S 2 = ê ê (n p) é o estimador da variância dos resíduos. Este estimador é bastante popular na estatística, pois com as suposições iniciais satisfeitas minimiza a soma de quadrados de resíduos, é não viciado e de variância mínima e se os erros tiverem uma distribuição normal, coincide com o estimador de máxima verossimilhança. No caso de heteroscedasticidade dos erros, o EMQO continua sendo um estimador não viciado, no entanto, não será um estimador eficiente. Quando a função que determina a heteroscedasticidade dos erros é completamente conhecida é fácil determinar a matriz de variâncias e covariâncias do EMQO. Quando não se conhece a estrutura de heteroscedasticidade, pode-se utilizar o estimador proposto por White (1980), que é não viciado para grandes amostras e consistente nos casos homoscedástico e heteroscedástico de forma desconhecida. Esse estimador é dado por Ĉov( β) = (X X) 1 X ΩX(X X) 1, (10) onde Ω = diag(ê 2 1,..., ê 2 n), uma matriz diagonal com os quadrados dos resíduos do EMQO na diagonal. No entanto, esse estimador possui vícios altos para pequenas amostras. A fim de diminuir os vícios para pequenas amostras, Cribari Neto ; Silva e Cordeiro (2000) definiram um estimador modificado de White (1980) para a matriz de covariância com erros heteroscedásticos. Nas situações em que pelo menos uma das suposições da teoria clássica de modelos lineares for violada, uma alternativa seria utilizar o estimador de mínimos quadrados generalizados (EMQG) (9) β = ( X Ω 1 X ) 1 X Ω 1 y. (11) A matriz de variâncias e covariâncias deste estimador é dada por Cov( β) = ( X Ω 1 X ) 1. (12) Quando Ω é completamente conhecida é fácil calcular o EMQG e sua matriz de variâncias e covariâncias, mas quando Ω é desconhecida é necessário estimá-la. Quando a função que determina a heteroscedasticidade é conhecida, mas com alguns parâmetros desconhecidos, uma saída seria estimar esta heteroscedasticidade. Harvey (1976) sugere um estimador para o grau da heteroscedasticidade multiplicativa e Harvey (1974) um estimador para o grau 138 Rev. Mat. Estat., São Paulo, v.24, n.2, p , 2006
7 da heteroscedasticidade aditiva, considerando independência entre os erros. Uma outra alternativa seria obter uma estimativa global para o grau de heteroscedasticidade e para os coeficientes da regressão, utilizando os algoritmos propostos por Broyden (1970), Fletcher (1970), Goldfarb (1970) e Shanno (1970). Dependendo da estrutura heteroscedástica dos erros, a maximização da função de máxima verossimilhança pode ser complicada, uma vez que vários parâmetros podem estar presentes. O método Scoring, baseado no processo iterativo de Newton- Raphson, pode ser usado para facilitar a maximização da função de verossimilhança. Estimando a estrutura heteroscedástica dos erros, e considerando independência entre eles, é possível obter uma estimativa da matriz de variâncias e covariância, Ω, e conseqüentemente, utilizar o EMQG para estimar os coeficientes da regressão. 3.1 Estrutura heteroscedástica aditiva Neste tipo de estrutura é assumido que os erros são da forma aditiva, ou melhor, V ar(e i ) = σi 2 = (z i δ)2, i = 1,..., n, onde z i é um vetor p 1 (p k) de um conjunto de variáveis que normalmente são as variáveis regressoras do modelo e δ é um vetor p 1 de parâmetros da função que forma a variância dos erros. O caso especial desse tipo de heteroscedasticidade que será considerado neste artigo é dado em (2), ou seja, V ar(e i ) = α0(1 2 + γx i ) 2. Neste caso, o parâmetro γ representa o grau ou nível da heteroscedasticidade, x i é uma das variáveis regressoras do modelo e α 0 um parâmetro de proporcionalidade da variância reparametrizada dos erros. Harvey (1974) propôs um estimador para γ baseado na suposição de que os erros tem uma distribuição normal com média zero e variância σi O estimador de Harvey (1974) Por suposição, as variáveis padronizadas σ 1 i e i para i = 1,...n, são independentes e identicamente distribuídas com média zero e variância um. Entretanto, o valor esperado do valor absoluto de uma variável padronizada pode ser escrita por E ( σ 1 i e i ) = c, onde c é uma constante igual para todos i s e depende da distribuição de σ 1 i e i. Além disso, como E ( e i ) = cσ i e, se os e is são normalmente distribuídos, Harvey mostrou que c = (2/π) 1/2. Destes resultados pode-se escrever ê i = cz iδ + v i, (13) onde ê i = y i x i β é o i-ésimo resíduo do ajuste do modelo de regressão e v i é um novo resíduo, v i = ê i E ( e i ). Rev. Mat. Estat., São Paulo, v.24, n.2, p ,
8 Aplicando o EMQO no modelo acima, obtém-se um estimador para cδ e, conseqüentemente, para δ, ( n ) 1 n δ = c 1 z i z i z i ê i. (14) Harvey (1974) mostrou que ê i converge em distribuição para e i e, portanto, assintoticamente, v i será independentemente distribuída com média zero, pois E ( ê i ) = E ( e i ) quando n e E (v i ) = E ( e i ) E ( e i ) = 0, e variância dada por V ar (v i ) = V ar ( ê i ) ( = E e i 2) [E ( e i )] 2 = E ( e 2 ) i [E ( ei )] 2 = σ 2 i c 2 σ 2 i = (z iδ) 2 (1 c 2 ). Como v i não é homoscedástico, o EMQO, δ, não é um estimador eficiente. Entretanto, é um estimador consistente. Nesta situação, o ideal seria utilizar o EMQG, utilizando δ como estimativa da variância dos erros. Assim, aplicando o EMQG no modelo (13), tem-se δ = c 1 ( i ( z i δ) 2 zi z i ) 1 i ( z i δ) 2 zi ê i, (15) onde c = (2/π) 1/2. O estimador δ foi sugerido por Harvey (1974) e também descrito por Judge et al. (1985). A constante c é utilizada porque E ( e i ) 0 e é necessário assumir que e i é normalmente distribuído. A partir disso, o estimador de mínimos quadrados generalizado de β pode ser calculado por β = n ( ) 2 z i δ x i x i n 1 ( z i δ ) 2 x i y i. (16) 3.2 Estrutura heteroscedástica multiplicativa Nesta estrutura é assumido que os erros são da forma multiplicativa, ou seja, V ar(e i ) = σ 2 i = exp(z i α) = σ2 x λ i, i = 1,..., n, onde z i é um vetor p 1 (p k) de um conjunto de variáveis que são, normalmente, mas não necessariamente, as variáveis regressoras do modelo e α é um vetor p 1 de parâmetros da função 140 Rev. Mat. Estat., São Paulo, v.24, n.2, p , 2006
9 que forma a variância dos erros. O primeiro elemento de z i sempre será igual a 1, devido ao termo constante do modelo. O parâmetro λ representa o grau ou nível da heteroscedasticidade, σ 2 é um parâmetro desconhecido representando a variância do erro nos casos onde λ = 0. Quando não é conhecido o verdadeiro valor de λ, Park (1966) propôs um estimador em 2 passos para um modelo geral com um certo grau de heteroscedasticidade da forma multiplicativa. Harvey (1976) propôs um outro estimador, chamado de estimador em 3 passos de Harvey, obtido pelo processo iterativo Scoring O estimador em 2 passos de Park Park (1966) propôs um procedimento de estimação, denominado estimador em 2 passos. O primeiro passo consiste em tomar os logaritmos dos quadrados dos resíduos obtidos no ajuste de um modelo considerando o EMQO. A razão para isto vem do seguinte fato: Uma vez que σi 2 = σ 2 x λ i, o logaritmo em ambos os lados produz log σi 2 = log σ 2 + λ log x i. Somando log ê 2 i nos dois lados da igualdade, tem-se log ê 2 i + log σ2 i = log σ2 + λ log x i + log ê 2 i. E, portanto, σ 2 i log ê 2 i = log σ 2 + λ log x i + log ê 2 i log σi 2 ( ) = log σ 2 ê2 + λ log x i + log i. Isto é, log ( ê 2 ) i = z i α + w i. (17) ( ) ê2 onde w i = log i e ê 2 i é o i-ésimo resíduo resultado da utilização do EMQO. Considerando o logaritmo do quadrado do resíduo como uma variável dependente e o logaritmo da variável regressora, que está relacionado com a variância dos erros, como variável regressora, ajusta-se o modelo (17) para estimar λ e log(σ 2 ). A partir dessas estimativas, é possível utilizar o EMQG para estimar os parâmetros do modelo (1). Utilizando o EMQO para estimar os parâmetros do modelo (17), pode-se dizer que o estimador em 2 passos de Park de α é ( n ) 1 n α = z i z i z i log ê 2 i. (18) Park (1966) mostrou que, assintoticamente, w i converge em distribuição para uma variável aleatória wi que possui uma distribuição logaritmo de uma variável χ 2 com um grau de liberdade. Para facilitar o cálculo dos momentos desta distribuição, Abramowitz e Stegum (1965) mostraram que o valor esperado de uma variável, w, distribuída como um logaritmo de uma χ 2 dividida por seus graus de liberdade, v, é igual a E (w/v) = σ 2 i Rev. Mat. Estat., São Paulo, v.24, n.2, p ,
10 ( v ) ( v ) d (log Γ (s)) Ψ log. Ψ(s) é a função digama definida por 2 2 ds = Γ (s) Γ(s) e Γ(s) é a função gama. O segundo momento centrado na média é dado por Ψ (1) (v/2), pois Ψ (m) (s) denota a m-ésima derivada de Ψ(s). Com isso, verifica-se que, para 1 grau de liberdade, a média e a variância são dadas respectivamente por E (wi ) = Ψ (1/2) log(1/2) = 1, 2704 e V ar(wi ) = Ψ(1) (1/2) = 4, Supondo que α 1 representa o primeiro elemento do vetor α, e sabendo que E (wi ) = 1, 2704; pode-se dizer, então, que α 1 é um estimador inconsistente de α 1. Entretanto, os outros p 1 elementos de α são estimadores consistentes de seus correspondentes parâmetros em α. Isto porque, considerando que n, wi N( 1, 2704; 4, 9348) e conseqüentemente, por (ê2 ) ser combinações de normais, log i N(z i α 1, 2704; 4, 9348). Visto que α 1 simplesmente introduz um fator de proporcionalidade na variância dos resíduos, o possível EMQG de β no modelo (1), utilizando o estimador da matriz de variância e covariância dos erros proposto por Park (1966), em geral, será assintoticamente eficiente. Sabendo que a variância dos resíduos é igual a 4, 9348, então a matriz de [ n 1 variâncias-covariâncias de α é dada por Cov ( α) = 4, 9348 z i z i]. Assim, considerando α 1 + 1, 2704 como o estimador do primeiro elemento do vetor α, pode-se dizer que o estimador corrigido por 1, 2704 é um estimador consistente O estimador em 3 passos de Harvey (1976) Supondo que os erros do modelo apresentado em (1) são independentes e normalmente distribuídos com média zero e variância σi 2, o log da função de verossimilhança pode ser escrito como log (L (β, α)) = n 2 log (2π) z i α n exp ( z iα) (y i x iβ) 2. (19) O método iterativo mais utilizado para ajustar modelos da forma descrita em (19) é o chamado método de Scoring de Fisher (Harvey, 1976). O método de Scoring, baseado no processo iterativo de Newton-Raphson, pode ser usado para maximizar a função de verossimilhança mais facilmente, e os estimadores obtidos por este processo estarão próximos dos estimadores de máxima verossimilhança. Sob condições de regularidade, o estimador de máxima verossimilhança de (β, α) segue, para grandes amostras, distribuição normal com média (β, α) e matriz de variâncias e covariâncias igual ao inverso da matriz de informação de Fisher. A matriz de informação é o valor negativo do valor esperado da matriz de derivadas de segunda ordem do logaritmo da função de verossimilhança. 142 Rev. Mat. Estat., São Paulo, v.24, n.2, p , 2006
11 A inversa da matriz de informação de Fisher que, assintoticamente, é a matriz de variâncias e covariâncias dos estimadores de máxima verossimilhança, pode ser escrita por I (β, α) 1 = ( n σ 2 1 i x i x i) 0 ( n 0 2 z i z i ) 1. (20) [ 2 ] [ log L 2 ] log L Dado que E α β = E β α = 0, a matriz de informação de Fisher é uma matriz bloco diagonal, em que um dos blocos, I β, corresponde à matriz de informação de β e o outro, I α, à matriz de informação de α. Isto significa que os parâmetros β e α são globalmente ortogonais e suas estimativas de máxima verossimilhança, β e α, assintoticamente independentes. Se α (t) e β (t) são as estimativas de α e β respectivamente, obtidos na t-ésima iteração do método de Scoring, as equações iterativas para estimar β e α podem, de acordo com Rutemiller e Bowers (1968), ser escritas separadamente da seguinte forma ( n ) 1 β (t+1) = β n ( (t) + e z ibα (t) x i x i x i e z ibα (t) y i x i β (t)) ( n ) 1 n [ ( α (t+1) = α (t) + z i z i z i e z ibα (t) y i x β (t)) ] 2 i 1. (21) (22) O valor inicial β (0) pode ser igual ao EMQO ( β), e, segundo Rutemiller e Bowers (1968), α (0) 1 pode ser igual a logs 2, onde S 2 = n 1 ( β) 2 y i x i e todos os outros elementos do vetor α (0) serão iguais a zero. Uma outra alternativa pode ser usar α (0) = α, ou seja, o estimador em 2 passos definido por Park (1966). Se um estimador consistente para α é usado como valor inicial do processo iterativo definido acima, somente uma iteração será necessária para produzir um estimador com as mesmas propriedades assintóticas do estimador de máxima verossimilhança. Harvey (1976) mostrou que o estimador de Park (1966) tem um elemento inconsistente e, por isso, é assintoticamente ineficiente. Por essa razão, Harvey (1976) propôs um procedimento de estimação em 3 passos, o qual possui, assintoticamente, as mesmas propriedades que o estimador de máxima verossimilhança. Segundo Harvey, se α 1, do estimador de Park (1966), é estimado por α 1 + 1, 2407, o procedimento em 2 passos de Park produz um estimador consistente de Rev. Mat. Estat., São Paulo, v.24, n.2, p ,
12 α e a expressão (22) pode ser simplificada da seguinte forma ( ) ( n ) 1 0, 2704 n α = α + + 0, 2807 z 0 i z i z i exp ( z i α) ê 2 i, (23) ( n ) 1 onde α = z i z n i z i log ( ) ê 2 i. Este estimador foi chamado por Harvey (1976) de estimador em 3 passos do grau da heteroscedasticidade de um modelo de regressão linear e é um estimador assintoticamente eficiente. Se o EMQG for usado para estimar β, considerando o estimador em 3 passos de Harvey para estimar a matriz de variâncias e covariâncias dos erros, é razoável supor que esse estimador terá propriedades melhores que o correspondente estimador em 2 passos de Park. Neste caso o EMQG de β é dado por ( n ) 1 n β = e z ibα x i x i e z ibα x i y i. (24) 3.3 O Método de otimização global (Algoritmo BFGS) Outra forma de se obter estimativas dos parâmetros na situação em que o modelo é heteroscedástico é por meio dos algoritmos iterativos de obtenção de máximos globais de uma função. Segundo Seber e Wild (1988), quando o número de parâmetros do modelo é grande, os algoritmos mais eficientes para maximizar uma função, h(θ), são os algoritmos de maximização global baseados no clássico método iterativo de Newton em que θ (t+1) = θ (t) + δ (t), δ (t) = H ( θ (t)) 1 ( ) g θ (t), h (θ) onde g(θ) = é o vetor gradiente e H (θ) = 2 h (θ) θ θ θ é a matriz de derivadas segundas, também chamada de matriz Hessiana. Quando é difícil se obter a expressão analítica de H(θ), é possível aproximá-la por meio de um algoritmo usando diferenças finitas em g(θ), assim como g(θ) pode ser aproximada usando diferenças finitas em h(θ). Algumas modificações no método de Newton foram implementadas para melhorar a convergência do algoritmo e em 1970 foi publicado simultaneamente por Broyden (1970), Fletcher (1970), Goldfarb (1970) e Shanno (1970) um algoritmo, conhecido hoje como BFGS, baseado no método iterativo de Quasi-Newton. Este algoritmo é bastante utilizado para encontrar o máximo ou o mínimo global de uma função real de p variáveis reais θ = (θ 1, θ 2,..., θ p ). 4 Discussão Na teoria clássica de modelos de regressão, uma das suposições básicas para garantir a eficiência dos estimadores padrões convencionais é a suposição de que as variâncias dos erros são iguais, ou seja, os erros são homoscedásticos. 144 Rev. Mat. Estat., São Paulo, v.24, n.2, p , 2006
13 Quando isso não ocorre, utilizar o EMQO do vetor de parâmetros β acarretará conseqüências na eficiência do estimador, pois apesar de ser um estimador não viciado, sua variância não é mínima. Além disso, o estimador de sua variância é um estimador viciado. As alternativas clássicas para esse problema seriam utilizar o EMQG, estimando a matriz de variâncias e covariâncias a partir do estimador desenvolvido por White (1980) e aperfeiçoado por Cribari Neto; Silva e Cordeiro (2000), para amostras menores; utilizar o método de Scoring, mais precisamente o estimador de Harvey (1976 e 1974), o qual considera a estrutura heteroscedástica na estimação dos parâmetros do modelo; ou ainda, utilizar um método de otimização global, quando a verossimilhança é completamente conhecida. No entanto, encontrar a solução ideal não é nada fácil devido às várias dificuldades práticas. Nestas situações, estudos mais aprofundados sobre cada método de estimação devem ser considerados a fim de utilizar o método mais apropriado com menor custo computacional para seu cálculo. RORIGUES, S. A., DINIZ, C. A. R. Heteroscedastic regression model. Rev. Mat. Estat., São Paulo, v.24, n.2, p , ABSTRACT: One of the basic assumptions in the regression theory is that the errors should have a constant variance. When the violation of this assumption occurs, an option is to transform the data or to reestimate the variance structure of the data. This work introduces the linear heteroscedastic regression model as well as the estimate and detection of heteroscedasticity. KEYWORDS: Heteroscedasticity; estimation. Referências ABRAMOWITZ, M.; STEGUM, I. A. Handbook of mathematical functions. New York: Dover, p. BOX, G. E. P.; COX, D. R. An analysis of transformation (with discussion). J. R. Stat. Soc. Ser. B, London, v. 26, n.2, p , BROYDEN, C. G. The convergence of a class of double-rank minimization algorithms. Parts I and II, J. Inst. Math. Appl., Malden n.6, p e p , CRIBARI NETO, F.; SILVA, L. P. F.; CORDEIRO, G. M., Improved Heteroscedasticity-consistent matrix estimators. Biometrika, London, v.87, n.4, p , FLETCHER, R. A new approach to variable metric algorithms. Comput. J., Oxford, v.13, p , Rev. Mat. Estat., São Paulo, v.24, n.2, p ,
14 GEARY, R. C. A note on residual heterovariance and estimation efficiency in regression. Am. Stat., Washington, v.20, n.1 p.30-31, GLEJSER, H. A new test for heteroscedasticity. J. Am. Stat. Assoc., New York, v.6, p , GRIFFITHS, W. E.; SUREKHA, K. A Monte Carlo comparison of some Bayesian and sampling theory estimators in two heteroscedastic error models, Commun. Stat. Simul. Comput., New York, v.1, n.13, p , GOLDFARB, D. A family of variable metric methods derived by variational means. Math. Comp., Boston, v.26, p.23-26, HARVEY, A. C. Estimation of parameters in a heteroscedastic regression model. In: EUROPEAN MEETING OF THE ECONOMETRIC SOCIETY, 1974, Grenoble HARVEY, A. C. Estimating regression models with multiplicative heteroscedasticity. Econometrica, Malden, v.44, p , JUDGE, G. G. et al. The theory and practice of econometrics. New York: John Wiley, p. KMENTA, J. Elements of econometrics. New York: The Macmillan, p. LANCASTER, T. Grouping estimators on heteroscedastic data. J. Am. Stat. Assoc., New York, v.63, p , PARK, R. Estimation with heteroscedastic error terms. Econometrica, Malden, v.34, p , RUTEMILLER, H. C.; BOWERS, D. A. Estimation in a heteroscedastic regression model. J. Am. Stat. Assoc., New York, v.63, p , SEBER, G. A. F.; WILD C. J. Nonlinear regression. New York: John Wiley, p. SHANNO, D, F. Conditioning of quasi-newton methods for function minimization. Math. Comp., Boston, v.24, p , SZROETER, J. A class of parametric test for heteroscedasticity in linear econometric models. Econometrica, Malden, v.46, p , WHITE, H. A heteroskedasticity-consistent covariance matrix estimator and a direct test for heteroskedasticity. Econometrica, Malden, v.48, p , Recebido em Aprovado após revisão em Rev. Mat. Estat., São Paulo, v.24, n.2, p , 2006
Transformações e Ponderação para corrigir violações do modelo
Transformações e Ponderação para corrigir violações do modelo Diagnóstico na análise de regressão Relembrando suposições Os erros do modelo tem média zero e variância constante. Os erros do modelo tem
Disciplina de Modelos Lineares Professora Ariane Ferreira
Disciplina de Modelos Lineares 2012-2 Regressão Logística Professora Ariane Ferreira O modelo de regressão logístico é semelhante ao modelo de regressão linear. No entanto, no modelo logístico a variável
Aula 2 Uma breve revisão sobre modelos lineares
Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar
Análise de Dados Longitudinais Aula
1/35 Análise de Dados Longitudinais Aula 08.08.2018 José Luiz Padilha da Silva - UFPR www.docs.ufpr.br/ jlpadilha 2/35 Sumário 1 Revisão para dados transversais 2 Como analisar dados longitudinais 3 Perspectiva
CONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS 2003 2004 2005 2006 2007 2008 2009 2010 X 39,0 39,5 39,5 39,0 39,5 41,5 42,0 42,0 Y 46,5 65,5 86,0 100,0 121,0 150,5 174,0 203,0 A tabela acima mostra as quantidades, em milhões
Técnicas computacionais em probabilidade e estatística II
Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco AULA 1: Problemas Computacionais em Inferência Estatística.
AULA 11 Heteroscedasticidade
1 AULA 11 Heteroscedasticidade Ernesto F. L. Amaral 30 de julho de 2012 Análise de Regressão Linear (MQ 2012) www.ernestoamaral.com/mq12reg.html Fonte: Wooldridge, Jeffrey M. Introdução à econometria:
p( y θ ) depende de um parâmetro desconhecido θ.
55Modelação, Identificação e Controlo Digital 55 Método de Máxima Verosimilhança (Maximum Likelihood) Seja y uma variável aleatória (v. a.) cuja densidade de probabilidade p( y θ ) depende de um parâmetro
AULAS 25 E 26 Heteroscedasticidade
1 AULAS 25 E 26 Heteroscedasticidade Ernesto F. L. Amaral 10 e 15 de junho de 2010 Métodos Quantitativos de Avaliação de Políticas Públicas (DCP 030D) Fonte: Wooldridge, Jeffrey M. Introdução à econometria:
A Metodologia de Box & Jenkins
A Metodologia de Box & Jenins Aula 03 Bueno, 0, Capítulo 3 Enders, 009, Capítulo Morettin e Toloi, 006, Capítulos 6 a 8 A Metodologia Box & Jenins Uma abordagem bastante utilizada para a construção de
Modelos heterocedásticos com erros nas variáveis: modelando a emissão de raios-x contra a massa de buracos negros
Modelos heterocedásticos com erros nas variáveis: modelando a emissão de raios-x contra a massa de buracos negros Alexandre Galvão Patriota IME - USP Alexandre Galvão Patriota (IME - USP) Modelo com erro
Estimadores, pontual e intervalar, para dados com censuras intervalar
Estimadores, pontual e intervalar, para dados com censuras intervalar Débora Ohara, Estela Maris Pereira Bereta, Teresa Cristina Martins Dias Resumo Dados com censura intervalar ocorrem com frequência
Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados
Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados Erica Castilho Rodrigues 23 de Maio de 207 Introdução 2 3 Vimos como encontrar o EMV usando algoritmos numéricos. Duas possibilidades:
2 FUNDAMENTACÃO TEÓRICA
2 FUNDAMENTACÃO TEÓRICA Este capítulo apresenta os modelos de séries temporais chamados estruturais, nos quais o valor das observações é visto como composto de uma parte sistemática, modelada por uma equação
Multicolinariedade e Autocorrelação
Multicolinariedade e Autocorrelação Introdução Em regressão múltipla, se não existe relação linear entre as variáveis preditoras, as variáveis são ortogonais. Na maioria das aplicações os regressores não
Modelo de Regressão Múltipla
Modelo de Regressão Múltipla Modelo de Regressão Linear Simples Última aula: Y = α + βx + i i ε i Y é a variável resposta; X é a variável independente; ε representa o erro. 2 Modelo Clássico de Regressão
Análise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda
Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.
1. Inferência Estatística Inferência Estatística é o uso da informção (ou experiência ou história) para a redução da incerteza sobre o objeto em estudo. A informação pode ou não ser proveniente de um experimento
4 Modelos Lineares Generalizados
4 Modelos Lineares Generalizados Neste capítulo, serão apresentados arcabouços teóricos dos modelos lineares generalizados (MLGs) e como casos particulares desses modelos são aplicáveis ao problema da
Universidade Federal de Lavras
Universidade Federal de Lavras Departamento de Estatística Prof. Daniel Furtado Ferreira 6 a Lista de Exercícios Teoria da Estimação pontual e intervalar 1) Marcar como verdadeira ou falsa as seguintes
Ajuste e comparação de modelos para dados grupados e censurados
Ajuste e comparação de modelos para dados grupados e censurados 1 Introdução José Nilton da Cruz 1 Liciana Vaz de Arruda Silveira 2 José Raimundo de Souza Passos 2 A análise de sobrevivência é um conjunto
Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9
em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review
Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação
Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Vanessa Siqueira Peres da Silva 1 2 Daniel Furtado Ferreira 1 1 Introdução É comum em determinadas
Comparando equações de regressão em dados de saúde
Comparando equações de regressão em dados de saúde Terezinha Aparecida Guedes*, Ivan Ludgero Ivanqui e Ana Beatriz Tozzo Martins Departamento de Estatística, Universidade Estadual de Maringá, Av Colombo,
Ralph S. Silva
ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:
CC-226 Aula 07 - Estimação de Parâmetros
CC-226 Aula 07 - Estimação de Parâmetros Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Estimação de Parâmetros Para construir o classificador bayesiano, assumimos as distribuições
Capítulo 9 - Regressão Linear Simples (RLS): Notas breves
Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou
Markov Switching Models. Profa. Airlane Alencar. Depto de Estatística - IME-USP. lane. Ref: Kim e Nelson (1999) e Hamilton (1990)
Markov Switching Models Profa. Airlane Alencar Depto de Estatística - IME-USP www.ime.usp.br/ lane Ref: Kim e Nelson (1999) e Hamilton (1990) 1 Objetivo Mudança nos parâmetros de um modelo de regressão
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Objetivo Dada M classes ω 1, ω 2,..., ω M e um
CONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS Julgue os itens que se seguem, acerca da estatística descritiva. 51 Na distribuição da quantidade de horas trabalhadas por empregados de certa empresa, é sempre possível determinar
VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS
VERIFICAÇÃO DA ADEQUAÇÃO DO MODELO DE ANÁLISE DE VARIÂNCIA ANÁLISE DE RESÍDUOS Conforme foi apresentado anteriormente, o modelo de análise de variância assume que as observações são independentes e normalmente
Estimadores de MáximaVerossimilhança Corrigidosem Modelos de Regressão Não-Lineares Heteroscedásticos p. 1/35
Estimadores de MáximaVerossimilhança Corrigidosem Modelos de Regressão Não-Lineares Heteroscedásticos p. 1/35 Estimadores de Máxima Verossimilhança Corrigidos em Modelos de Regressão Não-Lineares Heteroscedásticos
Capítulo 2. Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha. Flávio Fogliatto
Capítulo 2 Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha Flávio Fogliatto 1 Ajustes de distribuições Em estudos de confiabilidade, dados são amostrados a partir de uma população
Modelo de regressão estável aplicado a econometria
Modelo de regressão estável aplicado a econometria financeira Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br 1 Objetivos
5 Avaliação dos estimadores propostos
5 valiação dos estimadores propostos Este capítulo apresenta as medidas estatísticas usuais para avaliar a qualidade de estimadores e as expressões utilizadas para a estimação destas medidas, a partir
ESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Escolha de modelos Até aqui assumimos que z
Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.
3. Ajuste do Modelo 4. Modelo Restrito Resíduos Resíduos 1 M = I- X(X X) -1 X Hipóteses do modelo Linearidade significa ser linear nos parâmetros. Identificação: Só existe um único conjunto de parâmetros
Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2010 PARTE II
Notas de Aulas Econometria I ** Eduardo P Ribeiro, 00 PARTE II Autocorrelação Autocorrelação: violação da hipótese: E [ε t ε t-s ] = 0, para s > 0, como por exemplo, ε t = ε t- + υ t, onde υ t é ruído
Modelos com erros nas variáveis: teoria e
Modelos com erros nas variáveis: teoria e aplicações Alexandre Galvão Patriota Agradecimentos à Fapesp, Cnpq e Capes pelo apoio financeiro Alexandre G. Patriota (patriota@ime.usp.br) Modelos com erros
Correlação e Regressão
Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe
Estatística e Modelos Probabilísticos - COE241
Estatística e Modelos Probabilísticos - COE241 Aula passada Variância amostral Método de Replicações Independentes Aula de hoje Para que serve a inferência estatística? Método dos Momentos Maximum Likehood
Testes de Raiz Unitária para Dados em Painel
Aula 7 Bibliografia: Stata, 2017. help xtunitroot. From Stata/SE 13 (accessed on Oct. 23, 2018). Pesaran, M.H. (2015). Time series and panel data econometrics. Oxford: Oxford University Press. Rafael S.
Introdução ao modelo de Regressão Linear
Introdução ao modelo de Regressão Linear Prof. Gilberto Rodrigues Liska 8 de Novembro de 2017 Material de Apoio e-mail: gilbertoliska@unipampa.edu.br Local: Sala dos professores (junto ao administrativo)
Homocedasticidade? Exemplo: consumo vs peso de automóveis
REGRESSÃO Análise de resíduos Homocedasticidade? Exemplo: consumo vs peso de automóveis 60 50 Consumo (mpg) 40 30 0 10 0 1500 000 500 3000 3500 4000 4500 Peso 0 Diagrama de resíduos 15 10 Resíduos 5 0-5
CONHECIMENTOS ESPECÍFICOS
CESPE/UnB FUB/03 fa 5 4 3 CONHECIMENTOS ESPECÍFICOS 60 As distribuições B e C possuem os mesmos valores para os quartis Q e Q, e o quartil superior em B corresponde ao quartil central (Q ) da distribuição
Esse material foi extraído de Barbetta (2007 cap 13)
Esse material foi extraído de Barbetta (2007 cap 13) - Predizer valores de uma variável dependente (Y) em função de uma variável independente (X). - Conhecer o quanto variações de X podem afetar Y. Exemplos
Modelos de regressão para dados correlacionados. Cibele Russo
Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo
CONHECIMENTOS ESPECÍFICOS
CONHECIMENTOS ESPECÍFICOS As variáveis aleatórias X e Y seguem uma distribuição de Bernoulli com probabilidade de sucesso igual a 0,4. Considerando S = X + Y e que os eventos aleatórios A = [X = 1] e B
ESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Se a integração analítica não é possível ou
Inferência Estatistica
Inferência Estatistica Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Modelos e Inferência Um modelo é uma simplificação da realidade (e alguns
ESTATÍSTICA COMPUTACIONAL
ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Introdução Solução de equações não lineares
AGA Análise de Dados em Astronomia I 7. Modelagem dos Dados com Máxima Verossimilhança: Modelos Lineares
1 / 0 AGA 0505- Análise de Dados em Astronomia I 7. Modelagem dos Dados com Máxima Verossimilhança: Modelos Lineares Laerte Sodré Jr. 1o. semestre, 018 modelos modelagem dos dados dado um conjunto de dados,
Universidade Nova de Lisboa FACULDADE DE ECONOMIA
Universidade Nova de Lisboa FACULDADE DE ECONOMIA Exame de Econometria I 1998/1999 (150 minutos) 12 de Janeiro de 1999 Nome ou nº por extenso: Na folha existem espaços para apresentar as suas respostas.
Estatística e Modelos Probabilísticos - COE241
Estatística e Modelos Probabilísticos - COE241 Aula passada Variância amostral Método de Replicações Independentes Aula de hoje Para que serve a inferência estatística? Método dos Momentos Maximum Likehood
AULAS 14 E 15 Modelo de regressão simples
1 AULAS 14 E 15 Modelo de regressão simples Ernesto F. L. Amaral 18 e 23 de outubro de 2012 Avaliação de Políticas Públicas (DCP 046) Fonte: Wooldridge, Jeffrey M. Introdução à econometria: uma abordagem
Regressão Linear - Parte I
UFPE - Universidade Federal de Pernambuco Curso: Economia Disciplina: ET-406 Estatística Econômica Professor: Waldemar Araújo de S. Cruz Oliveira Júnior Regressão Linear - Parte I 1 Introdução Podemos
Análise de regressão linear simples. Diagrama de dispersão
Introdução Análise de regressão linear simples Departamento de Matemática Escola Superior de Tecnologia de Viseu A análise de regressão estuda o relacionamento entre uma variável chamada a variável dependente
Capítulo 10 - Identificação de Sistemas Não Lineares: Algoritmos
Capítulo 10 - Identificação de Sistemas Não Lineares: Algoritmos Prof. Samir Martins UFSJ-CEFET/MG Programa de Pós Graduação em Engenharia Elétrica - PPGEL São João del-rei, 16 de outubro de 2018 1 / 31
ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.
ECONOMETRIA Prof. Patricia Maria Bortolon, D. Sc. Cap. 11 Heterocedasticidade: o que acontece se a variância do erro não é constante? Fonte: GUJARATI; D. N. Econometria Básica: 4ª Edição. Rio de Janeiro.
A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004).
3 Séries temporais A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004). 3.1. Princípios fundamentais Conforme Box et al. (1994), uma
Análise de Regressão Linear Simples e
Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável
Revisão do MRLM - Análise "Cross-Section"
Revisão do MRLM - Análise "Cross-Section" APLICAÇÕES DE ECONOMETRIA Notas Práticas FEUC - 1 o Sem. 2010/2011 Vítor Castro (Notas Práticas) MRLM - Revisão FEUC - 1 o Sem. 2010/2011 1 / 13 Análise "Cross-Section"
Teste de Homocedasticidade.
Teste de Homocedasticidade. Aula 4 Gujarati, 000, Capítulo Heij et al., Seção 5.4 Wooldridge, 0 Capítulo 8 (seções 8. a 8.4) HETEROCEDASTICIDADE Essa aula objetiva responder às seguintes perguntas: Qual
AULAS 21 E 22 Análise de Regressão Múltipla: Estimação
1 AULAS 21 E 22 Análise de Regressão Múltipla: Estimação Ernesto F. L. Amaral 28 de outubro e 04 de novembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Cohen, Ernesto, e Rolando Franco. 2000. Avaliação
Processamento de erros grosseiros - Identiمحcaچcﷺao
Processamento de erros grosseiros - Identiمحcaچcﷺao Método ˆb Base: variável ˆβ interpretada como uma estimativa do erro associado à medida; verificação da magnitude do erro com relação a faixa esperada
Econometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010
Aula - 6/8/010 Econometria Econometria 1. Hipóteses do Modelo de RLM O modelo de regressão linear múltipla Estudar a relação entre uma variável dependente e uma ou mais variáveis independentes. Forma genérica:
Tratamento Estatístico de Dados em Física Experimental
Tratamento Estatístico de Dados em Física Experimental Prof. Zwinglio Guimarães o semestre de 06 Tópico 7 - Ajuste de parâmetros de funções (Máxima Verossimilhança e Mínimos Quadrados) Método da máxima
REGRESSÃO E CORRELAÇÃO
REGRESSÃO E CORRELAÇÃO A interpretação moderna da regressão A análise de regressão diz respeito ao estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis explanatórias,
PARTE 1 ANÁLISE DE REGRESSÃO COM DADOS DE CORTE TRANSVERSAL CAPÍTULO 2 O MODELO DE REGRESSÃO SIMPLES
PARTE 1 ANÁLISE DE REGRESSÃO COM DADOS DE CORTE TRANSVERSAL CAPÍTULO 2 O MODELO DE REGRESSÃO SIMPLES 2.1 DEFINIÇÃO DO MODELO DE REGRESSÃO SIMPLES Duas variáveis: y e x Análise explicar y em termos de x
5 Filtro de Kalman Aplicado ao Modelo de Schwartz e Smith (2000)
5 Filtro de Kalman Aplicado ao Modelo de Schwartz e Smith (2000) A primeira parte deste capítulo, referente à passagem dos modelos estocásticos para as equações do Filtro de Kalman, já foi previamente
aula ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES
ANÁLISE DO DESEMPENHO DO MODELO EM REGRESSÕES 18 aula META Fazer com que o aluno seja capaz de realizar os procedimentos existentes para a avaliação da qualidade dos ajustes aos modelos. OBJETIVOS Ao final
UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.
UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO PROJETO DE EXTENSÃO Software R: Capacitação em análise estatística de dados utilizando um software livre. Fonte: https://www.r-project.org/ Módulo
Estimação de Variáveis Instrumentais e Mínimos Quadrados de Dois Estágios. Wooldridge, Cápítulo 15
Estimação de Variáveis Instrumentais e Mínimos Quadrados de Dois Estágios Wooldridge, Cápítulo 5 Variáveis Instrumentais () 2 Variáveis Instrumentais Considere o seguinte modelo de regressão linear múltipla
Disciplina de Modelos Lineares
Disciplina de Modelos Lineares 2012-2 Seleção de Variáveis Professora Ariane Ferreira Em modelos de regressão múltipla é necessário determinar um subconjunto de variáveis independentes que melhor explique
CONHECIMENTOS ESPECÍFICOS
fonte de graus de soma de quadrado variação liberdade quadrados médio teste F regressão 1 1,4 1,4 46,2 resíduo 28 0,8 0,03 total 2,2 A tabela de análise de variância (ANOVA) ilustrada acima resulta de
Ajuste do modelo de regressão linear: Inferência Bayesiana, aspectos computacionais e seleção de variáveis.
Ajuste do modelo de regressão linear: Inferência Bayesiana, aspectos computacionais e seleção de variáveis. João Daniel Nunes Duarte a, Vinícius Diniz Mayrink b a Estudante de Graduação, e-mail: joaodaniel@ufmg.br
Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 12
em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 12 Regressão com Variáveis Não-Estacionárias Considere três processos estocásticos definidos pelas seguintes
DISCRETIZADAS NA ANÁLISE DE DADOS DE SOBREVIVÊNCIA RESUMO
APLICAÇÕES DE DISTRIBUIÇÕES DISCRETIZADAS NA ANÁLISE DE DADOS DE SOBREVIVÊNCIA Danielle Peralta 1, Josmar Mazucheli 1, Isabelle Picada Emanuelli 2 e Robson Marcelo Rossi 1 1 Departamento de Estatística,
APLICAÇÃO DO MÉTODO DE BUCKLEY-JAMES COMO ALTERNATIVA AO MODELO DE COX NA VIOLAÇÃO DA PRESSUPOSIÇÃO DE RISCOS PROPORCIONAIS.
APLICAÇÃO DO MÉTODO DE BUCKLEY-JAMES COMO ALTERNATIVA AO MODELO DE COX NA VIOLAÇÃO DA PRESSUPOSIÇÃO DE RISCOS PROPORCIONAIS. Rogério Antonio de OLIVEIRA 1 Giovanni Faria SILVA 2 Liciana Vaz de Arruda SILVEIRA
Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos
Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos Lic. Eng. Biomédica e Bioengenharia-2009/2010 Modelos de regressão É usual estarmos interessados em estabelecer uma relação entre uma variável
Especialização em Engenharia de Processos e de Sistemas de Produção
Especialização em Engenharia de Processos e de Sistemas de Produção Projetos de Experimento e Confiabilidade de Sistemas da Produção Prof. Claudio Luis C. Frankenberg 3ª parte Conforme foi apresentado
Tópicos de Estatística Espacial Geoestatística
Tópicos de Estatística Espacial Geoestatística Anderson Castro Soares de Oliveira Geoestatística A geoestatística é uma análise espacial que considera que a variável em estudo se distribui continuamente
Gabarito - Lista 5 - Questões de Revisão
Gabarito - Lista 5 - Questões de Revisão Monitores: Camila Steffens e Matheus Rosso Parte I - Teoria assintótica 1. Enuncie a lei dos grandes números e o teorema central do limite. A LGN em sua expressão
Econometria - Lista 6
Econometria - Lista 6 Professores: Hedibert Lopes, Priscila Ribeiro e Sérgio Martins Monitores: Gustavo Amarante e João Marcos Nusdeo Exercício 1 A curva de Phillips desempenha um papel fundamental na
O método dos mínimos quadrados: análise de regressão
O métodos dos mínimos quadrados é um método famoso para lidar com dados ruidosos. Sua justificativa segue diretamente do método da máxima verossimilhança. Para Y i dados medidos en valores das variável
Modelos Lineares Generalizados
Modelos Lineares Generalizados Emilly Malveira de Lima Análise de Dados Categóricos Universidade Federal de Minas Gerais - UFMG 10 de Maio de 2018 Emilly Malveira (PGEST-UFMG) 10 de Maio de 2018 1 / 20
étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
étodos uméricos SISTEMAS DE EQUAÇÕES LINEARES (Continuação) Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UNIVERSIDADE DE JOÃO DEL-REI PRÓ-REITORIA DE PESQUISA CENTRO
MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS
MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS 1 Diversas distribuições podem ser consideradas para a modelagem de dados positivos com distribuição contínua e assimétrica, como, por exemplo, as
AGA Análise de Dados em Astronomia I. 6. O Método da Máxima Verossimilhança- I
1 / 26 1. Introdução AGA 0505 - Análise de Dados em Astronomia I 6. O Método da Máxima Verossimilhança- I Laerte Sodré Jr. 1o. semestre, 2019 introdução aula de hoje: 1 modelagem dos dados 2 a verossimilhança
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE AGRONOMIA DEPARTAMENTO DE ZOOTECNIA MODELO NORMAL NÃO-LINEAR 1
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE AGRONOMIA DEPARTAMENTO DE ZOOTECNIA MODELO NORMAL NÃO-LINEAR AUTORES: Prof. José Braccini Neto. Departamento de Zootecnia - UFRGS Prof. Adair José
Coeficiente de determinação R 2 no modelo de regressão linear normal
Coeficiente de determinação R 2 no modelo de regressão linear normal Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br
Estatística e Modelos Probabilísticos - COE241
Estatística e Modelos Probabilísticos - COE241 Aula passada Intervalo de confiança Método de Replicações Independentes Aula de hoje Para que serve a inferência estatística? Método dos Momentos Maximum
MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ 13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 3 4 5 6 7 8 9 10 11 1 13 14 15 e 16 Introdução à probabilidade (eventos,
3. Experimentos a um único fator: Análise de Variância (ANOVA) 3.7 Comparações entre médias de tratamento
3. Experimentos a um único fator: Análise de Variância (ANOVA) 3.7 Comparações entre médias de tratamento Suponha que a hipótese nula, de médias de tratamento iguais, tenha sido rejeitada em favor da hipótese
Introdução. São duas técnicas estreitamente relacionadas, que visa estimar uma relação que possa existir entre duas variáveis na população.
UNIVERSIDADE FEDERAL DA PARAÍBA Correlação e Regressão Luiz Medeiros de Araujo Lima Filho Departamento de Estatística Introdução São duas técnicas estreitamente relacionadas, que visa estimar uma relação
Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33
Mineração de Dados Aula 6: Finalização de Regressão e Classificação Rafael Izbicki 1 / 33 Como fazer um IC para o risco estimado? Vamos assumir que ( X 1, Ỹ1),..., ( X s, Ỹs) são elementos de um conjunto
Métodos Quantitativos para Avaliação de Políticas Públicas
ACH3657 Métodos Quantitativos para Avaliação de Políticas Públicas Aula 11 Análise de Resíduos Alexandre Ribeiro Leichsenring alexandre.leichsenring@usp.br Alexandre Leichsenring ACH3657 Aula 11 1 / 26
Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague
Econometria IV Modelos Lineares de Séries Temporais Fernando Chague 2016 Estacionariedade Estacionariedade Inferência estatística em séries temporais requer alguma forma de estacionariedade dos dados Intuição:
Capítulo 9 - Regressão Linear Simples (RLS): Notas breves
Capítulo 9 - Regressão Linear Simples RLS: Notas breves Regressão Linear Simples Estrutura formal do modelo de Regressão Linear Simples RLS: Y i = β 0 + β 1 x i + ε i, 1 onde Y i : variável resposta ou