Comparação entre medidas clássicas e robustas para identificação de outliers em regressão

Tamanho: px
Começar a partir da página:

Download "Comparação entre medidas clássicas e robustas para identificação de outliers em regressão"

Transcrição

1 Comparação entre medidas clássicas e robustas para identificação de outliers em regressão Gabriela Isabel L. Alves (1), Verônica Maria C. Lima (2) (1) Curso de Graduação em Estatística (2) Departamento de Estatística Universidade Federal da Bahia Salvador/BA, , Brazil Resumo A técnica de análise de regressão linear não está completa sem o estudo dos resíduos para a identificação de possíveis outliers e de alguns outros diagnósticos. Outliers estão presentes em praticamente todos os conjuntos de dados, em qualquer domínio de aplicação. Pesquisas realizadas com grandes quantidades de observações tornam mais difíceis sua detecção visual. O objetivo deste trabalho é comparar as medidas clássicas com as medidas robustas para identificação de outliers. Entre as medidas clássicas foram consideradas: Leverage, DFBeta DFFit, Cook, Covratio e a distância de Mahalanobis. As medidas robustas consideradas foram Elipsóide de Volume Mínimo e Covariância de Determinante Mínimo. Através da análise de vários conjuntos de dados, os resultados revelaram que as medidas robustas, que utilizam estimadores resistentes a uma proporção de dados contaminados, mostraram-se mais eficientes na identificação de outliers. Palavras-Chaves: Outliers, diagnósticos clássicos, diagnósticos robustos. 1 Introdução Segundo Rousseeuw and van Zomeren (1990), outliers são observações que não seguem o padrão da maioria dos dados. Outliers estão presentes em praticamente todos os conjuntos de dados, em qualquer domínio de aplicação. A maioria das pesquisas em ciência, indústria e economia, lidam com grandes quantidades de observações, o que aumenta a possibilidade de se encontrar outliers (Todorov and Filzmoser (2009)). Em regressão, após o ajuste do modelo, é comum a utilização de várias medidas de diagnósticos para identificação de possíveis outliers no conjunto de dados. Várias medidas de diagnósticos foram planejadas para detectar observações individuais ou grupo de observações que diferem do restante dos dados. Muitas delas estão baseadas em resíduos de mínimos quadrados ordinários (MQO). Entretanto, como o método de MQO tenta evitar grandes resíduos, um outlier apenas pode comprometer completamente as estimativas dos parâmetros do modelo de regressão. Outras medidas de diagnóstico estão baseadas em deletar uma observação por vez, e observar a diferença nas estimativas dos parâmetros do modelo entre os valores ajustados com e sem a i-ésima observação. Pode acontecer que um subconjunto das observações seja altamente influente, mas não uma observação 1

2 individualmente (Rousseeuw and Leroy (1987)). Neste trabalho, vamos considerar as medidas de diagnósticos Leverage, DFBeta, DFFit, Cook, Covratio e a distância de Mahalanobis. Devido a fragilidade destas medidas na identificação de outliers, tem sido propostas na literatura diversas medidas robustas. Neste trabalho, vamos considerar as distâncias robustas Elipsóide de Volume Mínimo e Covariância de Determinante Mínimo. Ambas estas distâncias estão baseadas em estimadores robustos para o vetor de médias e matriz de covariâncias. O objetivo deste trabalho é realizar uma comparação entre as várias medidas, clássicas e robustas, para identificação de outliers. Este trabalho está organizado como segue. A Seção 2, descreve o modelo de regressão linear e o método de estimação de mínimos quadrados ordinários. As Seções 3 e 4, apresentam as medidas, clássicas e robustas, respectivamente, e a aplicação destas medidas a dados da literatura. Por fim, na Seção 5, conclui este trabalho. 2 Modelo de Regressão Linear O modelo de regressão linear tem o objetivo de descrever a relação existente entre as variáveis explanatórias X e a variável resposta y. Essa relação pode ser escrita como: y = Xβ + ɛ, em que y é um vetor (n 1) de respostas, X é uma matriz (n p) (p < n) de variáveis independentes, β é um vetor (p 1) de parâmetros desconhecidos e ɛ é um vetor (n 1) de erros aleatórios independentes, cada um com média zero e apresentando a propriedade de homocedasticidade, ou seja, variância constante. Os propósitos da regressão linear são: a descrição e controle dos dados, estimação dos parâmetros e predição (Montgomery and Peck (1992)). A estimação dos parâmetros do modelo é comumente realizada utilizando o método de mínimos quadrados ordinários (MQO). Este método consiste na minimização da soma dos quadrados dos erros e fornece estimadores com propriedades desejáveis como não viés, consistência e eficiência. O estimador de mínimos quadrados pode ser escrito na forma matricial como: ˆβ = (X X) 1 (X Y ). Os resíduos são definidos como a diferença entre os valores observados e os valores estimados pelo modelo em questão. Uma análise de regressão linear não está completa sem o estudo dos resíduos para a identificação de outliers e de alguns outros diagnósticos. Se o modelo for apropriado para amostra em questão, os resíduos devem refletir as características dos erros. 3 Diagnósticos Clássicos de Regressão Outliers ocorrem muito freqüentemente em dados reais e eles, muitas vezes, não são observados pelo usuário. Tanto a variável resposta como as variáveis explanatórias do modelo podem conter outliers. Neste último caso, eles são chamados de pontos de alavanca. Ambos os tipos de outliers podem afetar as estimativas de mínimos quadrados ordinários. Existem na literatura várias medidas para identificação de outliers (ver por ex. Montgomery and Peck (1992), Mendes (1999) e Rousseeuw and Leroy (1987)). Abaixo, descrevemos algumas delas. 1. Medida de Leverage (h ii ) A medida de leverage (h ii ) mede a importância da i-ésima observação na determinação do ajuste do modelo, em que h ii é o valor do i-ésimo elemento da diagonal principal da matriz H. Valores de h ii > 2p/n devem ser verificados, pois, podem ser pontos de alavanca. Além disso, podem ser consideradas observações não problemáticas aquelas com h ii menores que 0,2, enquanto que observações extremamente influentes seriam aquelas com h ii maiores que 0,5. 2. DFBeta j(i) Esta estatística mede a influência da i-ésima observação sobre o valor estimado do j-ésimo β, ou seja, avalia a influência de uma dada observação na estimação dos parâmetros. A estatística 2

3 é dada por: DFBeta (j)i = ˆβ j ˆβ j( i) Cjj QMRes ( i), em que C jj é o (jj)-ésimo elemento da diagonal da matriz (X X) 1. Os valores de DFBeta (j)i > 2/ n indicam que a observação pode ser considerada influente. 3. DFFit i O DFFit i mede a influência provocada no valor ajustado pela retirada da i-ésima observação. ŷ É definido por: DFFit i = i ŷ ( i) hii. Valores absolutos excedendo 2 p/n nos fornece QMRes ( i) indícios de observações influentes. 4. Distância de Cook (D i ) A distância de Cook, representada por D i mede o afastamento do vetor de estimativas dos coeficientes da regressão provocado pela retirada da i-ésima observação. A estatística é dada por D i = ( ˆβ (i) ˆβ ( i) ) X X( ˆβ (i) ˆβ ( i) ). Valores de D pqmres i > 1 sugerem a avaliação de observações influentes. Outra recomendação é comparar D i com a mediana da distribuição F com graus de liberdade p e n p (F 0.5,p,n p ). 5. COVRATIO i Uma medida que pode nos informar sobre a precisão geral da estimação é o COVRATIO. Esta mede o efeito da retirada da i-ésima observação no determinante da matriz de covariância das estimativas. É definida por COVRATIO i = det[qmres ( i) (X ( i) X ( i)) 1 ]. Valores de det[qmres(x X) 1 ] COV RAT IO i > 1 + 3p/n indicam que essas observações podem ser consideradas influentes. 6. Distância de Mahalanobis (MD i ) A distância de Mahalanobis é baseada na matriz de covariâncias amostrais e no vetor de médias amostrais. Ela é definida como MD i = (x i ˆµ) ˆ 1 (x i ˆµ), em que ˆµ representa a média amostral e ˆ é a matriz (p 1) (p 1) das covariâncias amostrais. Os valores de MD i devem ser comparados com a raiz quadrada do percentil de probabilidade de uma qui-quadrado com (p 1) graus de liberdade. 3.1 Análise de dados Vamos agora investigar o uso destas medidas em alguns conjuntos de dados. Exemplo 1: Oxidação de amônia em ácido nítrico. Rousseeuw and Leroy (1987) consideram um banco de dados referente ao funcionamento de uma fábrica para oxidação de amônia em ácido nítrico. Este conjunto de dados é composto por 21 observações com 3 variáveis independentes, sendo elas: a taxa de funcionamento, a temperatura de entrada da água de resfriamento e a concentração do ácido. Segundo Rousseeuw and van Zomeren (1990), as observações 1, 2, 3 e 21 são outliers. A Tabela 1 apresenta as medidas Leverage, DFBeta, DFFit, Cook, Covratio e Mahalanobis avaliando os pontos influentes. De acordo com a Tabela 1, a medida de Leverage identificou erroneamente a observação 17, enquanto o DFBeta identificou corretamente uma observação (21) e uma observação erroneamente (4). Com relação a medida de Covratio, esta identificou as observações 17 e 21 como pontos influentes sendo, uma observação identificada corretamente (21) e uma identificada erroneamente (17). Já o DFFit, Cook e Mahalanobis não consideraram nenhuma observação como sendo influente. Exemplo 2: Gravidade específica da madeira. Rousseeuw (1984) consideram os dados descritos em Draper and Smith (1966) sobre a influência de fatores anatômicos na gravidade es- 3

4 Tabela 1: Resultados da verificação das medidas influentes para os dados sobre oxidação de amônia em ácido nítrico. As observações 1, 2, 3 e 21 são outliers. Medidas Pontos detectados Resultados Leverage 17 O ponto identificado não é influente. DFbeta x1 21 O ponto identificado é influente. DFbeta x2 4 e 21 Identificou 1 ponto corretamente e 1 erroneamente. DFbeta x3 - Nenhum dos 4 pontos foram identificados. DFfit - Nenhum dos 4 pontos foram identificados. Cook - Nenhum dos 4 pontos foram identificados. Covratio 17 e 21 Identificou 1 ponto corretamente e 1 erroneamente. Mahalanobis - Nenhum dos 4 pontos foram identificados. MVE 1, 2 e 3 Todos os pontos identificados são influentes. MCD 1, 2, 3, 15, 16, 17, 18, 19 e 21 Identificou 4 pontos corretamente e 5 erroneamente. pecífica da madeira. Este conjunto de dados contém 20 observações com 5 variáveis independentes. As observações (4, 6, 8 e 19) foram substituídas por outliers. A Tabela 2 apresenta as medidas de Leverage, DFBeta, DFFit, Cook, Covratio e Mahalanobis avaliando os pontos influentes para esse banco de dados. De acordo com a Tabela 2, as medidas de Leverage, Cook e distância de Mahalanobis não consideram nenhum dos pontos como sendo influente. O DFFit, DFBeta e Covratio consideraram várias observações como influentes, entretanto nenhuma delas são outliers. Tabela 2: Resultados da verificação das medidas influentes para os dados sobre gravidade específica da madeira. As observações 4, 6, 8 e 19 são outliers. Medidas Pontos detectados Resultados Leverage - Nenhum dos 4 pontos influentes foram identificados. DFbeta x1 3, 7, 12 e 16 Todos os pontos identificados não são influentes. DFbeta x2 3, 5, 11 e 16 Todos os pontos identificados não são influentes. DFbeta x3 7, 11 e 12 Todos os pontos identificados não são influentes. DFbeta x4 16 O ponto identificado não é influente. DFbeta x5 3, 7 e 11 Todos os pontos identificados não são influentes. DFfit 7, 11 e 12 Todos os pontos identificados não são influentes. Cook - Nenhum dos 4 pontos influentes foram identificados. Covratio 10 e 16 Todos os pontos identificados não são influentes. Mahalanobis - Nenhum dos 4 pontos influentes foram identificados. MVE 4, 6, 8, 11, e 19 Identificou 1 ponto erroneamente. MCD 4, 6, 7, 8, 11, 16 e 19 Identificou 3 pontos erronemente. 4 Diagnósticos Robustos de Regressão. De acordo com os resultados descritos na seção anterior, é possível perceber a necessidade de se considerar outras medidas de diagnósticos para identificação de outliers. Neste trabalho, vamos considerar o Elipsóide de Volume Mínimo e a Covariância de Determinante Mínimo. 4

5 Para melhor compreensão dos estimadores robustos é necessário introduzir o conceito de ponto de ruptura, que é uma medida global de robustez. O ponto de ruptura de um estimador mede qual seria a maior porcentagem de contaminação que um estimador poderia suportar e ainda assim fornecer informação confiável sobre o parâmetro considerado. Quanto mais próximo de 0,5 é o ponto de ruptura, mais resistente é este estimador a outliers. 1. Elipsóide de Volume Mínimo Segundo Rousseeuw and van Zomeren (1990), o Elipsóide de Volume Mínimo (Minimum Volume Ellipsoid - MVE) é baseado no elipsóide de menor volume cobrindo pelo menos k pontos de X, em que k em geral é igual a parte inteira de [n/2] + 1. Este estimador possui ponto de ruptura 0,5 e é equivariante, ou seja, T (x 1 A + b,..., x n A + b) = T (x 1,..., x n )A + b e C(x 1 A + b,..., x n A + b) = A t C(x 1,..., x n )A. Este estimador robusto é definido pelo par (T, C) onde T é um vetor de dimensão p da média amostral, e C é a matriz de dimensão p p da matriz de covariância amostral. A distância robusta definida para o MVE é: RD i = (x i T (X))C(X) 1 (x i T (X)) t. Rousseeuw e van Zomeren (1990) apresentam dois algoritmos aproximados para o MVE, o algoritmo de reamostragem e o algoritmo de projeção. 2. Covariância de Determinante Mínimo De acordo com Rousseeuw (1985), o estimador Covariância de Determinante Mínimo (Minimum Covariance Determinant Estimator - MCD) para um conjunto de dados {x 1,..., x n } em R p é definido pelo subconjunto {x i1,..., x ik } de k observações, cuja matriz de covariância tem o menor determinante entre todos os subconjuntos possíveis de tamanho k. O estimador do vetor de locação é definido como a média aritmética dos k pontos de X para os quais o determinante da matriz de covariância é mínimo. O cálculo do estimador MCD está longe de ser trivial. Um algoritmo ingênuo continuaria investigando exaustivamente por todos os subconjuntos de tamanho k para encontrar o subconjunto com o menor determinante de sua matriz de covariância, mas, isso só será viável para conjuntos de dados muito pequenos. Segundo Todorov and Filzmoser (2009), o MCD foi negligenciado em favor do MVE porque o algoritmo de reamostragem simples foi mais eficiente para MVE. Entretanto, o ponto de ruptura deste estimador coincide com o do MVE (0,5) e tem baixa convergência, tornando-se mais eficiente estatisticamente. Ambas distâncias estão disponíveis no software R através dos pacotes robustbase e rrcov, desenvolvidos por Todorov and Filzmoser (2009). 4.1 Análise de Dados Vamos agora aplicar essas medidas robustas nos conjuntos de dados em que foram aplicados as medidas clássicas de identificação de outliers. Voltando ao exemplo do funcionamento da fábrica para oxidação de amônia em ácido nítrico, que apresenta as observações 1, 2, 3 e 21 como outliers. A Tabela 1 apresenta um resumo das medidas robustas avaliando os pontos influentes desse banco de dados. O MVE identificou as observações 1, 2 e 3, sendo que todos identificados são realmente outliers, porém, faltou identificar a observação 21. Já o MCD identificou as observações 1, 2, 3, 15, 16, 17, 18, 19 e 21, sendo quatro identificados corretamente (1, 2, 3 e 21) e cinco erroneamente (15, 16, 17, 18 e 19). Retomemos agora aos dados da Gravidade específica da madeira (Exemplo 2). De acordo com a Tabela 2, o MVE identificou as observações 4, 6, 8, 11 e 19, sendo quatro identificados corretamente (4, 6, 8 e 19) e uma erroneamente (11). O MCD identificou as observações 4, 6, 7, 8, 11, 16 e 19, 5

6 sendo quatro observações identificadas corretamente (4, 6, 8 e 19) e três identificadas erroneamente (7, 11 e 16). 5 Conclusões Com base nos resultados encontrados, observou-se que as medidas de Leverage, DFBeta, DFFit, Cook, Covratio e a distância de Mahalanobis não produzem resultados satisfatórios, deixando de identificar observações que são, de fato, outliers e, outras vezes, identificando observações como outliers quando na realidade não o são. Com relação aos diagnósticos robustos, MVE e MCD, estes apresentaram melhores resultados, pois, identificaram a maioria dos outliers. Entretanto, estas medidas também identificaram observações que não são outliers. O próximo passo deste trabalho será considerar outros diagnósticos robustos tais como os resíduos padronizados provenientes da regressão do estimador menor mediana dos quadrados dos resíduos, proposto por Rousseeuw (1984). Agradecimentos Este trabalho recebe apoio do CNPq através de bolsa de IC. Referências Draper, N. R. and Smith, H. (1966). Applied Regression Analysis. Wiley, New York. Mendes, B. V. M. (1999). Regressão Robusta: Conceitos, Aplicações e Aspectos Computacionais. Associação Brasileira de Estatística, São Paulo. Montgomery, D. C. and Peck, E. A. (1992). Introduction to linear regression analysis. J. Wiley, New York. Rousseeuw, P. J. (1984). Least median of squares regression. Journal of American Statistical Association, 79: Rousseeuw, P. J. (1985). Multivariate estimation with high breakdown point. In Grossmann, W., Pflug, G., Vincze, I., and Wetz, W., editors, Mathematical Statistics and Aplications, pages Reidel Publishing Company, Dordrecht. Rousseeuw, P. J. and Leroy, A. M. (1987). Robust Regression and Outlier Detection. Wiley, New York. Rousseeuw, P. J. and van Zomeren, B. C. (1990). Unmasking multivariate outliers and leverage points. Journal of American Statistical Association, 85: Todorov, V. and Filzmoser, P. (2009). An object-oriented framework for robust multivariate analysis. Journal of Statistical Software, 32:

Faturamento de Restaurantes

Faturamento de Restaurantes Faturamento de Restaurantes Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2015 G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2015 1 / 28

Leia mais

Aplicação do Controle Estatístico Multivariado no Processo de Extrusão de Tubos de PVC.

Aplicação do Controle Estatístico Multivariado no Processo de Extrusão de Tubos de PVC. Aplicação do Controle Estatístico Multivariado no Processo de Extrusão de Tubos de PVC. Ítalo L. Fernandes, Lidiane J. Michelini, Danilo M. Santos & Emerson Wruck Universidade Estadual de Goiás UEG, CEP

Leia mais

Monitoramento e Controle de Processo Multivariado

Monitoramento e Controle de Processo Multivariado Monitoramento e Controle de Processo Multivariado Roteiro 1. O Problema do Controle da Qualidade Multivariado 2. Descrição de Dados Multivariados 3. Gráfico de Controle T 2 de Hotelling (Subgrupos) 4.

Leia mais

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A.

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A. IMES Catanduva Probabilidades e Estatística Estatística no Excel Matemática Bertolo, L.A. Aplicada Versão BETA Maio 2010 Bertolo Estatística Aplicada no Excel Capítulo 3 Dados Bivariados São pares de valores

Leia mais

AULAS 13, 14 E 15 Correlação e Regressão

AULAS 13, 14 E 15 Correlação e Regressão 1 AULAS 13, 14 E 15 Correlação e Regressão Ernesto F. L. Amaral 23, 28 e 30 de setembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de

Leia mais

Exemplo Regressão Linear Múltipla

Exemplo Regressão Linear Múltipla Exemplo Regressão Linear Múltipla Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 1 o Semestre 2013 G. A. Paula (IME-USP) Salário de Executivos 1 o Semestre 2013 1 / 27

Leia mais

Cláudio Tadeu Cristino 1. Julho, 2014

Cláudio Tadeu Cristino 1. Julho, 2014 Inferência Estatística Estimação Cláudio Tadeu Cristino 1 1 Universidade Federal de Pernambuco, Recife, Brasil Mestrado em Nutrição, Atividade Física e Plasticidade Fenotípica Julho, 2014 C.T.Cristino

Leia mais

MODIFICAÇÃO DO TESTE DE NORMALIDADE DE SHAPIRO-WILK MULTIVARIADO DO SOFTWARE ESTATÍSTICO R

MODIFICAÇÃO DO TESTE DE NORMALIDADE DE SHAPIRO-WILK MULTIVARIADO DO SOFTWARE ESTATÍSTICO R MODIFICAÇÃO DO TESTE DE NORMALIDADE DE SHAPIRO-WILK MULTIVARIADO DO SOFTWARE ESTATÍSTICO R Roberta Bessa Veloso 1, Daniel Furtado Ferreira 2, Eric Batista Ferreira 3 INTRODUÇÃO A inferência estatística

Leia mais

Correlação Canônica. Outubro / 1998. Versão preliminar. Fabio Vessoni. fabio@mv2.com.br (011) 30642254. MV2 Sistemas de Informação

Correlação Canônica. Outubro / 1998. Versão preliminar. Fabio Vessoni. fabio@mv2.com.br (011) 30642254. MV2 Sistemas de Informação Correlação Canônica Outubro / 998 Versão preliminar Fabio Vessoni fabio@mv.com.br (0) 306454 MV Sistemas de Informação Introdução Existem várias formas de analisar dois conjuntos de dados. Um dos modelos

Leia mais

Disciplinas: Cálculo das Probabilidades e Estatística I

Disciplinas: Cálculo das Probabilidades e Estatística I Introdução a Inferência Disciplinas: Cálculo das Probabilidades e Estatística I Universidade Federal da Paraíba Prof a. Izabel Alcantara Departamento de Estatística (UFPB) Introdução a Inferência Prof

Leia mais

Análise de componentes independentes aplicada à avaliação de imagens radiográficas de sementes

Análise de componentes independentes aplicada à avaliação de imagens radiográficas de sementes Análise de componentes independentes aplicada à avaliação de imagens radiográficas de sementes Isabel Cristina Costa Leite 1 2 3 Thelma Sáfadi 2 Maria Laene Moreira de Carvalho 4 1 Introdução A análise

Leia mais

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr Análise de Regressão Tópicos Avançados em Avaliação de Desempenho Cleber Moura Edson Samuel Jr Agenda Introdução Passos para Realização da Análise Modelos para Análise de Regressão Regressão Linear Simples

Leia mais

XVIII CONGRESSO DE PÓS-GRADUAÇÃO DA UFLA 19 a 23 de outubro de 2009

XVIII CONGRESSO DE PÓS-GRADUAÇÃO DA UFLA 19 a 23 de outubro de 2009 REGRESSÃO MÚLTIPLA APLICADA AOS DADOS DE VENDAS DE UMA REDE DE LOJAS DE ELETRODOMÉSTICOS VANESSA SIQUEIRA PERES 1 RESUMO: Esse trabalho foi realizado com o objetivo de ajustar os dados de vendas de uma

Leia mais

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014 PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA 09/abril de 2014 Considerações Estatísticas para Planejamento e Publicação 1 Circularidade do Método

Leia mais

OUTLIERS E SOFTWARE DE ANÁLISE ES- TATÍSTICA

OUTLIERS E SOFTWARE DE ANÁLISE ES- TATÍSTICA Capítulo 7 OUTLIERS E SOFTWARE DE ANÁLISE ES- TATÍSTICA 7.1 ANÁLISE DE SOFTWARES ESTATÍSTICOS Existe um número considerável de "packages" de análise estatística disponíveis comercialmente. Entre eles,

Leia mais

Análise de Diagnóstico no Modelo de Regressão Bivariado com Fração de Cura

Análise de Diagnóstico no Modelo de Regressão Bivariado com Fração de Cura Análise de Diagnóstico no Modelo de Regressão Bivariado com Fração de Cura Juliana B. Fachini Universidade de São Paulo Edwin M. M. Ortega Universidade de São Paulo 1 Introdução Dados de sobrevivência

Leia mais

Análise de Componente Principais (PCA) Wagner Oliveira de Araujo

Análise de Componente Principais (PCA) Wagner Oliveira de Araujo Análise de Componente Principais (PCA) Wagner Oliveira de Araujo Technical Report - RT-MSTMA_003-09 - Relatório Técnico May - 2009 - Maio The contents of this document are the sole responsibility of the

Leia mais

Intervalos Estatísticos para uma Única Amostra

Intervalos Estatísticos para uma Única Amostra Roteiro Intervalos Estatísticos para uma Única Amostra 1. Introdução 2. Intervalo de Confiança para Média i. População normal com variância conhecida ii. População normal com variância desconhecida 3.

Leia mais

Biometria Roberval Monteiro Bezerra de Lima (roberval.lima@embrapa.br) Sumaia Vasconcelos (sumaia.vasconcelos@inpa.gov.br)

Biometria Roberval Monteiro Bezerra de Lima (roberval.lima@embrapa.br) Sumaia Vasconcelos (sumaia.vasconcelos@inpa.gov.br) PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA Biometria Roberval Monteiro Bezerra de Lima (roberval.lima@embrapa.br) Sumaia Vasconcelos (sumaia.vasconcelos@inpa.gov.br)

Leia mais

VALIDAÇÃO DE MODELOS DE REGRESSÃO POR BOOTSTRAP. João Riboldi 1

VALIDAÇÃO DE MODELOS DE REGRESSÃO POR BOOTSTRAP. João Riboldi 1 VALIDAÇÃO DE MODELOS DE REGRESSÃO POR BOOTSTRAP João Riboldi 1 1. Introdução Na construção de um modelo de regressão, de uma maneira geral segue-se três etapas: executa-se o ajuste do modelo, obtendo-se

Leia mais

Uma Avaliação do Uso de um Modelo Contínuo na Análise de Dados Discretos de Sobrevivência

Uma Avaliação do Uso de um Modelo Contínuo na Análise de Dados Discretos de Sobrevivência TEMA Tend. Mat. Apl. Comput., 7, No. 1 (2006), 91-100. c Uma Publicação da Sociedade Brasileira de Matemática Aplicada e Computacional. Uma Avaliação do Uso de um Modelo Contínuo na Análise de Dados Discretos

Leia mais

MAE0325 - Séries Temporais

MAE0325 - Séries Temporais MAE0325 - Séries Temporais Fernando Henrique Ferraz Pereira da Rosa Vagner Aparecido Pedro Junior 26 de setembro de 2004 E7p80. Considere a série A (M-ICV): Lista 1 1 (a) teste a existência de tendência,

Leia mais

Técnicas Multivariadas em Saúde. Comparações de Médias Multivariadas. Métodos Multivariados em Saúde - 2015. Roteiro. Testes de Significância

Técnicas Multivariadas em Saúde. Comparações de Médias Multivariadas. Métodos Multivariados em Saúde - 2015. Roteiro. Testes de Significância Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de

Leia mais

GRÁFICOS DE CONTROLE PARA O MONITORAMENTO DO VETOR DE MÉDIAS DE PROCESSOS BIVARIADOS AUTOCORRELACIONADOS

GRÁFICOS DE CONTROLE PARA O MONITORAMENTO DO VETOR DE MÉDIAS DE PROCESSOS BIVARIADOS AUTOCORRELACIONADOS XXXI ENCONRO NACIONAL DE ENGENHARIA DE PRODUCAO Belo Horizonte, MG, Brasil, 4 a 7 de outubro de 11. GRÁFICOS DE CONROLE PARA O MONIORAMENO DO VEOR DE MÉDIAS DE PROCESSOS BIVARIADOS AUOCORRELACIONADOS Daniel

Leia mais

ASSOCIAÇÃO ENTRE PRESENÇA DE CÂNCER DE ESÔFAGO COMPARADA COM HÁBITO DE FUMAR E IDADE EM INDIVÍDUOS DA DINAMARCA

ASSOCIAÇÃO ENTRE PRESENÇA DE CÂNCER DE ESÔFAGO COMPARADA COM HÁBITO DE FUMAR E IDADE EM INDIVÍDUOS DA DINAMARCA ASSOCIAÇÃO ENTRE PRESENÇA DE CÂNCER DE ESÔFAGO COMPARADA COM HÁBITO DE FUMAR E IDADE EM INDIVÍDUOS DA DINAMARCA Bárbara Camboim Lopes de FIGUEIRÊDO 1, Gustavo Henrique ESTEVES 2 1 Departamento de Estatística

Leia mais

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder Comentário Geral: Prova muito difícil, muito fora dos padrões das provas do TCE administração e Economia, praticamente só caiu teoria. Existem três questões (4, 45 e 47) que devem ser anuladas, por tratarem

Leia mais

AULAS 04 E 05 Estatísticas Descritivas

AULAS 04 E 05 Estatísticas Descritivas 1 AULAS 04 E 05 Estatísticas Descritivas Ernesto F. L. Amaral 19 e 28 de agosto de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro:

Leia mais

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis O objetivo deste texto é apresentar os principais procedimentos

Leia mais

Introdução. Existem situações nas quais há interesse em estudar o comportamento conjunto de uma ou mais variáveis;

Introdução. Existem situações nas quais há interesse em estudar o comportamento conjunto de uma ou mais variáveis; UNIVERSIDADE FEDERAL DA PARAÍBA Correlação e Regressão Luiz Medeiros de Araujo Lima Filho Departamento de Estatística Introdução Eistem situações nas quais há interesse em estudar o comportamento conjunto

Leia mais

UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA Programa de Graduação em Estatística. Samuel de Oliveira

UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA Programa de Graduação em Estatística. Samuel de Oliveira UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA Programa de Graduação em Estatística Samuel de Oliveira INFERÊNCIA E ANÁLISE DE RESÍDUOS E DE DIAGNÓSTICO EM

Leia mais

MODELOS ESPACIAIS DE ACIDENTES DE TRÂNSITO COM ÓBITOS

MODELOS ESPACIAIS DE ACIDENTES DE TRÂNSITO COM ÓBITOS MODELOS ESPACIAIS DE ACIDENTES DE TRÂNSITO COM ÓBITOS Murilo Castanho dos Santos Cira Souza Pitombo MODELOS ESPACIAIS DE ACIDENTES DE TRÂNSITO COM ÓBITOS Murilo Castanho dos Santos Cira Souza Pitombo Universidade

Leia mais

Uma aplicação dos modelos de fronteira estocástica utilizando a abordagem Bayesiana

Uma aplicação dos modelos de fronteira estocástica utilizando a abordagem Bayesiana Uma aplicação dos modelos de fronteira estocástica utilizando a abordagem Bayesiana Bruna Cristina Braga 1 2 Juliana Garcia Cespedes 1 1 Introdução Os cursos de pós-graduação do Brasil são avaliados pela

Leia mais

PLANO DE ENSINO. Mestrado em Matemática - Área de Concentração em Estatística

PLANO DE ENSINO. Mestrado em Matemática - Área de Concentração em Estatística 1. IDENTIFICAÇÃO PLANO DE ENSINO Disciplina: Estatística Multivariada Código: PGMAT568 Pré-Requisito: No. de Créditos: 4 Número de Aulas Teóricas: 60 Práticas: Semestre: 1º Ano: 2015 Turma(s): 01 Professor(a):

Leia mais

Predição em Modelos de Tempo de Falha Acelerado com Efeito Aleatório para Avaliação de Riscos de Falha em Poços Petrolíferos

Predição em Modelos de Tempo de Falha Acelerado com Efeito Aleatório para Avaliação de Riscos de Falha em Poços Petrolíferos 1 Predição em Modelos de Tempo de Falha Acelerado com Efeito Aleatório para Avaliação de Riscos de Falha em Poços Petrolíferos João Batista Carvalho Programa de Pós-Graduação em Matemática Aplicada e Estatística,

Leia mais

CURSO ON-LINE PROFESSOR GUILHERME NEVES

CURSO ON-LINE PROFESSOR GUILHERME NEVES Olá pessoal! Neste ponto resolverei a prova de Matemática Financeira e Estatística para APOFP/SEFAZ-SP/FCC/2010 realizada no último final de semana. A prova foi enviada por um aluno e o tipo é 005. Os

Leia mais

1. INTRODUÇÃO AO EVIEWS. 1.1. Construção da Base de Dados

1. INTRODUÇÃO AO EVIEWS. 1.1. Construção da Base de Dados Universidade Federal do Rio Grande do Sul Faculdade de Ciências Econômicas Curso de Doutorado em Economia (Estágio Docência) Disciplina: Econometria Aplicada Professor: Sabino Porto Junior Estagiário:

Leia mais

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é?

KDD. Fases limpeza etc. Datamining OBJETIVOS PRIMÁRIOS. Conceitos o que é? KDD Conceitos o que é? Fases limpeza etc Datamining OBJETIVOS PRIMÁRIOS TAREFAS PRIMÁRIAS Classificação Regressão Clusterização OBJETIVOS PRIMÁRIOS NA PRÁTICA SÃO DESCRIÇÃO E PREDIÇÃO Descrição Wizrule

Leia mais

Faturamento de Restaurantes

Faturamento de Restaurantes Faturamento de Restaurantes Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2016 G. A. Paula (IME-USP) Faturamento de Restaurantes 2 o Semestre 2016 1 / 29

Leia mais

O PROBLEMA DO BAIXO NÚMERO DE REPETIÇÕES EM EXPERIMENTOS DE COMPETIÇÃO DE CULTIVARES

O PROBLEMA DO BAIXO NÚMERO DE REPETIÇÕES EM EXPERIMENTOS DE COMPETIÇÃO DE CULTIVARES O PROBLEMA DO BAIXO NÚMERO DE REPETIÇÕES EM EXPERIMENTOS DE COMPETIÇÃO DE CULTIVARES Cristiano Nunes Nesi 1, Antônio Lourenço Guidoni 2 Cleber Bringhenti 1 INTRODUÇÃO Uma questão importante a ser definida

Leia mais

Exemplo Regressão Linear Simples

Exemplo Regressão Linear Simples Exemplo Regressão Linear Simples Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 1 o Semestre 2013 G. A. Paula (IME-USP) Área e Preço de Imóveis 1 o Semestre 2013 1 /

Leia mais

Descobrimos que os testes 1, 2 e 7 foram os mais úteis para avaliação da estabilidade do gráfico Xbar na carta I:

Descobrimos que os testes 1, 2 e 7 foram os mais úteis para avaliação da estabilidade do gráfico Xbar na carta I: Este artigo é parte de uma série de artigos que explicam a pesquisa conduzida pelos estatísticos do Minitab para desenvolver os métodos e verificações de dados usados no Assistente no Software Estatístico

Leia mais

1 Tipos de dados em Análise de Clusters

1 Tipos de dados em Análise de Clusters Curso de Data Mining Sandra de Amo Aula 13 - Análise de Clusters - Introdução Análise de Clusters é o processo de agrupar um conjunto de objetos físicos ou abstratos em classes de objetos similares Um

Leia mais

Sugestão de palavras chave para campanhas em motores de busca em arranque

Sugestão de palavras chave para campanhas em motores de busca em arranque Relatório Técnico FEUP Sugestão de palavras chave para campanhas em motores de busca em arranque João Albuquerque AdClick Ricardo Morla INESC TEC e FEUP Gabriel David INESC TEC e FEUP Rui Campos AdClick

Leia mais

Prova Parcial de Estatística I. Turma: AE1 AE2 AE3 AE4

Prova Parcial de Estatística I. Turma: AE1 AE2 AE3 AE4 ESCOLA DE ADMINISTRAÇÃO DE EMPRESAS DE SÃO PAULO FUNDAÇÃO GETULIO VARGAS Prova Parcial de Estatística I Data: Setembro / Professores: Eduardo Francisco Francisco Aranha Nelson Barth A Nome do Aluno: GABARITO

Leia mais

Aula 5 Metodologias de avaliação de impacto

Aula 5 Metodologias de avaliação de impacto Aula 5 Metodologias de avaliação de impacto Metodologias de Avaliação de Impacto Objetiva quantificar as mudanças que o projeto causou na vida dos beneficiários. Plano de Aula Método experimental: regressão

Leia mais

Aula 4 Estatística Conceitos básicos

Aula 4 Estatística Conceitos básicos Aula 4 Estatística Conceitos básicos Plano de Aula Amostra e universo Média Variância / desvio-padrão / erro-padrão Intervalo de confiança Teste de hipótese Amostra e Universo A estatística nos ajuda a

Leia mais

A INTEGRAÇÃO ENTRE ESTATÍSTICA E METROLOGIA

A INTEGRAÇÃO ENTRE ESTATÍSTICA E METROLOGIA A INTEGRAÇÃO ENTRE ESTATÍSTICA E METROLOGIA João Cirilo da Silva Neto jcirilo@araxa.cefetmg.br. CEFET-MG-Centro Federal de Educação Tecnológica de Minas Gerais-Campus IV, Araxá Av. Ministro Olavo Drumonnd,

Leia mais

TÉCNICAS DE ANÁLISE DE DADOS

TÉCNICAS DE ANÁLISE DE DADOS observação = previsível + aleatória aleatória obedece algum modelo de probabilidade ferramenta: análise de variância identificar fatores, controláveis, que expliquem o fenômeno ou alterem a característica

Leia mais

CRM e Prospecção de Dados

CRM e Prospecção de Dados CRM e Prospecção de Dados Marília Antunes aula de 11 de Maio 09 6 Modelos de regressão 6.1 Introdução No capítulo anterior foram apresentados alguns modelos preditivos em que a variável resposta (a variável

Leia mais

Teste de Hipótese para uma Amostra Única

Teste de Hipótese para uma Amostra Única Teste de Hipótese para uma Amostra Única OBJETIVOS DE APRENDIZAGEM Depois de um cuidadoso estudo deste capítulo, você deve ser capaz de: 1.Estruturar problemas de engenharia de tomada de decisão, como

Leia mais

Este apêndice resume os conceitos de álgebra matricial, inclusive da álgebra de probabilidade,

Este apêndice resume os conceitos de álgebra matricial, inclusive da álgebra de probabilidade, D Resumo de Álgebra Matricial Este apêndice resume os conceitos de álgebra matricial, inclusive da álgebra de probabilidade, necessária para o estudo de modelos de regressão linear múltipla usando matrizes,

Leia mais

Universidade Federal Fluminense

Universidade Federal Fluminense Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA ESTATÍSTICA V Lista 9: Intervalo de Confiança. 1. Um pesquisador está estudando a resistência de um determinado

Leia mais

Universidade de Brasília

Universidade de Brasília Universidade de Brasília IE - Departamento de Estatística Avaliando o Impacto do Programa Bolsa Família no Trabalho Infantil e Frequência Escolar Infantil: Uma Abordagem de Regressão Descontínua Ana Paula

Leia mais

Análise dos determinantes do Índice Combinado das maiores seguradoras brasileiras: um estudo econométrico entre os anos de 2005 a 2014

Análise dos determinantes do Índice Combinado das maiores seguradoras brasileiras: um estudo econométrico entre os anos de 2005 a 2014 Análise dos determinantes do Índice Combinado das maiores seguradoras brasileiras: um estudo econométrico entre os anos de 2005 a 2014 Luis Gustavo Gutierrez Gebin luis_gustavo_08@hotmail.com Gustavo Oliveira

Leia mais

PROVA ESCRITA DE ESTATÍSTICA VERSÃO A. 04 As classes de uma distribuição de freqüência devem ser mutuamente exclusivas para que

PROVA ESCRITA DE ESTATÍSTICA VERSÃO A. 04 As classes de uma distribuição de freqüência devem ser mutuamente exclusivas para que COMANDO DA AERONÁUTICA DEPARTAMENTO DE ENSINO DA AERONÁUTICA CENTRO DE INSTRUÇÃO E ADAPTAÇÃO DA AERONÁUTICA CONCURSO DE ADMISSÃO AO EAOT 00 EXAME DE CONHECIMENTOS ESPECIALIZADOS PROVA ESCRITA DE ESTATÍSTICA

Leia mais

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO 1 TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO Mario de Andrade Lira Junior www.lira.pro.br direitos autorais. INTRODUÇÃO À ANÁLISE MULTIVARIADA Apenas uma breve apresentação Para não dizerem que

Leia mais

Desempenho dos Aprovados no Vestibular da UFPA antes e após a Política de Cotas: Uma Aplicação de Regressão Quantílica

Desempenho dos Aprovados no Vestibular da UFPA antes e após a Política de Cotas: Uma Aplicação de Regressão Quantílica Desempenho dos Aprovados no Vestibular da UFPA antes e após a Política de Cotas: Uma Aplicação de Regressão Quantílica 1. Introdução Diogo Braga Mendes¹ Charlene de Carvalho Silva² Marinalva Cardoso Maciel³

Leia mais

Função bayesiana em R para o problema de Behrens-Fisher multivariado

Função bayesiana em R para o problema de Behrens-Fisher multivariado Função bayesiana em R para o problema de Behrens-Fisher multivariado Patrícia de Siqueira Ramos 1 2 Daniel Furtado Ferreira 3 1 Introdução Um dos problemas mais comuns na Estatística aplicada é o de comparar

Leia mais

4 Análise de Dados. 4.1 Perfil dos Respondentes

4 Análise de Dados. 4.1 Perfil dos Respondentes 4 Análise de Dados 4.1 Perfil dos Respondentes A taxa de resposta foi de aproximadamente 8% de respostas na amostra de clientes que compram fora da loja (telefone e/ou Internet) e 3% na amostra de clientes

Leia mais

Probabilidades e Estatística

Probabilidades e Estatística Departamento de Matemática - IST(TP) Secção de Estatística e Aplicações Probabilidades e Estatística 1 o Exame/1 o Teste/2 o Teste 2 o Semestre/1 a Época 2008/09 Duração: 3 horas/1 hora e 30 minutos 16/01/09

Leia mais

Modelo de Regressão Linear e suas Aplicações

Modelo de Regressão Linear e suas Aplicações UNIVERSIDADE DA BEIRA INTERIOR Ciências Modelo de Regressão Linear e suas Aplicações Sandra Cristina Antunes Rodrigues Relatório de Estágio para obtenção do Grau de Mestre em Ensino de Matemática no 3º

Leia mais

PLANEJAMENTO FATORIAL: UMA FERRAMENTA PODEROSA PARA OS PESQUISADORES

PLANEJAMENTO FATORIAL: UMA FERRAMENTA PODEROSA PARA OS PESQUISADORES PLANEJAMENTO FATORIAL: UMA FERRAMENTA PODEROSA PARA OS PESQUISADORES Mary R. M. Marinho - maryroberta@terra.com.br Universidade Federal de Campina Grande, Departamento de Engenharia Mecânica Av Aprígio

Leia mais

Modelos de Equações simultâneas

Modelos de Equações simultâneas Modelos de Equações simultâneas y 1 = α 1 y 2 + β 1 z 1 + u 1 y 2 = α 2 y 1 + β 2 z 2 + u 2 Capítulo 16 1 Modelo de equações simultâneas Exemplo de determinação de horas e salário. 2 Modelo de equações

Leia mais

Valeska Andreozzi 2010

Valeska Andreozzi 2010 Introdução Valeska Andreozzi 2010 Referências 3 Modelagem estatística 8 Modelagem................................................................... 9 Objetivos....................................................................

Leia mais

O modelo ANOVA a dois factores, hierarquizados

O modelo ANOVA a dois factores, hierarquizados O modelo ANOVA a dois factores, hierarquizados Juntando os pressupostos necessários à inferência, Modelo ANOVA a dois factores, hierarquizados Seja A o Factor dominante e B o Factor subordinado. Existem

Leia mais

3 Metodologia de Previsão de Padrões de Falha

3 Metodologia de Previsão de Padrões de Falha 3 Metodologia de Previsão de Padrões de Falha Antes da ocorrência de uma falha em um equipamento, ele entra em um regime de operação diferente do regime nominal, como descrito em [8-11]. Para detectar

Leia mais

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA 4 a LISTA DE EXERCÍCIOS GBQ12 Professor: Ednaldo Carvalho Guimarães AMOSTRAGEM

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA 4 a LISTA DE EXERCÍCIOS GBQ12 Professor: Ednaldo Carvalho Guimarães AMOSTRAGEM 1 UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA 4 a LISTA DE EXERCÍCIOS GBQ12 Professor: Ednaldo Carvalho Guimarães AMOSTRAGEM 1) Um pesquisador está interessado em saber o tempo médio que

Leia mais

'LVWULEXLomR(VWDWtVWLFDGRV9DORUHV([WUHPRVGH5DGLDomR6RODU *OREDOGR(VWDGRGR56

'LVWULEXLomR(VWDWtVWLFDGRV9DORUHV([WUHPRVGH5DGLDomR6RODU *OREDOGR(VWDGRGR56 LVWULEXLomR(VWDWtVWLFDGRV9DORUHV([WUHPRVGH5DGLDomR6RODU OREDOGR(VWDGRGR56 6X]DQH5DQ]DQ 6LPRQH0&HUH]HU&ODRGRPLU$0DUWLQD]]R Universidade Regional Integrada do Alto Uruguai e das Missões, Departamento de

Leia mais

Correlação e Regressão

Correlação e Regressão Notas sobre Regressão, Correlação e Regressão Notas preparadas por L.A. Bertolo Índice Termos básicos e conceitos...1 Regressão simples...5 Regressão Múltipla...13 Terminologia de Regressão...20 Fórmulas

Leia mais

INFLUÊNCIA DE VARIÁVEIS SOCIODEMOGRÁFICAS SOBRE O EMPREENDEDORISMO DO BRASIL

INFLUÊNCIA DE VARIÁVEIS SOCIODEMOGRÁFICAS SOBRE O EMPREENDEDORISMO DO BRASIL UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA Adriano Luiz Antunes Denis Antoniazzi INFLUÊNCIA DE VARIÁVEIS SOCIODEMOGRÁFICAS SOBRE O EMPREENDEDORISMO

Leia mais

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística Aula 4 Conceitos Básicos de Estatística Aula 4 Conceitos básicos de estatística A Estatística é a ciência de aprendizagem a partir de dados. Trata-se de uma disciplina estratégica, que coleta, analisa

Leia mais

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Resoluções comentadas das questões de Estatística da prova para ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Realizada pela Fundação João Goulart em 06/10/2013 41. A idade média de todos

Leia mais

Prof. M. Sc. Jarbas Thaunahy Santos de Almeida 1

Prof. M. Sc. Jarbas Thaunahy Santos de Almeida 1 Prof. M. Sc. Jarbas Thaunahy Santos de Almeida 1 Aula 7 Covariância e suas aplicações Roteiro Introdução Covariância Valor esperado, Variância e Desvio-padrão da soma entre duas variáveis aleatórias Retorno

Leia mais

Modelos de Regressão Quantílica. Bruno Ramos dos Santos

Modelos de Regressão Quantílica. Bruno Ramos dos Santos Modelos de Regressão Quantílica Bruno Ramos dos Santos Dissertação apresentada ao Instituto de Matemática e Estatística da Universidade de São Paulo para obtenção do título de Mestre em Ciências Programa:

Leia mais

4 Segmentação. 4.1. Algoritmo proposto

4 Segmentação. 4.1. Algoritmo proposto 4 Segmentação Este capítulo apresenta primeiramente o algoritmo proposto para a segmentação do áudio em detalhes. Em seguida, são analisadas as inovações apresentadas. É importante mencionar que as mudanças

Leia mais

Introdução à Inferência Estatística

Introdução à Inferência Estatística Introdução à Inferência Estatística 1. População: conjunto de indivíduos, ou itens, com pelo menos uma característica em comum. Também será denotada por população objetivo, que é sobre a qual desejamos

Leia mais

Gráficos de Controle para Processos Autocorrelacionados

Gráficos de Controle para Processos Autocorrelacionados Roteiro da apresentação 1 Controle de Qualidade Lupércio França Bessegato 2 3 4 5 Especialização em Estatística 6 7 8 Gráfico de Controle de Shewhart Hipóteses do gráfico de controle convencional: Normalidade

Leia mais

Introdução. Métodos de inferência são usados para tirar conclusões sobre a população usando informações obtidas a partir de uma amostra.

Introdução. Métodos de inferência são usados para tirar conclusões sobre a população usando informações obtidas a partir de uma amostra. Métodos Monte Carlo Introdução Métodos de inferência são usados para tirar conclusões sobre a população usando informações obtidas a partir de uma amostra. Estimativas pontuais e intervalares para os parâmetros;

Leia mais

Distribuição Exponencial Exponenciada na Presença de Fração de Cura: Modelos de Mistura e Não-Mistura

Distribuição Exponencial Exponenciada na Presença de Fração de Cura: Modelos de Mistura e Não-Mistura Distribuição Exponencial Exponenciada na Presença de Fração de Cura: Modelos de Mistura e Não-Mistura Emílio Augusto Coelho-Barros 1,2 Jorge Alberto Achcar 2 Josmar Mazucheli 3 1 Introdução Em análise

Leia mais

METODOLOGIA DE SUPERFÍCIE DE RESPOSTA: UMA INTRODUÇÃO NOS SOFTWARES R E STATISTICA. Resumo

METODOLOGIA DE SUPERFÍCIE DE RESPOSTA: UMA INTRODUÇÃO NOS SOFTWARES R E STATISTICA. Resumo METODOLOGIA DE SUPERFÍCIE DE RESPOSTA: UMA INTRODUÇÃO NOS SOFTWARES R E STATISTICA Anaisa Comparini, Gabriela Passos, Helton Graziadei, Paulo H. Ferreira-Silva e Francisco Louzada ICMC USP CP668 CEP 13.566-590,

Leia mais

AULAS 24 E 25 Análise de Regressão Múltipla: Inferência

AULAS 24 E 25 Análise de Regressão Múltipla: Inferência 1 AULAS 24 E 25 Análise de Regressão Múltipla: Inferência Ernesto F. L. Amaral 23 e 25 de novembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Wooldridge, Jeffrey M. Introdução à econometria: uma

Leia mais

UNIDADE DE PESQUISA CLÍNICA Centro de Medicina Reprodutiva Dr Carlos Isaia Filho Ltda.

UNIDADE DE PESQUISA CLÍNICA Centro de Medicina Reprodutiva Dr Carlos Isaia Filho Ltda. UNIDADE DE PESQUISA CLÍNICA Centro de Medicina Reprodutiva Dr Carlos Isaia Filho Ltda. Avaliação do risco de viés de ensaios clínicos randomizados pela ferramentada colaboração Cochrane Alan P. V. de Carvalho,

Leia mais

DEFINIÇÃO DO TAMANHO AMOSTRAL USANDO SIMULAÇÃO MONTE CARLO PARA O TESTE DE NORMALIDADE BASEADO EM ASSIMETRIA E CURTOSE. II. ABORDAGEM MULTIVARIADA

DEFINIÇÃO DO TAMANHO AMOSTRAL USANDO SIMULAÇÃO MONTE CARLO PARA O TESTE DE NORMALIDADE BASEADO EM ASSIMETRIA E CURTOSE. II. ABORDAGEM MULTIVARIADA DEFINIÇÃO DO TAMANHO AMOSTRAL USANDO SIMULAÇÃO MONTE CARLO PARA O TESTE DE NORMALIDADE BASEADO EM ASSIMETRIA E CURTOSE. II. ABORDAGEM MULTIVARIADA ANDRÉA CRISTIANE DOS SANTOS DANIEL FURTADO FERREIRA RESUMO

Leia mais

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I! A utilização de escores na avaliação de crédito! Como montar um plano de amostragem para o credit scoring?! Como escolher as variáveis no modelo de credit

Leia mais

CAPÍTULO 9. PROCESSAMENTO DOS DADOS 9.5. ALGARISMOS SIGNIFICATIVOS. =0.01 gcm 3 3.36 Logo o resultado experimental é: = 5.82 g 0.

CAPÍTULO 9. PROCESSAMENTO DOS DADOS 9.5. ALGARISMOS SIGNIFICATIVOS. =0.01 gcm 3 3.36 Logo o resultado experimental é: = 5.82 g 0. CAPÍTULO 9. PROCESSAMENTO DOS DADOS 9.5. ALGARISMOS SIGNIFICATIVOS Logo o resultado experimental é: =(1.732 ± 0.001) gcm 3 O erro relativo do volume (0.1%) é uma ordem de grandeza maior que o erro relativo

Leia mais

Computação Científica com MATLAB. Melissa Weber Mendonça melissa.mendonca@ufsc.br

Computação Científica com MATLAB. Melissa Weber Mendonça melissa.mendonca@ufsc.br Computação Científica com MATLAB Melissa Weber Mendonça melissa.mendonca@ufsc.br Exemplo leituraarquivos.m trimmmean O comando >> m = trimmean(x,pc) calcula a média excluindo os k maiores e menores valores

Leia mais

Inferência Estatística

Inferência Estatística Universidade Federal Fluminense Instituto de Matemática e Estatística Inferência Estatística Ana Maria Lima de Farias Departamento de Estatística Conteúdo 1 Inferência estatística Conceitos básicos 1 1.1

Leia mais

Modelo SARIMA: um estudo de caso sobre venda mensal de gasolina

Modelo SARIMA: um estudo de caso sobre venda mensal de gasolina Modelo SARIMA: um estudo de caso sobre venda mensal de gasolina Ana Julia Righetto 1 Luiz Ricardo Nakamura 1 Pedro Henrique Ramos Cerqueira 1 Manoel Ivanildo Silvestre Bezerra 2 Taciana Villela Savian

Leia mais

Recuperação de Leituras e Mapeamento Geoestatístico do Nível de Água Subterrâneo de uma Barragem de Terra no Estado do Paraná

Recuperação de Leituras e Mapeamento Geoestatístico do Nível de Água Subterrâneo de uma Barragem de Terra no Estado do Paraná Recuperação de Leituras e Mapeamento Geoestatístico do Nível de Água Subterrâneo de uma Barragem de Terra no Estado do Paraná Carina Pirolli COPEL - Companhia Paranaense de Energia, Curitiba, Brasil, carina.pirolli@copel.com

Leia mais

Número de plantas para estimação do plastocrono em feijão guandu

Número de plantas para estimação do plastocrono em feijão guandu Número de plantas para estimação do plastocrono em feijão guandu Alberto Cargnelutti Filho 1 Marcos Toebe 2 Giovani Facco 3 Gustavo Oliveira dos Santos 3 Bruna Mendonça Alves 2 Anderson Bolzan 4 1 - Introdução

Leia mais

Medidas de Variação ou Dispersão

Medidas de Variação ou Dispersão Medidas de Variação ou Dispersão Estatística descritiva Recapitulando: As três principais características de um conjunto de dados são: Um valor representativo do conjunto de dados: uma média (Medidas de

Leia mais

Cálculo de volume de objetos utilizando câmeras RGB-D

Cálculo de volume de objetos utilizando câmeras RGB-D Cálculo de volume de objetos utilizando câmeras RGB-D Servílio Souza de ASSIS 1,3,4 ; Izadora Aparecida RAMOS 1,3,4 ; Bruno Alberto Soares OLIVEIRA 1,3 ; Marlon MARCON 2,3 1 Estudante de Engenharia de

Leia mais

Um Estudo Comparativo de Sistemas Comerciais de Monitoramento da Limpeza com ATP

Um Estudo Comparativo de Sistemas Comerciais de Monitoramento da Limpeza com ATP Um Estudo Comparativo de Sistemas Comerciais de Monitoramento da Limpeza com ATP Baseado em dados gerados pelo Sillliker Group Inc Resumo O desempenho de 5 sistemas de monitoramento da higiene com ATP

Leia mais

4 Gráficos de controle

4 Gráficos de controle 4 Gráficos de controle O gráfico de controle é uma ferramenta poderosa do Controle Estatístico de Processo (CEP) para examinar a variabilidade em dados orientados no tempo. O CEP é composto por um conjunto

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

FUNCIONAMENTO DE UM MONITOR CONTÍNUO DE OZÔNIO

FUNCIONAMENTO DE UM MONITOR CONTÍNUO DE OZÔNIO FUNCIONAMENTO DE UM MONITOR CONTÍNUO DE OZÔNIO 1. Introdução A melhor tecnologia para o monitoramento de baixas concentrações de ozônio (O 3 ) no ar ambiente é a da absorção de luz na faixa do Ultra Violeta

Leia mais

UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM

UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM Unidade 2 Distribuições de Frequências e Representação Gráfica UNIDADE 3 MEDIDAS DE POSIÇÃO E DISPERSÃO OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM Ao finalizar esta Unidade, você deverá ser capaz de: Calcular

Leia mais

BIOMETRIA:CURVA DE CRESCIMENTO

BIOMETRIA:CURVA DE CRESCIMENTO UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS FACULDADE DE ESTATÍSTICA BIOMETRIA:CURVA DE CRESCIMENTO TAYANI RAIANA DE SOUZA ROQUE Disciplina: Estatística Aplicada Professores: Héliton

Leia mais

Lista de Exercícios 1 - Estatística Descritiva

Lista de Exercícios 1 - Estatística Descritiva 1. O arquivo satisfaçãocomuniversidade.xlsx contém informações de uma amostra de 400 alunos de uma universidade. Deseja-se construir um histograma para a variável desempenho acadêmico, com intervalos de

Leia mais

OUTLIERS Conceitos básicos

OUTLIERS Conceitos básicos Outliers: O que são? As observações que apresentam um grande afastamento das restantes ou são inconsistentes com elas são habitualmente designadas por outliers. Estas observações são também designadas

Leia mais