i i Análise Estatística de Dados Geológicos Multivariados Prova 5 1/9/2011 Maluhy & Co. página (local 5, global #5) i i Aos meus alunos i i i i

Tamanho: px
Começar a partir da página:

Download "i i Análise Estatística de Dados Geológicos Multivariados Prova 5 1/9/2011 Maluhy & Co. página (local 5, global #5) i i Aos meus alunos i i i i"

Transcrição

1

2

3

4 Aos meus alunos

5

6 APRESENTAÇÃO Recebi o convite para escrever a apresentação de mais esta obra do Prof. Paulo Landim, Análise estatística de dados geológicos multivariados. É um convite que me deixou profundamente envaidecido e orgulhoso, pois considero o autor uma pessoa mais que especial. O Prof. Paulo Milton Barbosa Landim graduou-se em Geologia em 1961, na Universidade de São Paulo (USP). Desde então foi construindo uma respeitável carreira acadêmica, que passou pelo Doutorado na USP em 1967, Pós-doutorado em na University of California e na Northwestern University, Professor Livre-docente em 1970 e Professor Titular de 1978 até 1998 da Universidade Estadual Paulista (Unesp Rio Claro). Na Unesp, foi diretor do Instituto de Geociências e Ciências Exatas (IGCE) entre 1981 e 1984, Vice-Reitor de 1985 a 1988, e Reitor de 1989 a Insatisfeito com a aposentadoria ocorrida em 1998, permanece dando aulas e orientando seus alunos de graduação e pós-graduação como Professor Voluntário da Unesp Rio Claro. Por tudo isso e por uma sólida produção voltada especialmente à estratigrafia e à quantificação em geologia, recebeu o título de Professor Emérito da Unesp. Por isso, além de o Prof. Paulo Milton Barbosa Landim ser um verdadeiro acadêmico e um especialista, o Paulo Landim é uma pessoa especial. As ciências que estudam este sistema extremamente complexo a Natureza estão cada vez mais fundamentadas e exigentes na quantificação das variáveis. O avanço tecnológico deu origem a uma farta caixa de ferramentas capaz de quantificar formas, dimensões, posições e conteúdos, que fornece valores cada vez mais precisos, os quais tornam possível estabelecer relações de causa e efeito dos fenômenos geológicos e suas interações com outros atores da natureza. É evidente que, com a geologia, isso não é diferente.

7 8 Análise estatística de dados geológicos multivariados Houve um tempo em que a observação visual dos afloramentos e algumas medidas com bússola e trena, bem como análises de granulometria ou de química por via úmida, eram suficientes para a montagem do quadro. Depois vieram técnicas mais sofisticadas de laboratório, como as baseadas na espectrografia de raios X, de absorção atômica e de plasma induzido e de microssonda eletrônica, além das tecnologias digitais de cartografia e de imageamento por sensores remotos, capazes de gerar grandes quantidades de dados. Atualmente, os equipamentos portáteis de coleta de dados produzem dezenas de dados por segundo, medindo desde as vibrações do terreno até a composição química da água e de materiais sólidos, e também dados de posicionamento via GPS, os quais são transmitidos ao escritório no momento exato em que foram coletados em campo. Toda essa quantidade e diversidade de dados produzidos a custos relativamente baixos são arquivados em gigantescos bancos de dados. Se o processo terminasse aqui, estaríamos satisfeitos; no entanto, para que essas enormes e complexas massas de dados forneçam informações e deem suporte a conclusões confiáveis, elas necessitam ser tratadas por meio de técnicas estatísticas especiais. É nessa circunstância e contexto que o livro do Prof. Paulo Milton Barbosa Landim mostra o potencial e as aplicações da Análise estatística de dados geológicos multivariados. Sem dúvida, é uma obra necessária, que expõe de maneira didática essas técnicas matemáticas de alta complexidade teórica. Ela tem grande utilidade tanto para o geólogo, que tem interesse apenas na aplicação direta, dando o suporte para que ele compreenda os resultados gerados por sistemas computacionais, como para o acadêmico ou especialista, que também encontrará excelente fonte de referência para embasar e aprofundar suas pesquisas. Ao finalizar, considero necessário registrar os agradecimentos ao Prof. Paulo Milton Barbosa Landim por sua dedicação e esmero na redação deste livro e por mais essa valiosa contribuição ao desenvolvimento das ciências geológicas. Otavio Augusto Boni Licht Curitiba, 17 de agosto de 2011

8 SUMÁRIO Introdução Noções de Álgebra Matricial Matrizes e vetores Operações com matrizes Matrizes especiais Regressão Linear Múltipla Aplicação do modelo linear múltiplo à confecção de mapas: análise de superfícies de tendência Testes de Significância com Dados Multivariados Testes univariados e testes multivariados Teste T 2 de Hotelling Teste de comparação entre matrizes de variâncias-covariâncias Valores p Análise de Agrupamentos Métodos de classificação Considerações sobre a aplicação da análise de agrupamentos Análise de Componentes Principais Cálculo para a análise de componentes principais Análise de coordenadas principais Análise de agrupamentos e Análise de componentes principais

9 10 Análise estatística de dados geológicos multivariados 6 Análise de Fatores Análise fatorial pelo modo Q Análise de Correspondências ou de Associações Análise fatorial R-Q simultânea Análise de Correlações Canônicas Análise Discriminante Análise discriminante linear Análise discriminante multigrupos Classificação Regionalizada Anexo Referências Bibliográficas

10 INTRODUÇÃO A aplicação de métodos quantitativos em Geologia é muito antiga: Georgius Agricola (1556) utilizou a trigonometria para o mapeamento mineiro, no início da Geologia como ciência moderna, e Charles Lyell, em 1830, classificou os estratos terciários da Bacia de Paris com base na presença relativa de espécies recentes de moluscos, num procedimento estratigráfico-estatístico. A partir desse início, a Geologia permanece qualitativa e puramente descritiva até os anos 1920, quando o enfoque quantitativo torna-se mais presente, com a proposta de amostragem geológica em bases probabilísticas de William C. Krumbein, que introduz os modelos processo-resposta. O entendimento das relações de causa e efeito para a explicação dos processos geológicos leva Andrei Vistelius, no início dos anos 1940, a iniciar a formulação da chamada Geologia Matemática. Em que pese essas iniciativas, dentre outras, a Geologia, até há bem pouco tempo, era frequentemente considerada uma ciência baseada em interpretações qualitativas dos fenômenos geológicos. Nos últimos 40 anos, foi notável a mudança da fase descritiva para a utilização de métodos quantitativos, principalmente nas áreas da Geologia Aplicada. Na área mineral, com destaque ao petróleo, a interpretação geológica, além de estar fundamentada em conceitos científicos, precisa ter aplicação econômica, e observa-se uma tendência quantitativa que possibilita avanços importantes no uso de técnicas espaciais. Um consistente relato sobre a quantificação em Geologia encontra-se em Merriam (2004). Nas últimas décadas, graças a avanços tecnológicos tanto computacionais quanto de equipamentos de laboratório e de campo, intensificou-se a obtenção de dados geológicos quantitativos, cuja análise está muito aquém da imensa quantidade de informações coletadas. Basta ver os relatórios de pesquisa e os bancos de dados com um grande número de matrizes de

11 12 Análise estatística de dados geológicos multivariados informações não trabalhadas. Verbas e tempo são gastos na coleta, que precisa ser devidamente manuseada, e para a análise dos dados, o emprego de técnicas estatísticas multidimensionais é fundamental. Como os fenômenos geológicos resultam de diversos fatores condicionantes, o seu entendimento é facilitado quando o estudo é submetido a um tratamento quantitativo multidimensional. Porém, a pura utilização de técnicas estatísticas multivariadas, hoje bastante facilitada pela vasta disposição de programas computacionais, não é condição suficiente se o estudo não for embasado num sólido conhecimento geológico. É necessário o pesquisador ter sempre em mente que os resultados, obtidos por via quantitativa, devem ter uma explicação lógica e coerente no contexto das geociências. Ou seja, não procure encaixar a natureza em seu modelo multivariado, por mais perfeito que ele possa parecer. Um modelo será sempre uma simplificação da natureza. No caso de uma única variável medida em amostras, no sentido geológico, a análise é feita por intermédio da estatística univariada. Se forem obtidos valores de diversas variáveis em cada amostra, as técnicas para a análise desses dados são fornecidas pela estatística multivariada ou multidimensional. Essa análise estatística de mensurações múltiplas sobre uma amostra fornece um melhor entendimento na razão direta do número de variáveis utilizadas e permite considerar simultaneamente a variabilidade das diversas propriedades medidas. Os resultados de análises de dados uni ou bivariados podem se apresentar na forma de gráficos em 1D, 2D ou 3D, de fácil compreensão. No caso de dez variáveis, por exemplo, o resultado ocorre num espaço em dez dimensões, concebível apenas de um modo abstrato. Uma das funções dos métodos multivariados é reduzir a dimensão dos dados ao apresentar os resultados, para um melhor entendimento gráfico a duas ou três dimensões. Entre os métodos mais utilizados em Geociências destacam-se a análise de agrupamentos, a análise de componentes principais e a análise discriminante. Ao explorar as similaridades entre indivíduos (modo Q) ou entre variáveis (modo R) definindo-os em grupos, a análise de agrupamentos é utilizada, no primeiro caso, considerando as variáveis observadas em cada indivíduo e, no segundo, os indivíduos nos quais foram feitas as mesmas medidas. Com esse método, procura-se por agrupamentos homogêneos de itens representados por pontos num espaço n-dimensional em um número conveniente de grupos, relacionando-os pelos coeficientes de similaridade ou de distância.

12 58 Análise estatística de dados geológicos multivariados 3.1 Testes univariados e testes multivariados Segundo Manly (2008), um aspecto importante do uso de testes multivariados em relação aos univariados é o controle das taxas do erro do tipo I, que significa encontrar um resultado significante quando na realidade as duas amostras comparadas provêm de populações com mesma média em um teste univariado, ou com médias iguais em um teste multivariado. Por exemplo, para uma probabilidade do erro α = 0,05, significa que, se a verdadeira média da população de X s for μ, a chance de ocorrer t t (n 1;α) é uma em 20. Ao se aplicar o mesmo teste para a variável Y, com o mesmo risco de recusar a hipótese nula quando verdadeira, a probabilidade de ambas as médias, de X e Y, não serem significativamente diferentes de μ e μ y é (0,95) 2 = 0,9025. A probabilidade de ambas as médias serem significantemente diferentes de μ e μ y é (0,05) 2 = 0,0025. A probabilidade de apenas uma das médias ser significantemente diferente é (2)(0,95)(0,05) = 0,0950 e a probabilidade de pelo menos uma média ser considerada significantemente diferente, quando na realidade não existe diferença, é 0,0975. No caso de um problema com três variáveis, a última probabilidade passa a ser 1 (0,95) 3 = 0,1426. Essa situação, apresentada por Jackson (1959), mostra que o uso de testes univariados para situações multivariadas pode fornecer pelo menos uma diferença significante por chance, em 50% ou mais de casos. Há necessidade, portanto, de testes generalizados que verifiquem, simultaneamente, qual a probabilidade de diversas amostras multivariadas fornecidas serem significantemente diferentes de médias multivariadas hipotéticas fornecidas. Em muitos casos, pode-se argumentar que um único teste multivariado fornece um melhor resultado do que um grande número de testes univariados. Um teste multivariado tem a vantagem adicional de levar em conta a correlação entre variáveis. 3.2 Teste T 2 de Hotelling Seja, por exemplo, um conjunto de observações no qual foram obtidas n medidas X e se deseja verificar a probabilidade de essa amostra casual, com n observações, ser retirada de uma população normal com média especificada e variância desconhecida σ 2. O teste indicado é o univariado t de Student: t = ( μ ) n s 2

13 3 [ TESTES DE SIGNIFICÂNCIA COM DADOS MULTIVARIADOS ] 59 no qual s 2 é a variância da amostra de tamanho n, de onde foi obtida. Se t > t (n 1,α), será considerado significantemente diferente de μ no nível α. Para a generalização multivariada do teste t, substitui-se por um vetor de médias amostrais, μ por um vetor de médias populacionais e s 2 por uma matriz de variâncias-covariâncias: μ n t = s 2 A solução dessa equação não fornece uma única resposta. Haverá necessidade de transformar a coluna vetor e a matriz em valores singulares, o que pode ser feito com a definição de um vetor coluna arbitrário, cujo transposto é o vetor linha [A]. Ao se multiplicar o vetor coluna de diferenças pelo vetor linha [A], o resultado será um valor singular. Desse modo, o teste torna-se: t = [A] μ n [A] s 2 [A] 2 [A] μ n t 2 = [A] s 2 [A] Todavia, com essa transformação, o que estava sendo testado foi modificado. A hipótese nula, que era H 0 =[μ ]=[μ 0 ], passa a ser H* 0 =[A][μ ]=[A][μ 0 ]. A hipótese original H 0 só é verdadeira quando a nova hipótese H* 0 se mantiver para todos os possíveis valores de [A]. É suficiente, porém, testar apenas o valor máximo possível do teste, porque se H* 0 for rejeitada para qualquer valor de [A], a hipótese H 0 também será rejeitada. Para determinar o valor máximo, Morrison (1967) propõe que a determinação possa ser removida pela imposição da restrição: [A] [s 2 ][A] = 1 A introdução da restrição, pelo multiplicador de Lagrange λ, e a subsequente diferenciação com respeito a [A], fornecem o sistema de equações: μ μ n λ s 2 [A] = 0 Premultiplicando por [A], tem-se: λ = [A] μ μ [A] n [A] [A] [ μ ] 2 n s 2 = [A] [A] s 2 [A] o que resulta: λ = t 2.

14 72 Análise estatística de dados geológicos multivariados Coeficientes de similaridade Os coeficientes de similaridade mais usuais, obtidos num espaço multidimensional, dividem-se em três categorias: a) os que medem a distância ou a separação angular entre pares de pontos; b) os que medem a correlação entre pares de valores; c) os que medem a associação entre pares de caracteres qualitativos. Diversas publicações discutem esses tipos de medidas, como, por exemplo, Sneath e Sokal (1973), Everitt (1980), Prentice (1980), Gordon (1981), Greig-Smith (1983), Pielou (1984), além do resumo sobre 23 coeficientes de similaridades constante no pacote MVSP, versão 3.1. Medida de distância Expressa o grau de similaridade como distância em um espaço multidimensional. Quanto maior a distância, menor o grau de similaridade e vice-versa. A distância D entre dois pontos, (X 1, Y 1 ) e (X 2, Y 2 ), cuja localização é especificada num sistema de coordenadas cartesianas, segundo o teorema de Pitágoras, é fornecida por: D 1.2 = ( 1 2 ) 2 + (y 1 y 2 ) 2 em que 1, 2, y 1 e y 2 são valores das coordenadas dos dois pontos. Para a distância D j entre dois pontos, j, num espaço n-dimensional, a fórmula generalizada é: D j = n ( k jk ) 2 /n k=1 Quando todas as variáveis têm o mesmo peso, consequentemente, a função distância limita-se a valores entre 0 (maior similaridade) e 1 (menor similaridade). Pode-se utilizar também o coeficiente cosseno-teta, uma medida de proporcionalidade que expressa o grau de similaridade em termos de separação angular: cos θ pq = p q p 2 q 2 1/2 p e q = valores comparados Quando a similaridade é completa, a separação angular é 0 e cos θ = 1; quando não ocorre similaridade, a separação angular é 90 e o cos θ = 0.

15 4 [ ANÁLISE DE AGRUPAMENTOS ] 73 Coeficientes de correlação Medem o grau de associação entre valores pela representação de pontos num sistema de coordenadas e suas respectivas posições em relação a uma linha reta. Dois coeficientes muito utilizados são: o paramétrico, de Pearson e o não paramétrico, de Spearman. Coeficiente de correlação de Pearson O coeficiente de correlação da amostra r (ou ρ ), que é uma estimativa do coeficiente de correlação populacional ρ, é dado por: r = cov(, y) [vr() vr(y)] 1/2 = ( )(y y) ( ) 2 n 1 n 1 (y y) 2 n 1 1/2 em que n é o número de pares de valores para e y, variáveis com distribuição normal, e e y são os valores médios para e y. Utiliza-se o método dos mínimos quadrados para o cálculo do coeficiente de correlação com a seguinte fórmula simplificada: r = SPXY SQX SQY SPXY = y (.y)/n SQX = 2 () 2 /n SQY = y 2 (y) 2 /n Os valores de r são medidas adimensionais e variam de 1 a +1, expressando desde comportamento totalmente inverso até comportamento totalmente direto entre as duas variáveis. Quandor = 0, não há relação linear entre e y. Coeficiente de correlação de Spearman É um coeficiente de correlação não paramétrico entre duas variáveis, X e Y, e, para seu cálculo, atribui-se um posto a cada valor de cada uma das variáveis, de acordo com o grau de magnitude do valor na variável. Assim, em cada variável, o menor valor assume o posto 1, o segundo menor, o posto 2, e assim por diante. Para o i-ésimo par de valores das variáveis, calcula-se a diferença d dos postos, = 1, 2, n. No caso de dois ou mais

16 5 ANÁLISE DE COMPONENTES PRINCIPAIS É o mais antigo método de ordenação, o mais conhecido e com mais exemplos de aplicação em Geociências. Trata-se de uma técnica para encontrar componentes lineares de variáveis correlacionadas por meio do cálculo dos autovalores e correspondentes autovetores de uma matriz de variâncias-covariâncias ou de uma matriz de coeficientes de correlação entre variáveis. Em vez de covariância, o coeficiente de correlação é mais usado para a matriz inicial de similaridades, porque elimina o efeito de escala: uma variável que oscile entre 0 e 1 não pesa mais do que uma variável que oscile entre 0 e A covariância é utilizada com variáveis obtidas em escalas idênticas ou quando se quer ressaltar as variâncias das variáveis que influenciam nas cargas fatoriais. Quando as variáveis não podem ser diretamente comparadas, em razão das diferentes escalas de mensuração, torna-se necessária uma padronização preliminar, de modo que as variáveis transformadas passem a ter média zero e variância unitária, o que é conseguido pela transformação z. Nos casos com variáveis padronizadas, a matriz de variâncias-covariâncias e a de coeficientes de correlação tornam-se idênticas. Como a padronização influencia a estrutura da matriz de variâncias-covariâncias e, consequentemente, os resultados da análise, a sua utilização deve ser criteriosa, levando em conta a natureza dos dados em estudo e o enfoque pretendido. A análise de componentes principais não é sinônimo de análise fatorial ou análise de fatores, e essa confusão terminológica deve ser evitada. A primeira análise consiste na transformação linear de n variáveis originais, normalmente correlacionadas entre si, em n novas variáveis não correlacionadas. Essas novas variáveis são denominadas componentes principais, de modo que a primeira nova variável computada seja responsável pela

17 86 Análise estatística de dados geológicos multivariados maior variação possível no conjunto de dados; a segunda, pela maior variação possível restante, e assim por diante, até que toda a variação do conjunto tenha sido explicada. Na análise de fatores, supõe-se que as relações de um conjunto de n variáveis sejam o reflexo das correlações de cada uma dessas variáveis com p fatores, mutuamente não correlacionáveis entre si, com p menor que n. O cuidado que se deve ter é com relação à especificação do número e, principalmente, do significado dos p fatores que emergem a partir dessa análise (ver Jöreskog, Klovan e Reyment, 1976 e Reyment e Jöreskog, 1996). Portanto, a análise de componentes principais é uma técnica de transformação de variáveis. O método apresenta melhores resultados se, originalmente, já existir alguma correlação entre variáveis ou grupo de variáveis e se o número de variáveis for significativo. Por exemplo, ,84 3 0,80 0,96 4 0,21 0,18 0,31 5 0,13 0,23 0,24 0,91 Neste exemplo, com cinco variáveis, verifica-se que existem dois grupos de variáveis decorrentes do grau de correlação: um, constituído pelas variáveis 1, 2 e 3 e, outro, pelas variáveis 4 e 5. Se cada variável medida pode ser considerada como um Fig. 5.1 Diagrama bivariado com a distribuição dos pontos em relação às variáveis originais X1 e X2 e às novas eixo de variabilidade e está usualmente correlacionada com outras componentes, C1 e C2. C1 representa a maior porcentagem variáveis, esta análise transforma da variabilidade total existente e C2, disposta ortogonalmente, a variabilidade restante os dados de modo a descrever a mesma variabilidade total existente, com o mesmo número de eixos originais, porém não mais correlacionados entre si. A posição espacial dos pontos no espaço multidimensional permanece a mesma, mas mudam os eixos originais por rotação ortogonal, que passam a ser denominados componentes principais (Fig. 5.1).

18 122 Análise estatística de dados geológicos multivariados 7.1 Análise fatorial R-Q simultânea Pelo teorema de Eckart-Young, é possível extrair fatores pelos modos R e Q simultaneamente, mas, na prática, os resultados podem não ser os mesmos, pela maneira como os dados são transformados antes do processo fatorial. O escalonamento de valores condiciona as medidas de similaridade e, assim, a natureza da solução fatorial. No modo R, a solução fatorial inicia-se pela matriz simétrica dos menores produtos [P] [P] e, no modo Q, pela matriz simétrica dos maiores produtos [P][P]. Isso significa que os procedimentos de escalonamento de valores não são os mesmos para originar [P] a partir dos dados originais [X]. Por exemplo, na análise de componentes principais, cada elemento de [X] é dividido pelo desvio padrão das colunas para produzir [P]. Na análise fatorial pelo modo Q, ocorre uma padronização, que inclui a divisão de cada elemento de [X] pela raiz quadrada da soma de quadrados das linhas para originar [P]. Como a matriz [P] originada pelo modo R não é idêntida à matriz [P] originada pelo modo Q, tal diferença entre escalas não fornece os mesmos resultados (Davis, 2002). A análise de associações usa uma matriz simétrica com a mesma escala de valores para linhas e colunas, e procura medidas de similaridade proporcional entre objetos e variáveis. A similaridade resultante é a distância χ 2 utilizável apenas para tabelas de contingências que estimam probabilidades. Uma tabela de medidas com valores contínuos, porém, tem diferentes propriedades e necessidade de metodologia própria para tratar simultaneamente os objetos e as variáveis, como apresentado por Zhou, Chang e Davis (1983). Segundo esses autores, se os dados forem escalonados de modo que o produto menor [P] [P] seja uma matriz de correlações e o produto maior [P][P], uma matriz de distâncias euclidianas, o modo R, ao ser executado por uma análise de componentes principais, e o modo Q, por uma análise das coordenadas principais, apresentarão resultados com mesma configuração espacial. Exemplo 7.1 A matriz de dados deste exemplo provém de um levantamento do Swiss Federal Institute of Technology, de Lausanne, Suíça, com a seguinte estruturação por linhas: ID X Y G, U, Z1, Z2, Z3 (Matriz de dados 7.1 do Anexo), em que: ID identidade do ponto de coleta;

19 7 [ ANÁLISE DE CORRESPONDÊNCIAS OU DE ASSOCIAÇÕES ] 123 X coordenada X; Y coordenada Y; G classificação geológica, que identifica o nível estratigráfico onde a amostra foi coletada (J1: Argoviano; J2: Kimmeridgiano; J3: Sequaniano; J4: Portlandiano; Q: Quaternário); U uso da terra onde a amostra foi coletada (floresta; pastagem; pradaria; lavoura); Zi concentrações de três metais pesados (cádmio, cobre, chumbo) coletados no horizonte superior do solo. Os limites máximos toleráveis para o consumo humano são, para Cd: 0,8 ppm; Cu: 50ppm; Pb: 50ppm (maiores detalhes em Goovaerts, 1997). Com esses valores, foi efetuada preliminarmente uma transformação binária para as variáveis Cd, Cu e Pb da seguinte maneira: se Cd 0,8, substituir por 1; caso contrário, por zero; se Cu 50, substituir por 1; caso contrário, por zero; se Pb 50, substituir por 1; caso contrário, por zero. De posse dessa nova tabela, com valores binários, realizou-se uma análise de correspondências múltiplas para confrontar as relações entre as três variáveis geoquímicas com a litologia e com o uso da terra (Matriz de dados 7.1 do Anexo). O resultado encontra-se na Fig Fig. 7.3 Análise de correspondências múltiplas: 0 indica abaixo do teor limite e 1, acima desse teor; indica locais de amostragem

ANÁLISE DE CORRESPONDÊNCIAS (ASSOCIAÇÕES)

ANÁLISE DE CORRESPONDÊNCIAS (ASSOCIAÇÕES) ANÁLISE DE CORRESPONDÊNCIAS (ASSOCIAÇÕES) A análise de componentes principais ou análise fatorial exigem dados mensurados em escala numérica contínua e não é apropriada para dados nominais, tais como contagem

Leia mais

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA

Leia mais

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios: Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de

Leia mais

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP

ANÁLISE DE COMPONENTES PRINCIPAIS/PCA ou ACP Procedimento para a determinação de novas variáveis (componentes) que expliquem a maior variabilidade possível existente em uma matriz de dados multidimensionais. ANÁLISE DE COMPONENTES PRINCIPAIS/PCA

Leia mais

ANÁLISE DISCRIMINANTE. Análise discriminante. Função discriminante. Análise de agrupamentos e Análise das componentes principais

ANÁLISE DISCRIMINANTE. Análise discriminante. Função discriminante. Análise de agrupamentos e Análise das componentes principais Análise de agrupamentos e Análise das componentes principais Ambas as análises são técnicas de redução de dados. ANÁLISE DISCRIMINANTE Objetivo da análise de agrupamentos é formar grupos, reduzindo o número

Leia mais

29 e 30 de julho de 2013

29 e 30 de julho de 2013 Programa de Pós-Graduação em Estatística e Experimentação Agronômica ESALQ/USP 29 e 30 de julho de 2013 Dia 2 - Conteúdo 1 2 3 Dados multivariados Estrutura: n observações tomadas de p variáveis resposta.

Leia mais

Ralph S. Silva

Ralph S. Silva ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S. Silva http://www.im.ufrj.br/ralph/multivariada.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Agradecimentos

Leia mais

ANÁLISE DISCRIMINANTE. Análise discriminante. Função discriminante. Análise de agrupamentos e Análise das componentes principais

ANÁLISE DISCRIMINANTE. Análise discriminante. Função discriminante. Análise de agrupamentos e Análise das componentes principais Análise de agrupamentos e Análise das componentes principais Ambas as análises são técnicas de redução de dados. ANÁLISE DISCRIMINANTE Objetivo da análise de agrupamentos é formar grupos, reduzindo o número

Leia mais

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial! Análise Fatorial 1 Na análise fatorial as variáveis y1, y,..., Yp, são combinações lineares de umas poucas variáveis F1, F,..., Fm (m

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS fonte de graus de soma de quadrado variação liberdade quadrados médio teste F regressão 1 1,4 1,4 46,2 resíduo 28 0,8 0,03 total 2,2 A tabela de análise de variância (ANOVA) ilustrada acima resulta de

Leia mais

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra) Testes de Tendência Central (média, mediana, proporção) Classificação Variável 1 Variável 2 Núm ero Gru pos Dependência Teste Z Paramétrico Quantitativa - 1 - Premissas Variância pop. * conhecida Teste

Leia mais

AULA 06 Correlação. Ernesto F. L. Amaral. 04 de outubro de 2013

AULA 06 Correlação. Ernesto F. L. Amaral. 04 de outubro de 2013 1 AULA 06 Correlação Ernesto F. L. Amaral 04 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de

Leia mais

1. Conceitos básicos de estatística Níveis de medição Medidas características de distribuições univariadas 21

1. Conceitos básicos de estatística Níveis de medição Medidas características de distribuições univariadas 21 OS SABERES INDISPENSÁVEIS 7 Índice Prefácio 13 Capítulo 1 Os Saberes Indispensáveis 1. Conceitos básicos de estatística 17 1.1. Níveis de medição 18 1.2. Medidas características de distribuições univariadas

Leia mais

COKRIGAGEM. Aplicação da cokrigagem

COKRIGAGEM. Aplicação da cokrigagem COKRIGAGEM Procedimento geoestatístico segundo o qual diversas variáveis regionalizadas podem ser estimadas em conjunto, com base na correlação espacial entre si. É uma extensão multivariada do método

Leia mais

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MESTRADO EM ENGENHARIA AMBIENTAL E URBANA Apresentação do Curso Introdução Professora: Cira Souza Pitombo Disciplina: Aplicações de técnicas de análise

Leia mais

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47 CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................

Leia mais

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS Nível de significância No processo de tomada de decisão sobre uma das hipóteses levantadas num estudo, deve-se antes de tudo definir

Leia mais

8. Análise em Componentes Principais - ACP

8. Análise em Componentes Principais - ACP 8. Análise em Componentes Principais - ACP 8.1 Introdução O propósito principal da ACP é substituir as variáveis originais por um número menor de variáveis que são função das variáveis originais. A ACP

Leia mais

Estudo dirigido de Análise Multivariada

Estudo dirigido de Análise Multivariada Estudo dirigido de Análise Multivariada Conceitos Iniciais De um modo geral, os métodos estatísticos de análise multivariada são aplicados para analisar múltiplas medidas sobre cada indivíduo ou objeto

Leia mais

8 JÚLIO CESAR R. PEREIRA

8 JÚLIO CESAR R. PEREIRA SUMÁRIO Lista de Tabelas... 09 Lista de Figuras... 11 Agradecimentos... 15 Apresentação... 17 Prefácio... 19 1. O Dado Qualitativo... 21 O Dado e o Evento... 21 A Análise de Dados Qualitativos e a Pesquisa

Leia mais

Seminário de Análise Multivariada

Seminário de Análise Multivariada Seminário de Análise Multivariada Capítulo 1 - Introdução Conteúdo 1 Introdução 1 11 Aplicações de Técnicas Multivariadas 2 12 Organização de Dados 3 121 Arranjos 3 122 Exemplo 11 - Seleção de recibos

Leia mais

Métodos Quantitativos

Métodos Quantitativos Métodos Quantitativos Unidade 4. Estatística inferencial Parte II 1 Sumário Seção Slides 4.1 Correlação entre variáveis quantitativas 03 11 4.2 Teste de significância 12 19 4.3 Regressão linear 20 27 4.4

Leia mais

Estatística 1. Resumo Teórico

Estatística 1. Resumo Teórico Estatística 1 Resumo Teórico Conceitos do Curso 1. Tipos de Variáveis e Representações Gráficas a. Tipos de Variáveis b. Distribuição de Frequências c. Histograma 2. Estatística Descritiva Medidas Estatísticas

Leia mais

Aula 2 Uma breve revisão sobre modelos lineares

Aula 2 Uma breve revisão sobre modelos lineares Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar

Leia mais

Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações

Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações Análise Fatorial e Componentes Principais Aplicadas na Engenharia de Avaliações Diogo de Carvalho Bezerra Universidade Federal de Pernambuco Núcleo de Gestão e-mail:dicbezerra@hotmail.com SOBREA Sociedade

Leia mais

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 9 Correlação e Regressão 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 1 9-1 Aspectos Gerais Dados Emparelhados há uma relação? se há, qual

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS 2003 2004 2005 2006 2007 2008 2009 2010 X 39,0 39,5 39,5 39,0 39,5 41,5 42,0 42,0 Y 46,5 65,5 86,0 100,0 121,0 150,5 174,0 203,0 A tabela acima mostra as quantidades, em milhões

Leia mais

RESOLUÇÃO Nº 01/2016

RESOLUÇÃO Nº 01/2016 Legislações Complementares: Resolução Nº 02/2016 Colegiado DEst Resolução Nº 03/2016 Colegiado DEst Resolução Nº 01/2017 Colegiado DEst RESOLUÇÃO Nº 01/2016 O Departamento de Estatística, tendo em vista

Leia mais

Técnicas Multivariadas em Saúde

Técnicas Multivariadas em Saúde Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de

Leia mais

Planejamento e Otimização de Experimentos

Planejamento e Otimização de Experimentos Planejamento e Otimização de Experimentos Um Pouco de Estatística Descritiva Prof. Dr. Anselmo E de Oliveira anselmo.quimica.ufg.br elcana@quimica.ufg.br Populações, Amostras e Distribuições População

Leia mais

Medidas de Semelhança

Medidas de Semelhança Medidas de Semelhança Índices de Semelhança Grandezas numéricas que quantificam o grau de associação entre um par de objetos ou de descritores. Como escolher um Índice? O objetivo da análise é associar

Leia mais

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial!

Análise Fatorial. Matriz R de coeficientes de correlação: Não confundir análise de componentes principais com análise fatorial! Análise Fatorial 1 Na análise fatorial as variáveis y1, y,..., Yp, são combinações lineares de umas poucas variáveis F1, F,..., Fm (m

Leia mais

MATRIZ DE REFERÊNCIA-Ensino Médio Componente Curricular: Matemática

MATRIZ DE REFERÊNCIA-Ensino Médio Componente Curricular: Matemática MATRIZ DE REFERÊNCIA-Ensino Médio Componente Curricular: Matemática Conteúdos I - Conjuntos:. Representação e relação de pertinência;. Tipos de conjuntos;. Subconjuntos;. Inclusão;. Operações com conjuntos;.

Leia mais

Ralph S. Silva

Ralph S. Silva ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:

Leia mais

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Vanessa Siqueira Peres da Silva 1 2 Daniel Furtado Ferreira 1 1 Introdução É comum em determinadas

Leia mais

Análise Multivariada Aplicada à Contabilidade

Análise Multivariada Aplicada à Contabilidade Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda

Leia mais

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27 Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4

Leia mais

G4 de Álgebra Linear I

G4 de Álgebra Linear I G4 de Álgebra Linear I 27.1 Gabarito 1) Considere a base η de R 3 η = {(1, 1, 1); (1,, 1); (2, 1, )} (1.a) Determine a matriz de mudança de coordenadas da base canônica para a base η. (1.b) Considere o

Leia mais

CORRELAÇÃO. Flávia F. Feitosa

CORRELAÇÃO. Flávia F. Feitosa CORRELAÇÃO Flávia F. Feitosa BH1350 Métodos e Técnicas de Análise da Informação para o Planejamento Junho de 2015 Revisão Inferência Estatística: Método científico para tirar conclusões sobre os parâmetros

Leia mais

Parte 3 - Produto Interno e Diagonalização

Parte 3 - Produto Interno e Diagonalização Parte 3 - Produto Interno e Diagonalização Produto Escalar: Sejam u = (u 1,..., u n ) e v = (v 1,..., v n ) dois vetores no R n. O produto escalar, ou produto interno euclidiano, entre esses vetores é

Leia mais

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.

Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina. Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina. De forma geral, a prova manteve o padrão das questões da

Leia mais

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012 1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à

Leia mais

Correlação e Regressão

Correlação e Regressão Correlação e Regressão Vamos começar com um exemplo: Temos abaixo uma amostra do tempo de serviço de 10 funcionários de uma companhia de seguros e o número de clientes que cada um possui. Será que existe

Leia mais

Definição Há correlação entre duas variáveis quando os valores de uma variável estão relacionados, de alguma maneira, com os valores da outra variável

Definição Há correlação entre duas variáveis quando os valores de uma variável estão relacionados, de alguma maneira, com os valores da outra variável Correlação Definição Há correlação entre duas variáveis quando os valores de uma variável estão relacionados, de alguma maneira, com os valores da outra variável Exemplos Perímetro de um quadrado e o tamanho

Leia mais

3ª Igor/ Eduardo. Competência Objeto de aprendizagem Habilidade

3ª Igor/ Eduardo. Competência Objeto de aprendizagem Habilidade Matemática 3ª Igor/ Eduardo 9º Ano E.F. Competência Objeto de aprendizagem Habilidade C3 - Espaço e forma Números racionais. Números irracionais. Números reais. Relações métricas nos triângulos retângulos.

Leia mais

5. Seja A uma matriz qualquer. Assinale a afirmativa

5. Seja A uma matriz qualquer. Assinale a afirmativa UFRJ Instituto de Matemática Disciplina: Algebra Linear II - MAE 125 Professor: Bruno, Gregório, Luiz Carlos, Mario, Milton, Monique e Umberto Data: 12 de julho de 2013 Terceira Prova 1. Considere no espaço

Leia mais

4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1)

4 ANÁLISE DE DADOS. Erro do balanço iônico (%) = Σ cátions - Σ ânions x 100 Σ (cátions + ânions) (1) ANÁLISE DE DADOS 4 ANÁLISE DE DADOS A definição das características das águas subterrânea baseou-se nas análises químicas e físico-químicas e na utilização de métodos estatísticos, como a estatística multivariada

Leia mais

Representação esquemática de estruturas de dados

Representação esquemática de estruturas de dados UNIVERSIDADE DE SÃO PAULO - USP Instituto de Química de São Carlos - IQSC Grupo de Química Medicinal do IQSC/USP 1 Representação esquemática de estruturas de dados 2 1 Tipos de variáveis Contínua Concentração,

Leia mais

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015

Mestrado Profissional em Administração. Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 2015 Mestrado Profissional em Administração Disciplina: Análise Multivariada Professor: Hedibert Freitas Lopes 1º trimestre de 015 Decomposição Espectral Autovalores e autovetores MANLY, Cap. Objetivo e Definição

Leia mais

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados. PREVISÃO O problema: usar a informação disponível para tomar boas decisões com impacto no futuro Informação disponível -qualitativa Prever o que irá acontecer -quantitativa: dados t DEI/FCTUC/PGP/00 1

Leia mais

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses BIOESTATÍSTICA Parte 5 Testes de Hipóteses Aulas Teóricas de 05/05/2011 a 19/05/2011 5.1. Conceito de erro, estatística de teste, região de rejeição, nível de significância, valor de prova, potência do

Leia mais

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Análise da Regressão. Prof. Dr. Alberto Franke (48) Análise da Regressão Prof. Dr. Alberto Franke (48) 91471041 O que é Análise da Regressão? Análise da regressão é uma metodologia estatística que utiliza a relação entre duas ou mais variáveis quantitativas

Leia mais

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16) Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16) Resumo: Veremos nesta aula tabelas, cálculos de porcentagem e gráficos; amostras e tipo de amostragem; Medidas de tendência central e medidas

Leia mais

Súmario APRESENTAÇÃO DA COLEÇÃO...13

Súmario APRESENTAÇÃO DA COLEÇÃO...13 Súmario APRESENTAÇÃO DA COLEÇÃO...13 CAPÍTULO I LÓGICA PROPOSICIONAL...15 1. Lógica Proposicional...15 2. Proposição...15 2.1. Negação da Proposição...18 2.2. Dupla Negação...19 2.3. Proposição Simples

Leia mais

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja: Pessoal, trago a vocês a resolução da prova de Estatística do concurso para Auditor Fiscal aplicada pela FCC. Foram 10 questões de estatística! Não identifiquei possibilidade para recursos. Considero a

Leia mais

Tutorial para o desenvolvimento das Oficinas

Tutorial para o desenvolvimento das Oficinas Tutorial para o desenvolvimento das Oficinas 1 Métodos Quantitativos Profa. Msc. Regina Albanese Pose 2 Objetivos Objetivo Geral Este tutorial tem como objetivo parametrizar o desenvolvimento da oficina

Leia mais

Exemplo 1: Variáveis padronizadas Z t = ( Z 1 (1), Z 2 (1), Z 1 (2), Z 2 Z 1 (1) Z (1) = Z (2) = Z 2. Matriz de correlações:

Exemplo 1: Variáveis padronizadas Z t = ( Z 1 (1), Z 2 (1), Z 1 (2), Z 2 Z 1 (1) Z (1) = Z (2) = Z 2. Matriz de correlações: Exemplo : Variáveis padronizadas t = (,,, ) = = Matriz de correlações: Ρ Ρ Ρ Ρ Ρ.0 0.4 0.5 0.6 0.4.0 0.3 0.4 0.5 0.3.0 0. 0.6 0.4 0..0 De onde se obtém: /.068 0.9.047 0.083 Ρ Ρ 0.9.068 0.083.047 Ρ / /

Leia mais

Universidade Federal de Alagoas UFAL Centro de Tecnologia - CTEC Programa de Pós-Graduação em Engenharia Civil - PPGEC

Universidade Federal de Alagoas UFAL Centro de Tecnologia - CTEC Programa de Pós-Graduação em Engenharia Civil - PPGEC Universidade Federal de Alagoas UFAL Centro de Tecnologia - CTEC Programa de Pós-Graduação em Engenharia Civil - PPGEC Introdução à Mecânica do Contínuo Tensores Professor: Márcio André Araújo Cavalcante

Leia mais

Técnicas Multivariadas em Saúde

Técnicas Multivariadas em Saúde Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de

Leia mais

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING OBJETIVOS Na era da informação, as empresas capturam e armazenam muitos dados, e existe a real necessidade da aplicação de técnicas adequadas para a rápida tomada de

Leia mais

PROVA ESPECÍFICA Cargo 23

PROVA ESPECÍFICA Cargo 23 27 PROVA ESPECÍFICA Cargo 23 QUESTÃO 41 Sobre métodos de amostragem, NÃO é correto afirmar: a) Na amostragem aleatória simples, todas as unidades experimentais têm a mesma chance de serem selecionadas.

Leia mais

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II UNIVERSIDADE FEDERAL DE RONDÔNIA CAMPUS DE JI-PARAN PARANÁ DEPARTAMENTO DE ENGENHARIA AMBIENTAL Estatística II Aula 8 Profa. Renata G. Aguiar Considerações Coleta de dados no dia 18.05.2010. Aula extra

Leia mais

Análise de Dados Longitudinais Aula

Análise de Dados Longitudinais Aula 1/35 Análise de Dados Longitudinais Aula 08.08.2018 José Luiz Padilha da Silva - UFPR www.docs.ufpr.br/ jlpadilha 2/35 Sumário 1 Revisão para dados transversais 2 Como analisar dados longitudinais 3 Perspectiva

Leia mais

Planejamento e Otimização de Experimentos

Planejamento e Otimização de Experimentos Planejamento e Otimização de Experimentos Um Pouco de Estatística Prof. Dr. Anselmo E de Oliveira anselmo.quimica.ufg.br anselmo.disciplinas@gmail.com Populações, Amostras e Distribuições População Amostra

Leia mais

5 Avaliação dos estimadores propostos

5 Avaliação dos estimadores propostos 5 valiação dos estimadores propostos Este capítulo apresenta as medidas estatísticas usuais para avaliar a qualidade de estimadores e as expressões utilizadas para a estimação destas medidas, a partir

Leia mais

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos PHD 574 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos 8 a aula Testes Não-Paramétricos de Hipóteses Mario Thadeu Leme de Barros Luís Antonio Villaça de Garcia Abril / 005 Estatística Aplicada

Leia mais

Conceitos de vetores. Decomposição de vetores

Conceitos de vetores. Decomposição de vetores Conceitos de vetores. Decomposição de vetores 1. Introdução De forma prática, o conceito de vetor pode ser bem assimilado com auxílio da representação matemática de grandezas físicas. Figura 1.1 Grandezas

Leia mais

Capítulo 1 Conceitos de Marketing e Marketing Research

Capítulo 1 Conceitos de Marketing e Marketing Research Índice Prefácio 21 Introdução 25 PARTE I Capítulo 1 Conceitos de Marketing e Marketing Research 1. Evolução do Marketing 33 2. Evolução do conceito de Marketing 35 3. Modelo do sistema de Marketing 38

Leia mais

Inferência Estatistica

Inferência Estatistica Inferência Estatistica Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Modelos e Inferência Um modelo é uma simplificação da realidade (e alguns

Leia mais

Uma Avaliação do Erro Tipo II no Uso do Teste t-student

Uma Avaliação do Erro Tipo II no Uso do Teste t-student Uma Avaliação do Erro Tipo II no Uso do Teste t-student Cleber Giugioli Carrasco Thiago Santana Lemes 1 Unidade Universitária de Ciências Exatas e Tecnológicas, Universidade Estadual de Goiás, UnUCET/UEG,

Leia mais

4. Curvas Paramétricas e Transformações 2D

4. Curvas Paramétricas e Transformações 2D 4. Curvas Paramétricas e Transformações 2D Curvas Paramétricas (fonte: Wikipédia) Em matemática, uma equação paramétrica é uma forma de representar uma curva (ou, em geral, uma superfície) como a imagem

Leia mais

Prof. Dr. Engenharia Ambiental, UNESP

Prof. Dr. Engenharia Ambiental, UNESP INTRODUÇÃO A ESTATÍSTICA ESPACIAL Análise Exploratória dos Dados Estatística Descritiva Univariada Roberto Wagner Lourenço Roberto Wagner Lourenço Prof. Dr. Engenharia Ambiental, UNESP Estrutura da Apresentação

Leia mais

Matemática e suas Tecnologias: Matemática

Matemática e suas Tecnologias: Matemática Matemática e suas Tecnologias: Matemática Centro Educacional Sesc Cidadania Planejamento Anual 2018 Professor (a): Heloísa Andréia de Macedo Bezerra Série: 1ª Série Disciplina: Matemática I 1.1 - Observar

Leia mais

3 a. FASE DO CONCURSO VESTIBULAR DO BACHARELADO EM ESTATÍSTICA 1 a. PROVA DA DISCIPLINA: CE065 ELEMENTOS BÁSICOS PARA ESTATÍSTICA CANDIDATO:

3 a. FASE DO CONCURSO VESTIBULAR DO BACHARELADO EM ESTATÍSTICA 1 a. PROVA DA DISCIPLINA: CE065 ELEMENTOS BÁSICOS PARA ESTATÍSTICA CANDIDATO: 3 a. FASE DO CONCURSO VESTIBULAR DO BACHARELADO EM ESTATÍSTICA a. PROVA DA DISCIPLINA: CE65 ELEMENTOS BÁSICOS PARA ESTATÍSTICA CANDIDATO: a. Questão (valor,): Resolva de forma clara e detalhada as questões

Leia mais

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA APLICAÇÃO NO CONTROLE DE QUALIDADE DE FÁRMACOS MÓDULO 05 Unidade Universitária de Ciências Exatas e Tecnológicas UnUCET Anápolis 1 2 MÓDULO 05 CALIBRAÇÃO MULTIVARIADA

Leia mais

Metas/ Objetivos Conceitos/ Conteúdos Aulas Previstas

Metas/ Objetivos Conceitos/ Conteúdos Aulas Previstas DEPARTAMENTO DE MATEMÁTICA E INFORMÁTICA DISCIPLINA: Matemática A (11º Ano) METAS CURRICULARES/CONTEÚDOS... 1º Período (13 de setembro a 15 de dezembro) Metas/ Objetivos Conceitos/ Conteúdos Aulas Previstas

Leia mais

G3 de Álgebra Linear I

G3 de Álgebra Linear I G3 de Álgebra Linear I 2.2 Gabarito ) Considere a matriz 4 N = 4. 4 Observe que os vetores (,, ) e (,, ) são dois autovetores de N. a) Determine uma forma diagonal D de N. b) Determine uma matriz P tal

Leia mais

Revisão de Álgebra Linear

Revisão de Álgebra Linear Introdução: Revisão de Álgebra Linear Antonio Elias Fabris Instituto de Matemática e Estatística Universidade de São Paulo Map 2121 Aplicações de Álgebra Linear Antonio Elias Fabris (IME-USP) Revisão de

Leia mais

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei Regressão PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei Regressão Introdução Analisar a relação entre duas variáveis (x,y) através da equação (equação de regressão) e do gráfico

Leia mais

Tratamento estatístico de observações geodésicas

Tratamento estatístico de observações geodésicas Tratamento estatístico de observações geodésicas Prof. Dr. Carlos Aurélio Nadal OBJETIVO: parâmetros estatísticos são utilizados para avaliar os métodos empregados ou para o controle de qualidade dos trabalhos.

Leia mais

PLANO DE ENSINO E APRENDIZAGEM

PLANO DE ENSINO E APRENDIZAGEM SERVIÇO PÚBLICO FEDERAL UNIVERSIDADE FEDERAL DO PARÁ INSTITUTO DE CIÊNCIAS EXATAS E NATURAIS CURSO DE LICENCIATURA PLENA EM MATEMÁTICA PARFOR PLANO E APRENDIZAGEM I IDENTIFICAÇÃO: PROFESSOR (A) DA DISCIPLINA:

Leia mais

Modelos de Regressão Linear Simples - parte I

Modelos de Regressão Linear Simples - parte I Modelos de Regressão Linear Simples - parte I Erica Castilho Rodrigues 19 de Agosto de 2014 Introdução 3 Objetivos Ao final deste capítulo você deve ser capaz de: Usar modelos de regressão para construir

Leia mais

Multicolinariedade e Autocorrelação

Multicolinariedade e Autocorrelação Multicolinariedade e Autocorrelação Introdução Em regressão múltipla, se não existe relação linear entre as variáveis preditoras, as variáveis são ortogonais. Na maioria das aplicações os regressores não

Leia mais

Ajustamento de Observações

Ajustamento de Observações Ajustamento de Observações Teoria dos Erros Prof. Dr. Marcos Aurélio Basso IFSULDEMINAS Campus Incondentes MG Teoria dos Erros - Introdução Observações e erros de observação; Factores que caracterizam

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Permite avaliar se existe relação entre o comportamento de duas ou mais variáveis e em que medida se dá tal interação. Gráfico de Dispersão A relação entre duas variáveis pode ser

Leia mais

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas

Programa do Curso. Transformação de Dados. Sistemas Inteligentes Aplicados. Carlos Hall. Discretização de Variáveis Contínuas Sistemas Inteligentes Aplicados Carlos Hall Programa do Curso Limpeza/Integração de Dados Transformação de Dados Discretização de Variáveis Contínuas Transformação de Variáveis Discretas em Contínuas Transformação

Leia mais

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9 em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review

Leia mais

Sensoriamento Remoto II

Sensoriamento Remoto II Sensoriamento Remoto II Componentes principais Revisão de matemática Análise de componentes principais em SR UFPR Departamento de Geomática Prof. Jorge Centeno 2016 copyright@ centenet Revisão matemática

Leia mais

Estimação e Testes de Hipóteses

Estimação e Testes de Hipóteses Estimação e Testes de Hipóteses 1 Estatísticas sticas e parâmetros Valores calculados por expressões matemáticas que resumem dados relativos a uma característica mensurável: Parâmetros: medidas numéricas

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS X 0 1 2 3 4 5 frequência absoluta 80 47 30 20 6 1 Um levantamento foi realizado para se avaliar, por município, a quantidade X de obras que estão sob suspeita de irregularidade.

Leia mais

Conceito de Estatística

Conceito de Estatística Conceito de Estatística Estatística Técnicas destinadas ao estudo quantitativo de fenômenos coletivos, observáveis. Unidade Estatística um fenômeno individual é uma unidade no conjunto que irá constituir

Leia mais

Significância do Coeficiente de Correlação

Significância do Coeficiente de Correlação Significância do Coeficiente de Correlação A primeira coisa que vamos tentar fazer nesta aula é apresentar o conceito de significância do coeficiente de correlação. Uma vez entendido este conceito, vocês

Leia mais

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Cap. 8 - Intervalos Estatísticos para uma Única Amostra Intervalos Estatísticos para ESQUEMA DO CAPÍTULO 8.1 INTRODUÇÃO 8.2 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA CONHECIDA 8.3 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO

Leia mais

Métodos Quantitativos II

Métodos Quantitativos II Métodos Quantitativos II MEDIDAS DE VARIABILIDADE O que significa Variabilidade? As medidas de tendência central nos dão uma ideia da concentração dos dados em torno de um valor. Entretanto, é preciso

Leia mais

Apontamentos de Introdução às Probabilidades e à Estatística

Apontamentos de Introdução às Probabilidades e à Estatística i Índice 1. Introdução 1 1.1. Enquadramento e objectivos 2 1.2. Organização 5 1.3. Noções base da Estatística 7 1.3.1. Distinção entre população e amostra 8 1.3.2. Amostragem 10 1.3.3. Unidade estatística

Leia mais

Delineamento e Análise Experimental Aula 3

Delineamento e Análise Experimental Aula 3 Aula 3 Castro Soares de Oliveira Teste de hipótese Teste de hipótese é uma metodologia estatística que permite tomar decisões sobre uma ou mais populações baseando-se no conhecimento de informações da

Leia mais