Bioestatística. Paulo Nogueira quarta-feira, 11 de Janeiro de 2012

Documentos relacionados
Testes de Hipóteses. : Existe efeito

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira

Estatística descritiva

Capítulo 6 Estatística não-paramétrica

Capítulo 6 Estatística não-paramétrica

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

CE003 Estatística II

Apontamentos de Introdução às Probabilidades e à Estatística

Filho, não é um bicho: chama-se Estatística!

Estimação e Testes de Hipóteses

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

Resultados dos testes estatísticos

1. Conceitos básicos de estatística Níveis de medição Medidas características de distribuições univariadas 21

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

Associação entre variáveis categóricas e IC95%

ISCTE- IUL Instituto Universitário de Lisboa

Prof. Dr. Alfredo J Rodrigues. Departamento de Cirurgia e Anatomia Faculdade de Medicina de Ribeirão Preto Universidade de São Paulo

Introdução à análise estatística com SPSS. Guião nº6: Medidas de associação

AULA 10 RELACIONAMENTOS ENTRE DUAS VARIÁVEIS

ESTATÍSTICA MULTIVARIADA 2º SEMESTRE 2010 / 11. EXERCÍCIOS PRÁTICOS - CADERNO 3 Distribuição Normal Multivariada

ISCTE Instituto Superior de Ciências do Trabalho e da Empresa

CONSULTADORIA INFORMÁTICA, LDA. Análise Bivariada

Exame Final de Métodos Estatísticos

Testes não paramétricos são testes de hipóteses que não requerem pressupostos sobre a forma da distribuição subjacente aos dados.

Apontamentos de Introdução às Probabilidades e à Estatística

INSTITUTO SUPERIOR DE CONTABILIDADE E ADMINISTRAÇÃO PORTO Ano lectivo 2009/20010 EXAME: DATA 24 / 02 / NOME DO ALUNO:

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

Introdução. Amostragem, amostra aleatória simples, tabela de números aleatórios, erros

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Métodos Quantitativos Aplicados

POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS

IMC para adolescentes:

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

Introdução 5 PREFÁCIO 15

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

A UTILIZAÇÃO DE MÉTODOS ESTATÍSTICOS NO PLANEJAMENTO E ANÁLISE DE ESTUDOS EXPERIMENTAIS EM ENGENHARIA DE SOFTWARE (FONTE:

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Frequência NOME:

1 Introdução aos Métodos Estatísticos para Geografia 1

Associação entre duas variáveis

Disciplina de Modelos Lineares Professora Ariane Ferreira

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

CE055 Bioestatística A

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

RESOLUÇÃO Nº 01/2016

Licenciatura em Fisioterapia Ano lectivo 2010/2011 4º Ano Seminário de Monografia I e II. Monografia Final de Curso

Explore sexo do sujeito

Construção da base de dados

Métodos Quantitativos Aplicados

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

CE055 Bioestatística A

Anexo 1 ESCALA-21 DE DEPENDÊNCIA AO EXERCÍCIO Hausenblas & Symons Downs (2002)

Análise de dados para negócios. Cesaltina Pires

Bioestatística. Mestrado Saúde Materno Infantil 2005 Prof. José Eulálio Cabral Filho

Conceitos centrais em análise de dados

CE001 Bioestatística

Casos. Índice. Parte I. Caso 1 Vendas da empresa Platox. Caso 2 Importação de matéria-prima. Caso 3 Carteira de acções. Caso 4 Lançamento de produto

Group Statistics. residência N Mean Std. Deviation Std. Error Mean. Avaliação Breve do Estado Mental. meio rural 11 27,73 1,849,557

6EMA Lucas Santana da Cunha 17 e 19 de abril de Universidade Estadual de Londrina

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

Exame de Recurso de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

CE008 Introducão à Bioestatística

APLICAÇÃO COLETIVA DA FIGURA COMPLEXA DE REY

Análise de Variância a um factor

Universidade de Brasília - Y Instituto de Psicologia. Programa de Pós-graduação em Psicologia Social, do Trabalho e das Organizações.

Instituto Universitário de Lisboa (ISCTE-IUL) Licenciaturas em Gestão e Finanças & Contabilidade Estatística II - Exame de 1ª época

Aula 7. Testes de Hipóteses Paramétricos (II)

AMOSTRAGEM COMPLEXA. Bases de Dados IAN-AF Tutorial para análise ponderada recorrendo aos softwares SPSS e R

Aula 7. Testes de Hipóteses Paramétricos (II)

Correlação e Regressão

Estatística aplicada a ensaios clínicos

AULA 05 Teste de Hipótese

APONTAMENTOS DE SPSS

Métodos Estatísticos sticos Aplicados à Engenharia de Software Experimental

Teste Anova. Prof. David Prata Novembro de 2016

Appendices Booklet. João Diogo Sequeira Coelho #1502. Masters in Management

Bioestatística Básica

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

Inferência Estatística

I.1. Seleccionado um passageiro ao acaso, qual a probabilidade de ter idade no intervalo [20 a 50) anos e ser fraudulento?

AULA 11 Teste de Hipótese

ANOVA FACTORIAL EXEMPLO 1. ANOVA TWO-WAY COM O SPSS. a capacidade de reconhecimento do odor materno

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME:

6EMA Lucas Santana da Cunha 19 de abril de Universidade Estadual de Londrina

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

FAURGS HCPA Edital 01/2011 PS 01 ANALISTA I Estatístico Pág. 1

Associação entre duas variáveis

Modelos de Análise de Variância

ESTATÍSTICA ECONÔMICA A 6EMA

Ficha da Unidade Curricular (UC)

ESCOLAS DE MANGUALDE

Análise de Regressão Linear Simples e

Delineamento e Análise Experimental Aula 3

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126

MÉTODOS QUANTITATIVOS APLICADOS

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

Transcrição:

Bioestatística Paulo Nogueira quarta-feira, 11 de Janeiro de 2012

Bioestatística?

Bioestatística Biologia + Estatística (Portmanteau) Biometria Estatística aplicada às ciências da saúde

Para que serve a estatística?

Para que serve a estatística? Qual o seu principal objectivo? obter conclusões sobre a população usando uma amostra? População Amostragem Amostra Uma ou mais variáveis (X) são observadas Algumas Noções

População Amostragem Amostra Uma ou mais variáveis (X) são observadas Verdadeiro valor medição média

Exatidão + - Precisão + * * * * * * * * * * * * * * - * * * * * * * * * * * * * * * *

ESTATÍSTICA 1. Estatística Descritiva Explorar, apresentar e resumir os dados da amostra. (tabelas, Gráficos, medidas de localização, medidas de dispersão, etc.) 2. Inferência Estatística Afirmações sobre parâmetros da população. (Estimativas pontuais, intervalos de confiança, Testes de hipóteses) Algumas Noções

O que é um Intervalo de Confiança? Para que serve e como se interpreta.

População Amostragem Amostra Uma ou mais variáveis (X) são observadas Verdadeiro valor medição média

Quão (im)precisas são as estimativas? A precisão de uma estimativa amostral de um parâmetro amostral é caracterizada pelo Erro padrão. Se repetíssemos a experiência um número infinito de vezes e em cada vez calculássemos a estimativa; Obteríamos a distribuição (virtual) dos parâmetros. (distribuição amostral). Tamanho de amostra grande Tamanho de amostra pequeno

A resposta é dada (medida) pelo seu erro padrão: Quão precisas são as estimativas? s s. e. x (Desvio padrão da média (DPM)) n Desvio Padrão da Média DPM s n A resposta é dada (medida) pelo seu erro padrão s - é o desvio padrão amostral 1. A precisão é proporcional ao desvio padrão 2. A precisão é proporcional à raiz quadrada do tamanho da amostra. i.e. 2x mais Precisão 4x o Tamanho da Amostra 3. O que é que se usa nas publicações? O desvio padrão ou o erro padrão? Depende do objectivo - O desvio padrão descreve a variabilidade de X na População. - O erro padrão descreve quão precisa é a estimativa da média populacional

Intervalos de confiança Estimação em forma de intervalo de parâmetro populacional, com base na informação amostral disponível e no conhecimento da distribuição amostral do estimador do parâmetro X para 2 S para s 2

Intervalos de confiança mais usuais Parâmetro Média Proporções Variância Uma proporção é a média de uma amostra proveniente de uma população de Bernoulli

Exemplo Intervalos de confiança # glucose (mg/dl) 76.0,77.4, 77.0, 76.9, 74.3, 74.5, 77.0, 80.3, 77.2, 77.0, 76.9, 75.5, 79.9, 76.0, 76.7, 74.5, 74.9, 79.2, 78.7, 78.5, 77.1 s 2 x 76. 9 x z s s ; x z 1 n 1 n 2 2 IC 90% 2 76.9 1.645 2 ; 76.9 1.645 IC 95% 2 76.9 1.96 2 ; 76.9 1.96 IC 99% 2 76.9 2.457 2 ; 76.9 2.457 21 21 21 21 21 21 76.2 76.0 ; ; 75.8; 77.6 77.8 78.0

Intervalos de confiança Média s desconhecido Intervalo (1-)*100% de confiança para a média ; 1 2 1 1 2 1 n s n n s n t x t x

Amostra e sub-amostras Interpretação: Se a experiência for repetida muitas vezes, 95% dos IC conterão o verdadeiro. Original 5% 1 5% 2 5% 3 10% 1 10% 2 30% 1 30% 2 140 160 180 200 220 95% CI TRIG

Testes de Hipóteses Hipótese Estatística de teste Distribuição da estatística de teste Decisão H 0 : Não existe efeito vs. H 1 : Existe efeito Hipótese nula Hipótese alternativa Varia conforme a natureza do problema Ou rejeito a hipótese nula o que significa que existe um efeito de tratamento Ou não rejeito a hipótese nula o que significa que não existem evidências de um efeito de tratamento

Aceitar ou Não rejeitar? Do ponto de vista estatístico puro não se diz Aceito H 0, porque existem sempre erros. O facto de não se rejeitar H 0 pode ter duas causas: Ou o efeito não existe Ou não existe potência para mostrar o efeito.

Interpretação dos p-values O p-value é a probabilidade de observar os dados quando a hipótese nula é verdadeira. Por exemplo num ensaio clínico Estamos interessados na diferença observada entre dois grupos de tratamentos. Relacionamos então os dados com a provável variação numa amostra devida ao acaso quando a hipótese nula é verdadeira na população. Regra geral, Se o p-value > 0,05 Se o p-value < 0,05 Se o p-value < 0,01 o resultado do teste não é significativo o resultado do teste é significativo (rejeita-se a hipótese nula) Pode-se dizer que o resultado é muito significativo

Erros de Tipo I e Tipo II Existem sempre erros ao fazer um teste de hipóteses. Realidade: H 0 Decisão: H 0 Verdadeira Verdadeira confiança 1 Falsa Erro II b Falsa Erro I Potência 1 b

de tipoi Rejeitar H H é verdadeira P erro P 0 0 de tipoii Não Rejeitar H H é falsa b P erro P 0 0 Potência 1b P Rejeitar H0 H0 é Falsa

Esquema Clássico

Académico Académico Académico

Médias Uma amostra Duas amostras Várias amostras Normalidade da distribuição de cada grupo Não Normalidade da distribuição de pelo menos um grupo / uma das amostra com tamanho muito pequeno (teste não paramétrico) Igualdade de variâncias desigualdade de variâncias Teste t Teste t Teste t (teste de welsh) Teste de Mann-Whitney Igualdade de variâncias ANOVA desigualdade de variâncias Teste de Kruskal-Wallis

Testes de Hipóteses mais usuais Uma amostra ou Duas amostras Média Proporções Variância

Teste do qui-quadrado Pode ser usado como teste de ajustamento Ver se duas (ou mais) distribuições são iguais E pode ser usado como teste de independência/associação entre duas variáveis categoriais Verifica se existe independência entre as variáveis a A e B Hipótese P(A e B) = P(A)*P(B)

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Problemas anteriores idênticos * Sexo Crosstab ANTPRO Total Sim Não Count % within ANTPRO % within SEXO Count % within ANTPRO % within SEXO Count % within ANTPRO % within SEXO SEXO Mas culino Feminino Total 14 5 19 73, 7% 26, 3% 100,0% 7,3% 6,8% 7,2% 177 69 246 72, 0% 28, 0% 100,0% 92,7% 93,2% 92,8% 191 74 265 72, 1% 27, 9% 100,0% 100,0% 100,0% 100,0%

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Problemas anteriores idênticos * Sexo Crosstab ANTPRO Total Sim Não Count % within ANTPRO % within SEXO Count % within ANTPRO % within SEXO Count % within ANTPRO % within SEXO SEXO Masculino Feminino Total 14 5 19 73, 7% 26, 3% 100,0% 7,3% 6,8% 7,2% 177 69 246 72, 0% 28, 0% 100,0% 92,7% 93,2% 92,8% 191 74 265 72, 1% 27, 9% 100,0% 100,0% 100,0% 100,0% Chi-Square Tests Pears on C hi-square Continuity Correction a Likelihood Ratio Fisher's Exact Tes t Linear-by-Linear Assoc iation N of Valid Cases Asy mp. Sig. Value df (2-sided),026 b 1,871,000 1 1, 000,027 1,870,026 1,871 265 a. Computed only f or a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided) 1, 000,554 b. 0 cells (,0%) hav e expected count less than 5. The minimum expected count is 5,31.

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Problemas anteriores idênticos * Sexo Pears on C hi-square Continuity Correction a Likelihood Ratio Fisher's Exact Tes t Linear-by-Linear Assoc iation N of Valid Cases Chi-Square Tests Asy mp. Sig. Value df (2-sided),026 b 1,871,000 1 1, 000,027 1,870,026 1,871 265 a. Computed only f or a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided) 1, 000,554 b. 0 cells (,0%) hav e expected count less than 5. The minimum expected count is 5,31. Conclusão: A proporção de problemas idênticos anteriores não diferiu por sexo (p=1,000); Ou Não há evidências de que a distribuição de problemas anteriores idênticos difira por sexo (p=1,000);

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Pouco interesse sexual * Sexo Crosstab POUCO Total Sim Não Count % within POUCO % within SEXO Count % within POUCO % within SEXO Count % within POUCO % within SEXO SEXO Mas culino Feminino Total 62 59 121 51, 2% 48, 8% 100,0% 32,8% 78,7% 45,8% 127 16 143 88, 8% 11, 2% 100,0% 67,2% 21,3% 54,2% 189 75 264 71, 6% 28, 4% 100,0% 100,0% 100,0% 100,0% Pears on C hi-square Continuity Correction a Likelihood Ratio Fisher's Exact Tes t Linear-by-Linear Assoc iation N of Valid Cases Chi-Square Tests Asy mp. Sig. Value df (2-sided) 45,490 b 1,000 43, 662 1,000 47, 203 1,000 45, 318 1,000 264 a. Computed only f or a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided),000,000 b. 0 cells (,0%) hav e expected count less than 5. The minimum expected count is 34, 38.

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Pouco interesse sexual * Sexo Pears on C hi-square Continuity Correction a Likelihood Ratio Fisher's Exact Tes t Linear-by-Linear Assoc iation N of Valid Cases Chi-Square Tests Asy mp. Sig. Value df (2-sided) 45,490 b 1,000 43, 662 1,000 47, 203 1,000 45, 318 1,000 264 a. Computed only f or a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided),000,000 b. 0 cells (,0%) hav e expected count less than 5. The minimum expected count is 34, 38. Conclusão: A proporção de falta de interesse sexual difere nos dois sexo (p<0,001); Ou A falta de interesse sexual está associado ao género dos indivíduos (p<0,001);

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Pouco interesse sexual * Sexo OR = 0.145 (0.077; 0.275) Os homens apresentam uma reduzida probabilidade de se queixarem de falta de interesse Sexual quando comparados com as mulheres. Invertendo os valores: OR = 6.875 (3.64; 12.99) As mulheres apresentaram um probabilidade de se queixarem de falta de interesse sexual aproximadamente 7 vezes maior que a dos homens.

Comparação de médias Teste t e ANOVA Estes testes dizem-se paramétricos Assumem que as distribuições subjacentes aos dados são normais Quantas populações queremos comparar? Duas teste t Mais de duas ANOVA

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Idade dos indivíduos * Sexo Group Statistics idade sexo Mas culino Feminino Std. Error N Mean Std. Dev iation Mean 190 51, 91 13, 749,997 73 35, 15 11, 273 1, 319?

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Idade dos indivíduos * Sexo Independent Samples Test idade Equal v ariances ass umed Equal v ariances not assumed Lev ene's Test for Equality of Varianc es F Sig. t df Sig. (2-tailed) t-test f or Equality of Means Mean Dif f erence 95% Conf idence Interv al of the Std. Error Dif f erence Dif f erence Lower Upper 6, 025,015 9, 279 261,000 16, 755 1, 806 13, 199 20, 310 10, 130 158,145,000 16, 755 1, 654 13, 488 20, 021 Conclusão: (Não existe homogeneidade das variâncias (p=0.015), temos de usar o teste t para amostras independentes assumindo variâncias diferentes) Rejeita-se a hipótese de igualdade das médias (populacionais) de idade nos dois grupos (p<0,001). Ou A idade dos indivíduos do sexo masculino que se queixam de problemas de disfunção sexual ao médico de família difere estatisticamente da idade das mulheres que apresentam o mesmo tipo de queixas.

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Há quanto tempo apresenta estas queixas * Sexo Group Statistics tempo sexo Mas culino Feminino Std. Error N Mean Std. Dev iation Mean 171 9, 41 19, 135 1, 463 61 14, 64 28, 457 3, 644?

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Há quanto tempo apresenta estas queixas * Sexo Group Statistics tempo sexo Masculino Feminino Std. Error N Mean Std. Dev iation Mean 171 9, 41 19, 135 1, 463 61 14, 64 28, 457 3, 644 Independent Samples Test tempo Equal v ariances ass umed Equal v ariances not assumed Lev ene's Test for Equality of Varianc es F Sig. t df Sig. (2-tailed) t-test f or Equality of Means Mean Dif f erence 95% Conf idence Interv al of the Std. Error Dif f erence Dif f erence Lower Upper 5, 224,023-1,598 230,112-5,230 3, 274-11,680 1, 220-1,332 80, 179,187-5,230 3, 926-13,043 2, 584

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Há quanto tempo apresenta estas queixas * Sexo Independent Samples Test tempo Equal v ariances ass umed Equal v ariances not assumed Lev ene's Test for Equality of Varianc es F Sig. t df Sig. (2-tailed) t-test f or Equality of Means Mean Dif f erence 95% Conf idence Interv al of the Std. Error Dif f erence Dif f erence Lower Upper 5, 224,023-1,598 230,112-5,230 3, 274-11,680 1, 220-1,332 80, 179,187-5,230 3, 926-13,043 2, 584 Conclusão: (Não existe homogeneidade das variâncias (p=0.023), temos de usar o teste t para amostras independentes assumindo variâncias diferentes) Não se rejeita a hipótese de igualdade das médias (populacionais) de tempo de queixas de disfunção sexual idade nos dois grupos (p=0.187). Não foram encontradas evidências de que a duração das queixas de disfunção difiram por sexos.

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Será que o número de QDS é influenciado pela idade? Número de queixas (1, 2, 3 ou mais)

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Será que o número de QDS é influenciado pela idade? Número de queixas (1, 2, 3 ou mais)

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Será que o número de QDS é influenciado pela idade? Número de queixas (1, 2, 3 ou mais)

Rejeita-se a hipótese de igualdade das variâncias populacionais dos 3 grupos (p=0,016). Está violado um dos prossupostos da ANOVA não tenho garantias de que o resultado da ANOVA seja correcto

O teste de Shapiro-Wilk é o mais apropriado quando o tamanho da amostra é menor que 50. A idade no grupo com apenas uma queixa não segue uma distribuição normal. Não podemos aplicar a ANOVA!

Rejeita-se a hipótese de igualdade da idade pelo número de queixas (p<0,001). Ou Existem evidências de que uma associação entre idade e número de queixas QDS (p<0,001).

Os resultados obtidos pela ANOVA são confirmados pelo teste não paramétrico de Kruskal-Wallis. Não existe evidencia de relação entre numero de queixas e idade na mulher. Nos homens o resultado é borderline.

Exemplo: Queixas de Disfunção Sexual rede médicos sentinela 1998-1999 Será que o número de QDS é influenciado pela idade? Número de queixas (variável numérica)

Correlação negativa. A idade tende a ser mais baixa quando as queixas aumentam. Ou Quando o número de queixas é menor a idade tende a ser mais elevada.

Quantas variáveis? 1 Análise descritiva Variável numérica Medidas de localização, medidas de disperssão Gráficos» Variável discreta com poucos valores Barras, linhas, sectogramas» Variável contínua Histograma, caixa de bigodes, etc. Variável qualitativa Frequências, moda Gráficos (barras, linhas, sectogramas, etc)

Quantas variáveis? 1 Inferência estatística Variável numérica Teste z Teste t Teste para uma variância» A comparação é feita com um valor para o parâmetro populacional externo Variável qualitativa Teste do Qui-quadrado» Teste que avalia a homogeneidade das observações pelas diferentes categorias Teste para uma proporção» Teste que avalia se a proporção observada está de acordo com uma hipótese populacional

Quantas variáveis? 2 v. categorial vs v. categorial Análise descritiva bivariada Crosstabs Frequências cruzadas Proporções (por linha, por coluna, totais)

Quantas variáveis? 2 v. categorial vs v. categorial Inferência estatística Qui-quadrado Teste de independência (não associação)» Pressupostos: o número esperado em cada célula da tabela é maior que 5 Qui-quadrado com correcção para a continuidade (correcção de Yates) Quando se trata de uma tabela 2x2 Teste exacto de Fisher Quando se trata de uma tabela 2x2, sempre aplicável mesmo quando falha o pressuposto de aplicação do quiquadrado

Quantas variáveis? 2 v. numérica vs v. categorial A v. numérica toma o lugar de v. dependente ou v. de teste Análise descritiva bivariada Medidas de localização e de dispersão por cada nível da v. categorial Histogramas por painel Caixas de bigodes paralelas

Quantas variáveis? 2 v. numérica vs v. Categorial a v. categorial tem 2 níveis Inferência estatística Teste t Comparação das duas média populacionais Existem dois teste t» 1 teste que assume a igualdade das variâncias populacionais» 1 teste que assume a desigualdades das variâncias populacionais Teste F ou teste de Levene Comparação de duas variâncias populacionais Teste de Mann-Whitney Teste não paramétrico» Compara as duas distribuições

Quantas variáveis? 2 v. numérica vs v. Categorial a v. categorial tem mais de 2 níveis Inferência estatística ANOVA Testa a igualdade de todas as médias populacionais Pressupostos:» Todas as amostras são normais» Homocedaticidade: as variâncias de todos os grupos são iguais teste de Levene Testa a igualdade das variâncias» Este teste deve ser sempre feito antes de analisar os resultados da igualdade das médias Teste de Kruskal-Wallis Teste não paramétrico» Compara as distribuições Nota: quando existem diferenças estatísticas usam-se teste de comparações múltiplas para perceber em que níveis ocorrem as diferenças: testes Post-Hoc

Quantas variáveis? 2 v. numérica vs v. numérica Coeficiente de correlação de Pearson O teste associado é um teste t e assume normalidade das variáveis para efectuar o teste Coeficiente de correlação de Spearman Teste não paramétrico Usa as ordens dos valores e não os valores

Quantas variáveis? Mais de 2 variáveis Análise multifactorial Temos uma variável dependente e queremos explicar a sua variação usando as restantes variáveis Análise multivariada Queremos estudar a variação conjunta de mais do que uma variável

Quantas variáveis? Mais de 2 variáveis Análise Multifactorial A variável dependente (explicada) é numérica (assumida normal) Regressão linear múltipla Só são admitidas variáveis numéricas» Para variáveis categoriais é necessário usar variáveis mudas/indicadoras» Exemplo: sexo criar uma v. Com 1- Masculino e 0- feiminino ANOVA Multifactorial / MANCOVA São admitidas variáveis categoriais FACTORES Existem factores fixos todos os possíveis valores presentes Existem factores aleatórios não todos os possiveis valores representados São admitidas variáveis numéricas Covariáveis (MANCOVA)

Quantas variáveis? Mais de 2 variáveis Análise Multifactorial A variável dependente (explicada) é dicotómica Regressão logistica (binária) São admitidas variáveis categoriais FACTORES São admitidas variáveis numéricas Covariáveis (MANCOVA) A variável dependente (explicada) é dicotómica e tem associado um tempo até ao evento Análise de Sobrevivência / Regressão de Cox Muito semelhante à regressão logistica

Quantas variáveis? Mais de 2 variáveis Análise Multifactorial Existem outros métodos menos usuais Modelos linear generalizados Regressão de poisson Logit Probit Modelos lineares aditivos etc

Quantas variáveis? Mais de 2 variáveis Análise multivariada Análise exploratória de dados multivariados Não são metodos de inferência estatística Análise factorial Componentes principais Etc.