Estatística Não Paramétrica



Documentos relacionados
Aula 8. Teste Binomial a uma proporção p

Métodos Quantitativos Aplicados

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira

AULA 11 Experimentos Multinomiais e Tabelas de Contingência

índice Introdução Estatística Descritiva Capítulo 1 Capítulo 2 O que é a Estatística Escalas de medida Escalas Nominais Escalas Ordinais

Avaliação e Desempenho Aula 1 - Simulação

Plano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292

ANOVA. (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior

Motivação Este trabalho apresenta o desenvolvimento do controle da interatividade num sistema para a área de computação gráfica, mais especificamente

Medidas de Localização

Manual do Usuário da Biblioteca 1.0

Aula 1 Estatística e Probabilidade

Relatório das Provas da 2ª. Fase - Vestibular 2016

Testes Não Paramétricos

Variáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência

PLANO DE ENSINO CONTEÚDO PROGRAMÁTICO. Unidade 1: MEDIDAS E GRANDEZAS Introdução Padrões usados para avaliar grandezas físicas

UNIVERSIDADE EDUARDO MONDLANE FACULDADE DE ENGENHARIAS DEPARTAMENTO DE CADEIRAS GERAIS

Universidade dos Açores Curso de Especialização Tecnológica Gestão da Qualidade Matemática

ANÁLISE EXPLORATÓRIA DE DADOS

O SOFTWARE LIVRE COMO FERRAMENTA DE ENSINO

Gerenciamento de Integração. Prof. Anderson Valadares

Aula 6 Medidas de Tendência Central

ETEC VASCO ANTONIO VENCHIARUTTI JUNDIAÍ CLASSE DESCENTRALIZADA DE JUNDIAÍ - EE PROFA. MARIA DE LOURDES FRANÇA SILVEIRA

Capítulo 4 Inferência Estatística

Universidade Federal do Amazonas Instituto de Ciências Exatas Departamento de Estatística

APLICAÇÃO DA TEORIA DAS FILAS NO SISTEMA DE FILAS DE UMA EMPRESA DO RAMO DE PANIFICAÇÃO DE MÉDIO PORTE.

Escola Básica e Secundária de Velas Projeto Curricular de Escola Ensino Secundário / Projeto Curricular. do Ensino Secundário

PESQUISA OPERACIONAL: NA TOMADA DE DECISÕES ADMINISTRATIVA

Estatística e Probabilidade

DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS)

MAE116 - Noções de Estatística

Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana

Medidas e Escalas: Escalas não Comparativas

Conteúdo. 1 Introdução. Histograma do Quinto Sorteio da Nota Fiscal Paraná 065/16. Quinto Sorteio Eletrônico da Nota Fiscal Paraná

Proporcionar a modelagem de sistemas utilizando todos os conceitos da orientação a objeto;

Conteúdo. 1 Introdução. Histograma do 1o Sorteio da Nota Fiscal Paraná 152/15. 1º Sorteio Eletrônico da Nota Fiscal Paraná

Introdução. Qualidade de Produto. Introdução. Introdução ISO/IEC Normas

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

OpenPDV: Sistema aberto para gerenciamento de restaurantes

GESTÃO DA MANUTENÇÃO

Estatística Multivariada. Visão Panorâmica. Aplicações: Associação. Classificação. Comparação. Associação. Correlação Bivariada.

Aula 05 Instalação e Uso do Arcabouço. Alessandro Garcia Alexander Chávez LES/DI/PUC-Rio Março 2016

ORIENTAÇÃO PARA ELABORAÇÃO DO RELATÓRIO DE ESTÁGIO

7.1 Estimativa de custos

BIOESTATÍSTICA. Parte 1 - Estatística descritiva e análise exploratória dos dados

AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA

Produção de Vídeos Didáticos: Tábua de Galton

GRADE CURRICULAR LICENCIATURA EM MATEMÁTICA I MATÉRIAS OBRIGATÓRIAS

Qualidade de Produto. Maria Cláudia F. P. Emer

Plano da Apresentação. Correlação e Regressão linear simples. Correlação linear. Associação entre hábitos leitura e escolaridade.

Correlação e Regressão linear simples

LINHAS MESTRAS; FASES; DISCIPLINAS; PRINCÍPIOS E MELHORES PRÁTICAS.

Manual do KBruch. Sebastian Stein Anne-Marie Mahfouf Tradução: Marcus Gama

ANÁLISE CLIMATOLÓGICA COMPARATIVA DAS ESTAÇÕES METEOROLÓGICAS DOS AEROPORTOS DE GUARULHOS E CONGONHAS. Edson Cabral

A Significância Estatística do Proger na Redução da Taxa de Desemprego por Haroldo Feitosa Tajra

Erros e Incertezas. Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011.

Objetivo: informar o procedimento para instalação de pacote de software para adicionar o idioma português nas opções de línguas do TIA Portal V12.

Introdução à Ciência da Informação

CIRCULAR TÉCNICA N o 171 NOVEMBRO 1989 TABELAS PARA CLASSIFICAÇÃO DO COEFICIENTE DE VARIAÇÃO

Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança

O SOFTWARE R EM AULAS DE MATEMÁTICA

Soluções de gestão de clientes e de impressão móvel

3 Modelos de Simulação

PROBABILIDADE E ESTATÍSTICA I 1º SEMESTRE DE 2015 Docente: Anderson H.R. Ferreira 2º LISTA DE EXERCÍCIOS

INSTITUTO POLITÉCNICO DE COIMBRA EDITAL

Introdução. Ou seja, de certo modo esperamos que haja uma certa

Aula 12 Teste de hipótese sobre proporções amostras grandes

Testes Qui-Quadrado - Teste de Aderência

Projeto Integrador Gestão em TI II Gestão em Pessoas. Organograma DIRETOR DEPARTAMENTO DE T.I ANALISTA TÉCNICO

COLOR LASERJET ENTERPRISE CM4540 SÉRIE MFP. Guia de instalação do software

Desenvolvimento Humano e Social

INE 5323 Banco de Dados I

Público Alvo: Critérios de admissão para o curso:

Inspeção de Qualidade

LÂMINA DE INFORMAÇÕES ESSENCIAIS SOBRE O BNP PARIBAS DIVIDENDOS FUNDO DE INVESTIMENTO EM COTAS DE FUNDO DE INVESTIMENTO AÇÕES CNPJ/MF:

ESPECIFICAÇÕES TÉCNICAS SISTEMA DE DETECÇÃO VEICULAR OVERHEAD

Curso de Análise Estatística Comparação entre variáveis contínuas: correlação e regressão Linear

PROGRAMA da Certificação Internacional em Integração Sensorial

Título : B1 INTRODUÇÃO. Conteúdo : INTRODUÇÃO

22 de junho Auditório

RELATÓRIO DE TESTE DE EPI / EPC

INSTITUTO POLITÉCNICO DE TOMAR Centro de Sondagens e Estudos Estatísticos

2 MATERIAL E MÉTODOS

Ferramentas para a Qualidade

Engenharia de Software. Ciclos de Vida do Software. 1. Sistemas

Lojamundi Tecnologia Sem Limites br

Welcome the programmation Linux with shell script!!! Seja bem vindo a programação Linux com shell script!!!

1 Natuur Online Cadastre-se Cadastre-se Tipo de Usuário Consultor

Distribuições Conjuntas (Tabelas de Contingência)

EA976 Engenharia de Software. AULA 2 Ciclo de Vida de um Software

Aula 4 Gráficos e Distribuição de Frequências

Probabilidade e Estatística, 2009/2

Metodologia de Investigação Educacional I

Programação Orientada a Objetos

LIBREOFFICE: APRESENTAÇÃO COM O IMPRESS. Professor: Francisco Dantas Nobre Neto

IMPLANTAÇÃO DA GESTÃO AMBIENTAL

Transcrição:

Estatística Não Paramétrica com uso de softwares Angelo Cabral UFPR 16 de novembro de 2015 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 1 / 53

Sumário 1 Softwares Utilizados 2 Exemplos R BioEstat SPSS Statistica Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 2 / 53

Softwares Utilizados Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 3 / 53

Softwares Utilizados Softwares Utilizados R versão 3.0.1 BioEstat versão 5.3 SPSS versão 20 Statistica versão 7 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 4 / 53

Softwares Utilizados R R Desenvolvido pela R Foundation desde 1993; Versão atual: 3.2.2 (agosto de 2015); Licença: gratuito (open source); Linguagem de programação; Versões para Windows, Linux e Mac OS; Disponível em www.r-project.org Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 5 / 53

Softwares Utilizados R Vantagens Possibilidade de adicionar e criar novas funções; Maior controle sobre as funções; Operações aritméticas; Integração com o L A T E X; Ótima documentação (em inglês). Desvantagens Interface simples; Dificuldade de uso; Recomendado conhecimentos básicos de programação. Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 6 / 53

Softwares Utilizados BioEstat BioEstat Desenvolvido pelo Instituto MAMIRAUA; Versão atual: 5.3 (2011); Licença: gratuito; Versão apenas para Windows; Enfoque nas áreas biológicas; Pouco conhecido; Disponível em www.mamiraua.org.br Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 7 / 53

Softwares Utilizados BioEstat Vantagens Em português; Facilidade de uso; Voltado para estudantes e professores; Grande quantidade de testes implementados; Sugestão de testes. Desvantagens Modifica o sistema decimal do Windows; Corrigir através do painel de controle. Pequena documentação. Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 8 / 53

Softwares Utilizados SPSS SPSS Desenvolvido pela IBM desde 1968; Versão atual: 23 (março de 2015); Licença: comercial Versão base: 1.140 dólares (R$ 4.384 a ); Versão premium: 7.590 dólares (R$ 29.188). Versões Windows, Linux (Red Hat) e Mac OS; Voltado para ciências sociais; Versão de avaliação disponível em www.ibm.com/software/analytics/spss a Dólar cotado a R$ 3,8456 em 13/11/2015 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 9 / 53

Softwares Utilizados SPSS Vantagens Facilidade na entrada e importação dos dados; Grande quantidade de testes implementados; Possibilidade de realizar vários testes simultaneamente. Desvantagens Entrada somente de dados brutos; Menus pouco intuitivos; Pouco controle sobre as funções. Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 10 / 53

Softwares Utilizados Statistica Statistica Desenvolvido pela StatSoft desde 1984; Adquirida pela Dell em março de 2014. Versão atual: 13 (setembro de 2015); Licença: comercial; Versão base: 1.193 dólares (R$ 4.588); Versão advanced: 2.093 dólares (R$ 8.049). Versão para Windows; Versão de avaliação disponível em http://software.dell.com/products/statistica Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 11 / 53

Softwares Utilizados Statistica Vantagens Facilidade na entrada e importação dos dados; Facilidade na análise de tabelas de contingência 2x2. Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 12 / 53

Softwares Utilizados R, BioEstat, SPSS e Statistica Desvantagem em todos os softwares utilizados Para alguns testes é fornececido apenas o p-valor aproximado. Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 13 / 53

Softwares Utilizados Outros Softwares Foram testados também os softwares Statgraphics (versão Centurion XVI) e Minitab (versão 16), mas por possuírem poucos testes não paramétricos, não entraram nesta análise. Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 14 / 53

Exemplos Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 15 / 53

R Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 16 / 53

Interface do R Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 17 / 53

Exemplo no R Qui-quadrado Exemplo 2 página 16 A tabela dada a seguir apresenta o número observado de falhas mecânicas, por hora, em uma linha de montagem a partir de um experimento com duração de 40 horas. Tabela: Distribuição do número de falhas mecânicas por hora em uma linha de montagem. Falhas 0 1 2 3 4 5 6 7 + de 7 Freq. Observada 0 6 8 11 7 4 3 1 0 Freq. Esperada 1,6 5,2 8,3 8,9 7,1 4,6 2,4 1,1 0,7 Um engenheiro afirma que o processo descrito acima segue uma distribuição de Poisson com média igual a 3,2. Como a tabela dada apresenta mais de 20% das frequências com valores inferiores a 5 devemos unir as categorias. Assim: Tabela: Junção das categorias em que as frequências são inferiores ao valor 5. Falhas 0 e 1 2 3 4 5 ou mais Freq. Observada 6 8 11 7 8 Freq. Esperada 6,8 8,3 8,9 7,1 8,8 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 18 / 53

Exemplo no R Qui-quadrado Exemplo 2 página 16 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 19 / 53

Exemplo no R McNemar Exemplo 2 página 27 Numa campanha política, após uma série de fatos divulgados com o objetivo de denegrir a imagem do candidato B em favor do candidato A, investigou-se as mudanças ocorridas com relação à preferência do eleitorado. Os resultados foram os seguintes. Depois Antes A B A 83 47 130 B 18 52 70 101 99 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 20 / 53

Exemplo no R McNemar Exemplo 2 página 27 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 21 / 53

BioEstat Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 22 / 53

Interface do BioEstat Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 23 / 53

Exemplo no BioEstat Qui-quadrado Exemplo 1 página 16 Deseja-se testar se a posição de largada de um cavalo (por dentro ou por fora) influencia no resultado de uma corrida de cavalos. Tabela: Distribuição do número de vitórias dos cavalos segundo a posição de largada. Posição 1 2 3 4 5 6 7 8 Número de 29 19 18 25 17 10 15 11 Vitórias 18* 18* 18* 18* 18* 18* 18* 18* * Resultado esperado pela hipótese nula Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 24 / 53

Exemplo no BioEstat Qui-quadrado Exemplo 1 página 16 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 25 / 53

Exemplo no BioEstat Qui-quadrado Exemplo 1 página 16 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 26 / 53

Exemplo no BioEstat McNemar Exemplo 1 página 26 Dois supermercados A e B disputam a preferência dos consumidores de uma cidade. O supermercado A realiza então uma campanha com distribuição de prêmios para aumentar a sua clientela. 100 consumidores foram acompanhados antes e depois da campanha, onde se perguntou a cada um deles sobre a sua preferência. Os resultados seguem abaixo: Depois Antes A B A 37 3 40 B 13 47 60 50 50 Teste agora a eficiência da campanha. Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 27 / 53

Exemplo no BioEstat McNemar Exemplo 1 página 26 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 28 / 53

Exemplo no BioEstat Sinais Exemplo 1 página 29 Para se testar a eficiência de um novo herbicida, foram analisadas 10 áreas. Em cada área, observou-se se a quantidade de ervas daninhas aumentou (+) ou diminuiu (-). Os dados foram os seguintes: Tabela: Resultado da aplicação do herbicida nas 10 áreas. Área 1 2 3 4 5 6 7 8 9 10 Sinal + + + + - + + + + + Verifique se o herbicida foi eficiente. Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 29 / 53

Exemplo no BioEstat Sinais Exemplo 1 página 29 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 30 / 53

Exemplo no BioEstat Sinais Exemplo 1 página 29 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 31 / 53

Exemplo no BioEstat Escolha do teste Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 32 / 53

SPSS Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 33 / 53

Interface do SPSS Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 34 / 53

Exemplo no SPSS Binomial Exemplo 1 página 13 Uma empresa lançou recentemente no mercado uma dieta de emagrecimento. E pretende-se averiguar se a porcentagem de usuários acima de 60 anos é maior que 30%. Para tal houve escolha aleatória de 16 indivíduos entre os adeptos da nova dieta, e apurou-se que apenas 5 tinham idade superior a 60 anos. Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 35 / 53

Exemplo no SPSS Binomial Exemplo 1 página 13 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 36 / 53

Exemplo no SPSS Binomial Exemplo 1 página 13 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 37 / 53

Exemplo no SPSS Binomial Exemplo 1 página 13 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 38 / 53

Exemplo no SPSS Binomial Exemplo 1 página 13 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 39 / 53

Exemplo no SPSS Wilcoxon Exemplo 3 página 39 Considere o quadro de notas abaixo referente a estudo para comparar a eficiência de um novo método de aprendizagem. Aluno Nota 1 Nota 2 d i Postos 1 5,1 5,8 0,7 10,5 2 4,2 4,7 0,5 7,5 3 3,3 6,1 2,8 18,5 4 6 7,4 1,4 14 5 7,1 6,5-0,6 9..... 26 1,4 6,5 5,1 24 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 40 / 53

Exemplo no SPSS Wilcoxon Exemplo 3 página 39 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 41 / 53

Exemplo no SPSS Wilcoxon Exemplo 3 página 39 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 42 / 53

Exemplo no SPSS Wilcoxon Exemplo 3 página 39 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 43 / 53

Statistica Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 44 / 53

Interface do Statistica Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 45 / 53

Exemplo no Statistica McNemar Exemplo 2 página 27 Numa campanha política, após uma série de fatos divulgados com o objetivo de denegrir a imagem do candidato B em favor do candidato A, investigou-se as mudanças ocorridas com relação à preferência do eleitorado. Os resultados foram os seguintes. Depois Antes A B A 83 47 130 B 18 52 70 101 99 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 46 / 53

Exemplo no Statistica McNemar Exemplo 2 página 27 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 47 / 53

Exemplo no Statistica McNemar Exemplo 2 página 27 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 48 / 53

Exemplo no SPSS Wilcoxon Exemplo 3 página 39 Considere o quadro de notas abaixo referente a estudo para comparar a eficiência de um novo método de aprendizagem. Aluno Nota 1 Nota 2 d i Postos 1 5,1 5,8 0,7 10,5 2 4,2 4,7 0,5 7,5 3 3,3 6,1 2,8 18,5 4 6 7,4 1,4 14 5 7,1 6,5-0,6 9..... 26 1,4 6,5 5,1 24 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 49 / 53

Exemplo no Statistica Wilcoxon Exemplo 3 página 39 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 50 / 53

Exemplo no Statistica Wilcoxon Exemplo 3 página 39 Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 51 / 53

Testes Disponíveis Teste R Base SPSS Statistica BioEstat Binomial Sim Sim Não Sim Qui-quadrado (1 amostra) Sim Sim Sim Sim KS (1 amostra) Sim Sim Sim Não Lilliefors Não Sim Sim Sim Aleatorização das Iterações Não Sim Não Sim McNemar Sim Sim Sim Sim Sinais Não Sim Sim Sim Wilcoxon Sim Sim Sim Sim Aleatorização Não Não Não Não Fisher Sim Sim Sim Sim Qui-quadrado (2 amostras) Sim Sim Sim Sim Mediana (2 amostras) Não Sim Sim Sim Mann-Whitney Sim Sim Sim Sim KS (2 amostras) Sim Sim Sim Sim Cochran Não Sim Sim Sim Friedman Sim Sim Sim Sim Qui-quadrado (k amostras) Sim Sim Sim Sim Mediana (k amostras) Não Sim Sim Não Kruskal-Wallis Sim Sim Sim Sim Coeficiente de Contingência Não Sim Sim Sim Correlação de Spearman Sim Sim Sim Sim Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 52 / 53

MUITO OBRIGADO! Angelo Cabral (UFPR) Estatística Não Paramétrica 16 de novembro de 2015 53 / 53