Introdução ao Projeto e Análise de Experimentos

Documentos relacionados
Introdução ao Projeto e Análise de Experimentos

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

Conceitos centrais em análise de dados

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

Análise da Variância. Prof. Dr. Alberto Franke (48)

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Métodos de pesquisa quantitativa e qualitativa para Ciência da Computação

Apontamentos de Introdução às Probabilidades e à Estatística

Probabilidade e Estatística (Aula Prática - 23/05/16 e 24/05/16)

1 Introdução aos Métodos Estatísticos para Geografia 1

Bioestatística. Mestrado Saúde Materno Infantil 2005 Prof. José Eulálio Cabral Filho

Resultados possíveis do nosso estudo

Método Cientíco. Prof. Moacir Ponti 2017/1. Instituto de Ciências Matemáticas e de Computação USP

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2)

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2)

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

Aula 15: Testes para Duas Amostras

Bioestatística Básica RCA 5804 COMPARANDO GRUPOS INDEPENDENTES. Prof. Dr. Alfredo J Rodrigues

Estatística aplicada a ensaios clínicos

Experimentos. Introdução. Vantagens. Exemplo. Cleidson de Souza. LABES - DI - UFPA

POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS

Vamos conversar sobre BRUNI

ENGENHARIA DA QUALIDADE A ENG AULA 8 PROJETOS DE EXPERIMENTOS - ANOVA

Introdução. Amostragem, amostra aleatória simples, tabela de números aleatórios, erros

Estatística Básica. 13 de maio de 2009

Capítulo 11 Análise da Variância. Statistics for Managers Using Microsoft Excel, 5e 2008 Prentice-Hall, Inc. Chap 11-1

Apostila de estatística básica R Commander Organizador: Daniel Magalhães Lima. Autores:

Projeto de Experimentos

Análise de dados em Geociências

ANÁLISE ESTATÍSTICA DA RELAÇÃO ENTRE A ATITUDE E O DESEMPENHO DOS ALUNOS

Filho, não é um bicho: chama-se Estatística!

Apostila de estatística básica Minitab Organizador: Daniel Magalhães Lima. Autores:

Estatística Descritiva

CONHECIMENTOS ESPECÍFICOS

Estatística stica na Pesquisa Clínica

CONCEITOS INICIAIS. ciência que tem objetivo de orientar a coleta, o resumo, a apresentação, a análise e a interpretação de dados.

ESTATÍSTICA. Tabelas e Gráficos. Elisabeti Kira - IME USP. Beti Kira (IME-USP) Estatística 18.abril.

Métodos Quantitativos Aplicados

CORRELAÇÃO. Flávia F. Feitosa

Prof. Dr. Alfredo J Rodrigues. Departamento de Cirurgia e Anatomia Faculdade de Medicina de Ribeirão Preto Universidade de São Paulo

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

Teste Anova. Prof. David Prata Novembro de 2016

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Principais Conceitos em Estatística

1) Como vou comparar 3 grupos realizo uma Anova one way:

24/09/17. O que é uma hipótese? Testes de hipótese. Três tipos básicos de perguntas. E qual é a sua hipótese? Três tipos básicos de perguntas

Palestra - Matemática Aplicada

Tratamento estatístico de observações

CONCEITOS INICIAIS. ESTATÍSTICA: ciência que tem objetivo de orientar a coleta, o resumo, a apresentação, a análise e a interpretação de dados.

Por que testes não-paramétricos?

DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

Testes de Hipóteses. : Existe efeito

VERIFICAÇÃO DOS RECURSOS NECESSÁRIOS. Capítulo 1 VARIÁVEIS E AMOSTRAS 1

6EMA Lucas Santana da Cunha 17 e 19 de abril de Universidade Estadual de Londrina

Métodos de Investigação II

TESTE DE COMPARAÇÃO MÚLTIPLA

Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas

AULA 06 Correlação. Ernesto F. L. Amaral. 04 de outubro de 2013

Tratamento estatístico de observações

6EMA Lucas Santana da Cunha 19 de abril de Universidade Estadual de Londrina

Medidas de Dispersão ou variabilidade

ESTATÍSTICA: UMA RÁPIDA ABORDAGEM Prof. David B.

Causalidade e inferência em epidemiologia. Fábio Raphael Pascoti Bruhn Disciplina: Epidemiologia e Ecologia

Testes de Aderência, Homogeneidade e Independência

Curso de Metodologia da Pesquisa em Ciências da Vida. Tópicos em bioestatística fundamentais para o pesquisador em Ciências da Vida

Anexo II Resolução nº 133/2003-CEPE

ESTATÍSTICA ECONÔMICA A 6EMA

Análise da Regressão. Prof. Dr. Alberto Franke (48)

Estatística. Guia de Estudos P2

Introdução à Bioestatística

ESTATÍSTICA ECONÔMICA A 6EMA

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Tutorial para o desenvolvimento das Oficinas

SCC0173 Mineração de Dados Biológicos

José Aparecido da Silva Gama¹. ¹Professor do Instituto Federal de Educação, Ciência e Tecnologia de Alagoas.

Estatística. Correlação e Regressão

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

16/6/2014. Teste Qui-quadrado de independência

Análise de Variância (ANOVA)

Aula 9 Planejamento e Análise de Experimentos

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

Delineamento e Análise Experimental Aula 4

Regression and Clinical prediction models

Marília Antunes. Dept. Estatística e Investigação Operacional Centro de Estatística e Aplicações da Universidade de Lisboa

Comparando equações de regressão em dados de saúde

Introdução 5 PREFÁCIO 15

Conceito de Estatística

Testes de Hipóteses Não Paramétricos

Metodologias causais para estudos observacionais

Introdução. Tópicos Especiais em E.S. Experimentos. Objetivos. Exemplo. Cleidson de Souza. LABES - DI - UFPA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Anova para medidas repetidas

Verificando as pressuposições do modelo estatístico

Transcrição:

Introdução ao Projeto e Análise de Experimentos Prof. Moacir Ponti www.icmc.usp.br/~moacir Instituto de Ciências Matemáticas e de Computação USP 2017/1

Sumário Amostragem Estratégias de amostragem Experimentos Análise de dados Teste de Hipótese

Amostragem e Variáveis Censo vs Amostragem É muito raro ser necessário realizar censo Amostragem sempre implica em aceitar um erro, mas pode ser representativa Variáveis Numéricas: discretas/contínuas Categóricas: ordinais/não-ordinais

Amostragem e Variáveis Exemplo: vericar sal na panela Análise exploratória: amostragem (porque não censo?) Concluir se mais sal é necessário: inferência Amostra precisa ser representativa: aleatoriedade.

Viés de amostragem Conveniência Amostra facilmente acessível pelo pesquisador Abstenção Apenas uma fração (não aleatória) da população responde Resposta voluntária Participantes com opinião forte tem mais chance de responder (dentre os aleatoriamente selecionados)

Estratégias de amostragem Agradedimentos à http://xkcd.com

Viés de amostragem e i.i.d. Nota: No caso à direita, não podemos considerar que a amostra é independente e identicamente distribuída (i.i.d.), comumente assumido por muitos métodos.

Estratégias de amostragem Amostragem aleatória simples (Simple random sampling)

Estratégias de amostragem Amostragem estraticada

Estratégias de amostragem Amostragem por agrupamento OBS: também pode ser feita amostragem aleatória simples dentro de cada cluster.

Sumário Amostragem Estratégias de amostragem Experimentos Análise de dados Teste de Hipótese

Experimentos Visam estabelecer relações causais, correlações ou comparações. 1. Controle: comparar intervenção com um grupo controle; 2. Aleatorização: distribuir sujeitos/exemplos de forma aleatória; 3. Replicação: coletar amostra suciente, ou replicar estudo; 4. Bloqueio: bloquear por variáveis que possam afetar resultado. Terminologia (pouco comum em computação): placebo, efeito placebo, estudo cego e duplo-cego.

Experimentos: amostragem e atribuição Exemplos: 1. Método de segmentação com aplicação médica; 2. Projeto de uma nova tela de tinta eletrônica para facilitar a leitura; 3. Método para melhoria da segmentação de sentenças em fala.

Experimentos: amostragem e atribuição (ideal) Amostragem aleatória Amostragem não aleatória (mais comum) Atribuição aleatória Causal e generalizável Causal, não generalizável Sem atribuição aleatória Não causal, generalizável Não causal, não generalizável (observacional) Generalização Não generalização Causalidade Associação (indadequado) Agradedimentos à Mine Çetinkaya-Rundel

Causalidade vs Correlação Agradedimentos à http://xkcd.com

Sumário Amostragem Estratégias de amostragem Experimentos Análise de dados Teste de Hipótese

Medidas e transformações Medidas de centro e dispersão Comum: média e desvio padrão Robustas: mediana e IQR Transformação Logaritmo, Raiz Quadrada. Normalização. Exemplos: library(mass) data(cars) data(cats) data(pressure)

Medidas e transformações Exemplos: cars_o <- data.frame(speed=c(19,19,20,20,20), dist=c(190, 206, 210, 220, 238)) cars2 <- rbind(cars, cars_o) # estatistica mean(cars2$dist) sd(cars2$dist) # estatistica robusta median(cars2$dist) IQR(cars2$dist) plot(cars2) # dados originais plot(log(cars2)) # transformacao log plot(sqrt(cars2)) # transformacao sqrt plot(pressure) plot(log(pressure)) # dados originais # transformacao log

Análise de resultados Grácos Scatterplots Boxplots Exemplos: boxplot(cats$bwt ~ cats$sex) cats_o <- data.frame(sex=c('m','m','f'), Bwt=c(1.1,1.5, cats2 <- rbind(cats, cats_o) boxplot(cats2$bwt ~ cats2$sex)

Regressão linear Ajusta uma reta em duas variáveis, uma dependente e uma ou mais independentes Exemplos: model1 <- lm(cars$dist ~ cars$speed) summary(model1) plot(cars) abline(model1) model2 <- lm(cars2$dist ~ cars2$speed) summary(model2) plot(cars2) abline(model2)

Correlação e Regressão Linear Agradedimentos à http://xkcd.com

Correlação e Regressão Linear OBS: para r = 0.25, a correlação quadrada é R 2 = 0.06 McNally et al (2012) http://www.i-jmr.org/2012/1/e1/

Sumário Amostragem Estratégias de amostragem Experimentos Análise de dados Teste de Hipótese

Teste de hipótese 1. Especica hipótese nula e hipótese alternativa 2. Assume que a hipótese nula é verdadeira e calcula a estatística de teste 3. Calcula o p-valor: se a hipótese nula é verdadeira, qual a probabilidade de observarmos tão extremos quanto aquele que dispomos? se o nível for inferior a um limiar α que dene a probabilidade de cometer erro tipo I, rejeitar a hipótese nula; do contrário, não rejeitar hipótese nula.

Teste de hipótese Testes comumente utilizados: Teste t-student (ou Teste t): comum para dados com distribuição Normal, Wilcoxon: não paramétrico, compara rankings entre dois conjuntos de dados, ANOVA: analisa multiplos conjuntos pela estatística F. Kruskal-Wallis: não -paramétrico

Teste de Hipótese #carregar DietData DietData <- read.table(file.choose(), header=t, sep=",") attach(dietdata) names(dietdata) levels(dietdata) boxplot(weightloss~diet) # Ho: media de perda de peso e a mesma para todas as dietas ANOVA1 <- aov(weightloss~diet) # analysis of variance aov summary(anova1) ANOVA1$coefficients TukeyHSD(ANOVA1) # Tukey post-hoc test plot(tukeyhsd(anova1)) # visual kruskal.test(weightloss~diet)

Teste de hipótese Statisticians issue warning over misuse of P values Misuse of the P value a common test for judging the strength of scientic evidence is contributing to the number of research ndings that cannot be reproduced... http://www.nature.com/news/ statisticians-issue-warning-over-misuse-of-p-values-1.19503