Planejamento e pesquisa Introdução Lane Alencar Lane Alencar - Planejamento e Pesquisa 1-2
Pesquisa Experimental: o pesquisador pode interferir nos valores de variáveis explicativas, por exemplo, indicando tratamentos às unidades amostrais. Exemplos. Observacional: sem interferência do pesquisador.
Processo de produção Fatores controlados, x Entrada Processo Saída - Resposta Fatores não controlados, z Vários estudos podem ser esquematizados de modo semelhante.
Objetivos Quais variáveis influenciam y? Como influenciam? Quanto influenciam? Como determinar valores para x de modo a atingir um determinado valor para y? Determinar valores de x para que os efeitos de z sejam minimizados? Reduzir a variabilidade de y
Objetivos Entender como as variáveis x e z influenciam a resposta y. (experimental e observacional) Em estudos experimentais industriais: Melhorar o processo de produção Reduzir variabilidade e atingir o valor nominal de um produto Reduzir tempo de produção e custos
Objetivos Exemplo: Pesquisa de mercado
Conceitos Unidade experimental: menor unidade a qual será medida a variável resposta Fator: Variável explicativa, no caso, qualitativa Nível: cada possível categoria do fator Tratamento: cada combinação dos níveis dos fatores de interesse
Estudos experimentais A partir do objetivo do estudo, definir em estudos experimentais: Fatores e tratamentos Unidades experimentais incluídas Regras para atribuir os tratamentos às unidades experimentais Variáveis resposta
Métodos Mudar somente os valores de uma variável em cada experimento mantendo os valores das outras constantes, ceteris paribus > UM FATOR Desvantagem > Não investigar a interação Mudar os valores de mais que um fator, por exemplo em experimentos fatoriais (2 2 )
Fatorial Cruzado Todas as possíveis combinações dos níveis dos fatores estudados. Experimento: desempenho esportivo Tipo de equipamento: bola, Alimentação Temperatura Tipo de bebida ingerida Clima Etc, etc, etc
Fatorial Hierárquico Os níveis de um ou mais fatores são únicos para um nível de outro fator. Ex: Produção de Operadores em 3 fábricas 3 operadores são selecionados em cada fábrica e suas produções são medidas em 5 lotes do produto. Operadores Fábrica 1 2 3 4 5 6 7 8 9 1 X X X 2 X X X 3 X X X
Planejamento estatístico de experimentos Planejar um experimento para coletar dados apropriados para uma análise estatística que consiga conclusões válidas para atingir os objetivos propostos. Princípios: Aleatorização (ou melhor não interferência dos realizadores da pesquisa) Replicação Blocos (ordem dos tratamentos?)
Aleatorização ou não interferência Experimentos Cegos
Réplicas Réplicas independentes Var( y) = σ n 2 Já é motivo suficiente para coletar dados de diversar unidades amostrais. E medidas repetidas?
Blocos A utilização de blocos é utilizada para melhorar a comparação das médias ou distribuições das variáveis respostas com relação aos fatores de interesse. Separa a variabilidade devido a fatores de perturbação. Por exemplo, variabilidade individual. Um bloco é um conjunto de unidades que apresenta condições experimentais idênticas. Maior homogeneidade.
Blocos Exemplo: Vitamina C (1976) Grupo controle (n=434) e grupo experimental (n=434) O grupo experimental recebia dose de 1 g diariamente e o grupo placebo recebia um tablete semelhante sem vitamina (efeito placebo). Variável resposta: Número de resfriados em um certo período de tempo.
Blocos Outros fatores influenciam a resposta. Consideremos que a faixa etária possa ser importante e temos 2 faixas. Esse fator que afeta a resposta mas não é o principal interesse da pesquisa. Para remover essa fonte de variação do erro experimental podemos fazer análises separadas para as faixas etárias ou considerar cada faixa como um bloco.
Blocos Para cada bloco serão alocados os dois tratamentos. O efeito do tratamento é estimado de modo mais eficiente em cada bloco e o efeito geral é uma combinação dos efeitos em cada bloco.
Experimentos Fatoriais completos Blocos completos aleatorizados Hierárquicos Medidas repetidas Blocos incompletos Fatoriais fracionários Superfície de resposta
Fatoriais Completos
Fatoriais Incompletos
Blocos completos Qual o efeito da temperatura no volume dos pães produzidos com uma massa pronta? Foram consideradas as temperaturas: baixa, média, alta e muito alta. Dois blocos (fábricas), pois se espera que as fábricas apresentem homogeneidade quanto ao volume da massa de pão. Pgs 644 e 661 de Neter et al (2004). Digamos que serão medidos os volumes de 5 pacotes de cada combinação de bloco e cada nível de temperatura.
Blocos completos Volume 1800 1600 1400 1200 1000 800 600 400 200 0 0 1 2 3 4 5 Tem peratura (níveis)
Blocos completos Volume 1800 1600 1400 1200 1000 800 600 400 200 0 0 1 2 3 4 5 Tem peratura (níveis)
Hierárquico Produção em 3 Fábricas. Serão selecionados 3 operadores de cada fábrica. Os operadores são hierárquicos às fábricas. Há um fator de interesse que é a presença de controle estatístico de qualidade (CEQ). Esse fator será cruzado com o efeito de fábrica e operador.
Hierárquico Experimento cruzado e hierárquico Operador CEQ Fábrica 1 2 3 4 5 6 7 8 9 1 x x x CEQ 2 x x x 3 x x x 1 x x x sem CEQ 2 x x x 4 x x x
Medidas Repetidas Avaliar as notas, em escala de 1 a 10, de um cereal com 3 diferentes níveis de adoçante: baixo, médio ou alto. Experimento completamente aleatorizado (melhor que controlar?), Medida repetida. No último experimento, inclui o fator grupo, pois cada grupo receberá diferente informação. Grupo 1: Testar novo cereal Grupo 2: Novo cereal orgânico e saudável.
Medidas Repetidas Completamente Aleatorizado Medidas repetidas Split-plot Consumidor Fórmula Fórmulas Grupo Fórmulas 1 F2 F2 F1 F3 1 F2 F1 F3 2 F1 F1 F2 F3 1 F1 F2 F3 3 F1 F1 F2 F3 1 F1 F2 F3 4 F2 F2 F1 F3 1 F2 F1 F3 5 F3 F3 F2 F1 1 F3 F2 F1 6 F2 F3 F1 F2 1 F3 F1 F2 7 F3 F3 F2 F1 2 F3 F2 F1 8 F3 F3 F2 F1 2 F3 F2 F1 9 F1 F1 F3 F2 2 F1 F3 F2 10 F3 F3 F1 F2 2 F3 F1 F2 11 F2 F2 F3 F1 2 F2 F3 F1 12 F1 F1 F3 F2 2 F1 F3 F2
Medidas repetidas Os níveis de adoçantes são aplicados a cada pessoa. Para comparar os adoçantes, as medidas individuais são as unidades amostrais. Para comparar os grupos, os consumidores são as unidades amostrais. Esse último experimento é um tipo de split-plot (visto mais adiante). Cada grupo seria um whole plot e sua subdivisão um split-plot.
Blocos incompletos Podemos ter blocos menores que o número de tratamentos. Fórmula Consumidor 1 2 3 4 5 1 x x x 2 x x x 3 x x x 4 x x x 5 x x x 6 x x x 7 x x x 8 x x x 9 x x x 10 x x x
Fatoriais fracionários Suponha que temos 6 fatores com 2 níveis cada. Logo, temos 2 6 =64 tratamentos, o que pode ser um número inviável de tratamentos. Podemos considerar somente uma fração (ex metade) dos tratamentos, de modo que pouca informação sobre os efeitos principais e de interação de baixa ordem sejam perdidas.
Superfície de Resposta São adequados quando os fatores são quantitativos. Muitas vezes, o objetivo é encontrar uma combinação dos fatores que levam a uma resposta ótima. São muito usados quando a função de resposta verdadeira pode ser bem aproximada por polinômio de segundo grau.
Instruções úteis 1. Reconhecimento e definição do problema 2. Escolha dos fatores, níveis 3. Seleção de variáveis respostas 4. Escolha do planejamento 5. Condução do experimento 6. Análise estatística 7. Conclusões, recomendações e perspectivas
Discussão Muito bom senso Amostra Representativa? Amostra piloto Diferença entre significância estatística e prática Análise seqüencial?
Principal referência Kutner, Neter, Nachtsheim, Li (2004). Applied Linear Statistical Models, 5 th ed.