Elaboração e Delineamento de Projetos

Documentos relacionados
Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste

AULA 19 Análise de Variância

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

UM JOGO BINOMIAL 1. INTRODUÇÃO

Relatório do Experimento 1 Sistema Massa - Mola. Fernando Henrique Ferraz Pereira da Rosa

Capítulo 7. Experimentos com dois ou três Fatores de Interesse. Gustavo Mello Reis José Ivo Ribeiro Júnior

Pressuposições à ANOVA

([DPHGH5HFRUUrQFLDGH0pWRGRV(VWDWtVWLFRV

A presença de Outliers interfere no Teste f e no teste de comparações múltiplas de médias

MAE Séries Temporais

MOQ-14 Projeto e Análise de Experimentos

Métodos Estatísticos Avançados em Epidemiologia

Introdução aos Modelos Lineares em Ecologia

Obtenção Experimental de Modelos Matemáticos Através da Reposta ao Degrau

Diagnóstico da Convergência às Normas Internacionais IAS 8 Accounting Policies, Changes in Accounting Estimates and Errors

Probabilidade. Luiz Carlos Terra


Probabilidade e Estatística

IV Regressão e correlação IV.4. (cont.) Significância Estatística e Regressão Múltipla

PROJETO DE LEI Nº..., DE (DO SR. DEPUTADO MANATO)

ActivALEA. ative e atualize a sua literacia

Adição de probabilidades. O número de elementos da união dos conjuntos A e B n(aub) = n(a B) Dividindo os dois membros por n(e):

Resolução da Prova de Raciocínio Lógico da ANS (Técnico Administrativo) de 2016, aplicada em 21/02/2016.

Graphing Basic no Excel 2007

Métodos Quantitativos Aplicados

PESQUISA OPERACIONAL -PROGRAMAÇÃO LINEAR. Prof. Angelo Augusto Frozza, M.Sc.

Objetivo do Portal da Gestão Escolar

Análise de Variância (ANOVA)

Declaração de Serviços Tomados

COLÉGIO SHALOM 9 ANO Professora: Bethânia Rodrigues 65 Geometria. Aluno(a):. Nº.

Capítulo 5. Modelos de Confiabilidade. Gustavo Mello Reis José Ivo Ribeiro Júnior

FACULDADE DE CIÊNCIAS E TECNOLOGIA. Redes de Telecomunicações (2006/2007)

ANÁLISE COMPARATIVA DOS DADOS METEOROLÓGICOS NAS ESTAÇÕES AUTOMÁTICAS E CONVENCIONAIS DO INMET EM BRASÍLIA DF.

Manual de Inscrição Online do Processo Seletivo MANUAL DE INSCRIÇÃO SELETIVO VESTIBULAR DE VERÃO 2014

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Análise de Variância (ANOVA)

Avaliação Econômica do Projeto de Microcrédito para a população da Zona Norte de Natal/RN

Manual de Utilização. Ao acessar o endereço chegaremos a seguinte página de entrada: Tela de Abertura do Sistema

TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO

Correlação e Regressão

SISTEMAS DISTRIBUÍDOS

MDS II Aula 04. Concepção Requisitos Diagrama de Casos de Uso (Use Cases)

Organização e Arquitetura de Computadores. Ivan Saraiva Silva

Probabilidade. Evento (E) é o acontecimento que deve ser analisado.

Contratar um plano de saúde é uma decisão que vai além da pesquisa de preços. Antes de

AVALIAÇÃO DE UM TANQUE DE DECANTAÇÃO DE SÓLIDOS UTILIZANDO FLUIDODINÂMICA COMPUTACIONAL

Teste de hipótese em modelos normais lineares: ANOVA

Caique Tavares. Probabilidade Parte 1

MANUAL ENOTEL RESERVAS ON LINE

Estudo sobre a dependência espacial da dengue em Salvador no ano de 2002: Uma aplicação do Índice de Moran

Pós-Graduação em Computação Distribuída e Ubíqua

Tratamento e Análise de Dados e Informações (TADI)

TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO

Cap. II EVENTOS MUTUAMENTE EXCLUSIVOS E EVENTOS NÃO- EXCLUSIVOS

EFEITO DO PRODUTO DIFLY S3 NO CONTROLE DO CARRAPATO BOOPHILUS MICROPLUS EM BOVINOS DA RAÇA GIR, MESTIÇA E HOLANDESA

FÍSICA EXPERIMENTAL 3001

O que é câncer de pele? Incidência. Fatores de Risco

Módulo 1 - Mês 1- Aula 3

Observando embalagens

Registro de Retenções Tributárias e Pagamentos

VIII Oficinas de Formação A Escola na Sociedade da Informação e do Conhecimento praticar ao Sábado. E-learning. 3 de Março de 2007

TCI Sistemas Integrados

Propriedade Intelectual da Simples Soluções Slide 2

Portal Senac/SC. Outubro de 2010

Veracel Celulose S/A Programa de Monitoramento Hidrológico em Microbacias Período: 2006 a 2009 RESUMO EXECUTIVO

Gerenciamento dos Riscos do Projeto (PMBoK 5ª ed.)

RELATÓRIO PARA A. SOCIEDADE informações sobre recomendações de incorporação de medicamentos e outras tecnologias no SUS

Porto Alegre/RS

é 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média.

Recorrendo à nossa imaginação podemos tentar escrever números racionais de modo semelhante: 1 2 =

Comandos de Eletropneumática Exercícios Comentados para Elaboração, Montagem e Ensaios

UTILIZAÇÃO DE RECURSOS AVANÇADOS DO EXCEL EM FINANÇAS (PARTE III): GERENCIAMENTO DE CENÁRIOS

COMO VENDER MAIS USANDO FUNIL DE VENDAS. Capítulo III: Etapas do Funil de Vendas

Conceitos Básicos em Estatística

24/06/2010. Presidência da República Secretaria de Imprensa Discurso do Presidente da República

DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS)

Como e onde buscar informação e evidências para tomada de decisões em saúde Biblioteca Virtual em Saúde - BVS

CONSELHO REGIONAL DE ENFERMAGEM DE SANTA CATARINA

DEPARTAMENTO DE MATEMÁTICA

Módulo de Equações do Segundo Grau. Equações do Segundo Grau: Resultados Básicos. Nono Ano

Cinco erros na hora de monitorar seu ambiente de T.I

COLÉGIO NOSSA SENHORA DA PIEDADE. Programa de Recuperação Paralela. 3ª Etapa Ano: 7º Turma: 7.1

Técnicas de Contagem I II III IV V VI

PROCESSO DE ENTRADA DE NOVOS CLIENTES

Curso de Análise Estatística Comparação entre variáveis contínuas: correlação e regressão Linear

Medidas repetidas No.1

2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média.

Se A =, o evento é impossível, por exemplo, obter 7 no lançamento de um dado.

Como remover vírus do celular

[RESOLUÇÃO] Economia I; 2012/2013 (2º semestre) Prova da Época Recurso 3 de Julho de 2013

AULA 07 Distribuições Discretas de Probabilidade

ANÁLISE DE CIRCUITOS I ( AULA 03)

Figura 4.1: Diagrama de representação de uma função de 2 variáveis

CADERNO DE EXERCÍCIOS 2F

Banco de Dados I Unidade 3: Projeto de BD Relacional. Cláudio Baptista

METODOLOGIA DE SUPERFÍCIE DE RESPOSTA: UMA INTRODUÇÃO NOS SOFTWARES R E STATISTICA. Resumo

4.4 Limite e continuidade

Aula 3 Prof. Adriano S. Melo asm.adrimelo no gmail.com

=E4/26 F10 =F4 = G4+F5

Transcrição:

Universidade Federal de Goiás Programa de Pós-Graduação em Ecologia e Evolução Elaboração e Delineamento de Projetos www.ecologia.ufrgs.br/~adrimelo/planejamento Prof. Adriano S. Melo asm.adrimelo no gmail.com

Estudos Observacionais Um problema Menor certeza sobre a atribuição de relação causa-e-efeito a um dado resultado significativo em relação a um estudo experimental

Estudos Observacionais Um segundo problema relacionado Dificuldades na análise de dados devido a multicolinearidade Exemplo: Efeito de temperatura e altitude sobre a densidade de araucária. Y = densidade araucária; X1 = temperatura; X2 = altitude Informação: correlação entre temperatura e altitude = 0,9

Estudos Observacionais Modelos desconsiderando a interação (só para simplificar): Y ~ temp + alti > summary.aov(lm(ara~temp+alti)) Df Sum Sq Mean Sq F value Pr(>F) temp 1 25.4100 25.4100 21.59 0.00560 ** alti 1 10.1453 10.1453 8.62 0.03241 * Residuals 5 5.8847 1.1769 temp alti Y 30 100 0,4 24 200 1,0 26 300 1,1 18 400 3,5 Y ~ alti + temp > summary.aov(lm(ara~alti+temp)) Df Sum Sq Mean Sq F value Pr(>F) alti 1 34.926 34.926 29.6751 0.002832 ** temp 1 0.629 0.629 0.5347 0.497446 Residuals 5 5.885 1.177 12 500 3,0 14 600 5,1 11 700 3,8 13 800 7,7 Total SS = 25,41+10,1453+5,8847 = 34,926+0,629+5,885 = 41,44 Exclusivo: alti = 10,1453; temp = 0,629 Compartilhada: 25,41-0,629 = 24,781; 34,926-10,1453 = 24,781

Mas geralmente você verá apenas isto no seu programa favorito... summary(lm(ara~temp+alti)) Call: lm(formula = ara ~ temp + alti) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -3.939226 4.236561-0.930 0.3951 temp 0.099181 0.135634 0.731 0.4974 alti 0.011787 0.004015 2.936 0.0324 *

Forma de trabalho: Seleção de modelos Uma das formas de fazer seleção: 1. Faça um modelo com todas variáveis 2. Retire uma variável do modelo anterior e calcule novamente 3. Compare os modelos 1 e 2. 4a. Se modelos forem semelhantes em desempenho: Fique com modelo mais simples. 4b. Se modelos forem diferentes em desempenho: Fique com modelo mais completo. 5. Tente retirar outra variável, repetindo os passos anteriores --> Fazemos isto com qualquer análise univariada! (e.g. regressão, anova)

Seleção de modelos: critérios Probabilidade (o mais comum; É bom sempre? Quando não é?) AIC BIC R 2 Diferentes critérios podem resultar em modelos distintos... Além dos critérios, existem outras estratégias de seleção... Que podem resultar em outros modelos...

Estudos observacionais Segundo Burnhan & Anderson (2003): --Não temos modelos corretos! --Temos modelos que são melhores que outros... --Um dado modelo é bom até o momento em que se encontre um melhor --Estudos observacionais: exploratórios --> podem gerar hipóteses para experimentação Veja o Capítulo 1 de: Burnhan & Anderson. 2003. Model selection and multi-model inference. Springer.

Antes de mais nada, são intuitivos! Exemplo: Sem saber nada de Estatística, como faria para saber se altura de meninos é maior que altura de meninas? Meninos: 1.73, 1.85, 1.75, 1.97, 1.56, 1.81, 1.69, 1.72 --> Média = 1.76 Meninas: 1.76, 1.59, 1.67, 1.62, 1.71, 1.68, 1.71, 1.57 --> Média = 1.66 Diferença entre médias = 1.76 1.66 = 0.10 Esta diferença é significativa? Ou seja, qual a probabilidade de 0.10 ter surgido ao acaso? Caso meninos não sejam maiores que meninas, as diferenças das médias deveriam ser próximas de 0. O quão raro é ter uma diferença de 0.10?

Exemplo: Meninos e Meninas Podemos aleatorizar as alturas entre as crianças 1a. aleatorização Meninos: 1.62, 1.85, 1.59, 1.97, 1.73, 1.81, 1.69, 1.71 --> Média = 1.74 Meninas: 1.76, 1,75, 1.67, 1.56, 1.72, 1.68, 1.57, 1.71 --> Média = 1.68 Diferença entre médias = 1.74 1.68 = 0.06 2a. aleatorização Meninos: 1.62, 1.75, 1.59, 1.56, 1.73, 1.68, 1.69, 1.71 --> Média = 1.66 Meninas: 1.76, 1.85, 1.67, 1.97, 1.72, 1.81, 1.57, 1.71 --> Média = 1.76 Diferença entre médias = 1.66 1.76 = -0.1

Exemplo: Meninos e Meninas Repetimos o procedimento 1000 vezes e guardamos os valores das diferenças das médias. Fazemos um histograma Diferença das médias observadas = 0.10 Qual a conclusão? 0 Diferenças das média

Exemplo: Meninos e Meninas Repetimos o procedimento 1000 vezes e guardamos os valores das diferenças das médias. Fazemos um histograma Diferença das médias observadas = 0.10 Qual a conclusão? 0 Diferenças das média

Todos testes são muito parecidos! O que muda é a estatística que mede o padrão que estamos testando Procedimento Geral 1. Calcule a estatística para os dados observados; 2. Aleatorize os dados segundo o seu modelo nulo; 3. Calcule a estatística novamente, mas agora para os dados aleatorizados; 4. Repita os passos 2 e 3 muitas vezes e guarde o valor da estat. em cada um; 5. Compare o valor observado com os valores obtidos nas aleatorizações; 6. O valor observado é semelhante ou diferente dos valores aleatorizados?

Exemplo: Co-ocorrência ilha1 ilha2 ilha3 ilha4 ilha5 ilha6 ilha7 ilha8 ilha9 ilha10 sp1 1 1 1 1 1 1 sp2 1 1 sp3 1 1 1 sp4 1 1 1 1 Estatística usada: C-Score Média do número de "checkerboard units (CU) entre todos pares de spp. Uma CU é qualquer submatrix da forma: 10 ou 01 01 10 O número de CU para cada par de espécies é calculado como: (r i -S)*(r j -S) onde S é o número de sítios compartilhados e r i e r j são ocorrências das spp. Modelo Nulo: Restrição: Cada espécie mantém seu número de ocorrências CU (sp1 x sp2) = (6-0)*(2-0) = 12

Exemplo 2: Co-ocorrência Observado ilha1 ilha2 ilha3 ilha4 ilha5 ilha6 ilha7 ilha8 ilha9 ilha10 sp1 1 1 1 1 1 1 sp2 1 1 sp3 1 1 1 sp4 1 1 1 1 sp1 sp2 sp3 sp4 sp1 12 0 15 sp2 6 3 sp3 12 sp4 Média = C-Score = 8

Exemplo 2: Co-ocorrência Aleatorizado 1 ilha1 ilha2 ilha3 ilha4 ilha5 ilha6 ilha7 ilha8 ilha9 ilha10 sp1 1 1 1 1 1 1 sp2 1 1 sp3 1 1 1 sp4 1 1 1 1 sp1 sp2 sp3 sp4 sp1 12 0 8 sp2 6 3 sp3 6 Média = C-Score = 5.8 sp4

Exemplo 2: Co-ocorrência C-Score Observado = 8 0 0.7 1.4 2.1 2.8 3.5 4.2 4.9 5.6 6.2 6.9 7.6 8.3 C-Score Número total de aleatorizações = 1000 Número de aleatorizações maiores que observado = 4 p = (4+1) / (1000+1) = 5/1001 = 0.0049 Ou seja, baixa probabilidade de obter um valor tão alto (8) ao acaso

Procedimento Geral Exemplo co-ocorrência 1. Calcule a estatística para os dados observados; Quem era? 2. Aleatorize os dados segundo o seu modelo nulo; Qual era o modelo? 3. Calcule a estatística novamente, mas agora para os dados aleatorizados; Qual era o valor da 1a aleatorização? O valor da 1a sempre será este? 4. Repita os passos 2 e 3 muitas vezes e guarde o valor da estat. em cada um; Quantas vezes fizemos? 5. Compare o valor observado com os valores obtidos nas aleatorizações; Lembra do histograma? 6. O valor observado é semelhante ou diferente dos valores aleatorizados? Qual era o valor de p? Sempre teremos o mesmo valor de p para estes dados?