Mario de Andrade Lira Junior http:\\lira.pro.br\wordpress 1
Item da avaliação 2010-1 Média avaliações semanais 2 Condução e análise do trabalho prático 2 Apresentação e artigo do trabalho prático 3 Prova teórica 4 Prova prática 4 A média das avaliações semanais descarta a menor nota. Todas serão efetuadas usando http://lira.pro.br/tce/tcexam/public/code/tce_login.php que vai estar na página. A sabatina será postada no domingo subsequente à aula Vocês têm até o sábado para mandar qualquer dúvidas. Prazo final para resposta é a terça-feira Com alguma sorte discuto os resultados no início da aula seguinte A prova teórica será em 21 de julho, pela manhã, e no máximo até as 17:00, com consulta aberta. Esta prova é exclusivamente teórica. A prova prática será em 28 de julho, com o mesmo horário, também de consulta, e constando de interpretação de análises já feitas, e planejamento de pesquisa
Em duplas definidas por vocês até a semana que vem no máximo Temas pré-definidos em conjunto para as três disciplinas obrigatórias Temas serão distribuídos por sorteio entre as duplas Cada professor terá sua avaliação individual, mas material de entrega será conjunto Apenas para Técnicas, será entregue um memorial descrevendo o procedimento de análise de dados (primeira parte desta nota) As duplas deverão apresentar um artigo científico e um seminário (segunda parte da nota) 3
Data 17/mar 24/mar 31/mar 07/abr 14/abr 21/abr 28/abr 05/mai 12/mai 19/mai 26/mai 02/jun 09/jun 16/jun 23/jun 30/jun a 14/jul 21/jul 28/jul Assunto Variação do acaso, medidas de tendência central e de variação, nível de significância, teste de hipóteses Regressão Regressão Modelo Linear Generalizado Modelo Linear Generalizado Tiradentes e Páscoa Delineamentos Experimentais Arranjo fatorial Arranjo fatorial Parcela Sub-dividida Medições repetidas Análise multivariada Amostragem Amostragem Feriado de Corpus Christi Margem para seminários e imprevistos Prova teórica Prova prática
A cada tópico será feita uma recomendação específica Embora não haja obrigatoriedade de uso, o curso será mais direcionado ao uso e entendimento do SAS, devido ao poder de fogo, à flexibilidade, e à minha fluência A cada semana a apresentação da semana seguinte será disponibilizada.
Variação do acaso, parcela experimental, parâmetro, estimador, medidas de tendência central, medidas de dispersão Princípios experimentais Erros tipo I e II Nível de significância Alguns testes de hipóteses 6 direitos autorais.
População Todo o universo Após medida, não muda mais Qualquer conclusão só vale para esta população Qualquer medida é um parâmetro Amostra Uma parte do universo, que o representa Outra amostra da mesma população terá resultados diferentes A conclusão feita com base na amostra deve representar toda a população Toda medida é uma estimativa http:\\lira.pro.br\wordpress - Reservados todos os 7
Conseqüência direta de trabalhar com amostra É o número de pontos completamente independentes Calculado como o número de pontos da amostra (n) subtraindo o número de valores calculados com esta amostra antes deste ponto Normalmente n-1, já que sempre precisamos calcular a média 8
Moda Mediana Média Moda Mediana Média Vantagem Simples Não é sensível a valores extremos Adequada para dados qualitativos Sempre existe Reflete os valores no centro da distribuição Não é sensível a valores extremos Ponto de equilíbrio para distribuição de freqüências Leva todos os valores em consideração Desvantagem Pode existir ou não Não leva os demais valores em consideração Não reflete todos os valores Sensível a valores extremos 9
Amplitude Variância Desvio-Padrão s 2 = s 2 = 2 ( ponto média) 1 = n 1 X 2 n ( X ) 2 n 1 n ( x i n 1 x) 2 10
Desvio padrão Corresponde ao valor médio dos desvios de cada ponto em relação à média Geralmente a maioria dos pontos fica a um desviopadrão da média s = s 2 Coeficiente de variação CV 100 = mˆ s 11
Vantagem Desvantagem Amplitude Simples Muito sensível a valores extremos Depende do tamanho da amostra Não leva os demais valores em consideração Variância Leva todos os valores em consideração Unidades sem lógica Desvio-padrão Variância com unidades mais lógicas Geralmente um pouco superior (10-20%) à média dos desvios em absoluto Coeficiente de variação Independente das unidades Deve-se ter cuidado com generalizações 12
Erro padrão da média Expressa a variação levando em conta o tamanho da amostra s n Intervalo de confiança É uma faixa de valores em que espera-se encontrar a média da população, com base na média, na variabilidade e no tamanho da amostra Leva em consideração uma margem de erro, ou intervalo de confiança s mˆ ± t o n 13
Graus de liberdade Chance de errar 0,10 0,05 0,01 1 6,314 12,706 63,657 2 2,920 4,303 9,925 3 2,353 3,182 5,841 4 2,132 2,776 4,604 5 2,015 2,571 4,032 6 1,943 2,447 3,707 7 1,895 2,365 3,499 8 1,860 2,306 3,355 9 1,833 2,262 3,250 10 1,812 2,228 3,169 15 1,753 2,131 2,947 20 1,725 2,086 2,845 30 1,697 2,042 2,750 40 1,684 2,021 2,704 50 1,676 2,009 2,678 100 1,660 1,984 2,626 1000 1,646 1,962 2,581 Quantos mais pontos (maior grau de liberdade) menor a faixa de valores em torno da média Menor chance de erro, maior faixa de valores em torno da média 14
Unidade experimental É a menor unidade a receber um tratamento Depende essencialmente do objetivo do experimento Afeta variabilidade e custo Variável Independente que faz o tratamento, como dose de adubo, etc Dependente medição que indica o efeito do tratamento 15
Repetição Se um dado só é coletado uma vez, como separar acaso e tratamento? Casualização Se o pesquisador decide onde cada tratamento fica, como separar acaso de tratamento? Controle local Se as condições não são completamente homogêneas, como reduzir o efeito desta variação? 16
Várzea Ladeira suave Ladeira pesada Chã 17
Hipótese científica A idéia por trás do experimento Deve ficar clara pela revisão da literatura Sempre útil explicitar (no projeto ou para você e seu orientador) Hipótese estatística Duas hipóteses antagônicas, a nula (H 0 ) e alternativa (H a ou H 1 ) Nula é a hipótese testada, normalmente de igualdade entre todos os tratamentos 18
H 0 Verdadeira Rejeição H 0 Erro tipo I H 0 Falsa Decisão Correta Aceitação H 0 Decisão Correta Erro tipo II 19
Critério de escolha Função da hipótese a testar Função do material e tipo de dados Opções mais comuns Chi-quadrado - observado com esperado F - existência de efeito t - comparação de dois tratamentos ou regressão Tukey - comparação de vários tratamentos 20
F Comparar variação dos tratamentos com o acaso Variância do tratamento F = Variância do acaso Comparar valor com conhecido Em programas de estatística, já aparece a probabilidade do valor encontrado ser devido ao acaso No Excel a fórmula =distf(valor F; GLtrat;GLres) indica a probabilidade de um valor de F ser devido ao acaso http:\\lira.pro.br\wordpress - Reservados todos os 21
Graus de liberdade para os tratamentos Graus de liberdade para o resíduo 1 2 3 4 5 6 7 8 9 10 15 20 25 50 1 161,45 199,50 215,71 224,58 230,16 233,99 236,77 238,88 240,54 241,88 245,95 248,01 249,26 251,77 2 18,51 19,00 19,16 19,25 19,3 19,33 19,35 19,37 19,38 19,40 19,43 19,45 19,46 19,48 3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,70 8,66 8,63 8,58 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,86 5,80 5,77 5,70 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,62 4,56 4,52 4,44 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 3,94 3,87 3,83 3,75 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,51 3,44 3,40 3,32 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,22 3,15 3,11 3,02 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,01 2,94 2,89 2,80 10 4,96 4,1 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,85 2,77 2,73 2,64 15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,40 2,33 2,28 2,18 20 4,35 3,49 3,10 2,87 2,71 2,6 2,51 2,45 2,39 2,35 2,20 2,12 2,07 1,97 25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,09 2,01 1,96 1,84 50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,87 1,78 1,73 1,60 22
Calcula a menor diferença entre dois tratamentos que pode ser considerada como não devida ao acaso Diferença Mínima Significativa ou Diferença entre duas médias maior ou igual a DMS, tratamentos diferentes Caso contrário, não diferentes = q tabela VariânciaAcaso Número repetições http:\\lira.pro.br\wordpress - Reservados todos os 23
24
Casella,G. Basics. IN: Casella, G. Statistical Design. New York:Springer, 2008. p 1-42 Hoshmand, A.R. The nature of agricultural research. IN: Hoshmand, A.R. Design of experiments for agriculture and the natural sciences. Boca Raton: Chapman & Hill/CRC, 2006. p. 1-12 Steel, R. G. D. ; Torrie, J. H. Principles of experimental design. IN: Steel, R. G. D. ; Torrie, J. H. New York: McGraw Hill, 1980. p. 122-136 LeClerg,E.L.; Leonard, W.H.; Clark,A.G. Tests of significance. IN: LeClerg,E.L.; Leonard, W.H.; Clark,A.G. Field plot technique. Minneapolis:Burgess Publishing Company, 1962. p. 39-59 O Rourke,N.; Hatcher,L.; Stepanski,E.J. Basic concepts in research and data analysis. IN: O Rourke,N.; Hatcher,L.; Stepanski,E.J. Using SAS for univariate & multivariate statistics. Cary: SAS Institute/Wiley Interscience, 2005. p. 1-20 25