Parte I. Estatística Experimental Medicina Veterinária. Faculadade de Ciências Agrárias e Veterinárias. Campus de Jaboticabal SP. Gener Tadeu Pereira

Tamanho: px
Começar a partir da página:

Download "Parte I. Estatística Experimental Medicina Veterinária. Faculadade de Ciências Agrárias e Veterinárias. Campus de Jaboticabal SP. Gener Tadeu Pereira"

Transcrição

1 MATERIAL DIDÁTICO Parte I Estatístca Expermental Medcna Veternára Faculadade de Cêncas Agráras e Veternáras Campus de Jabotcabal SP Gener Tadeu Perera º SEMESTRE DE 06

2 ÍNDICE INTRODUÇÃO AO R AULA ESTATÍSTICA DESCRITIVA0 º EXERCÍCIO PRÁTICO ESTATÍSTICA EXPERIMENTAL 33 AULA TESTES DE SIGNIFICÂNCIA35 º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 46 AULA 3- DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)48 3º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 70 AULA 4 TESTE DE COMPARAÇÕES MÚLTIPLAS73 4º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 9 AULA 5 TESTES F PLANEJADOS93 5º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 04 AULA 6 DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC)07 6º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL 4

3 Introdução ao R O que é o R? R é uma lnguagem e ambente para calcular estatístcas e gráfcos Ele é um projeto GNU o qual é smlar à lnguagem S e ambente a qual fo desenvolvda na Bell Laboratores, formalmente (AT&T) por John Chambers e colaboradores R pode ser consderado uma mplantação dferente do S Exstem algumas dferenças mportantes, mas mutos dos códgos escrtos para o S rodam sem modfcações no R O R fornece uma grande varedade de técncas estatístcas (modelagem lnear e não lnear, testes estatístcos clásscos, análse de séres-temporas, ) e gráfcas, e é altamente extensível Um dos pontos fortes de R é a facldade com que bem projetados gráfcos para publcações de qualdade pode ser produzdos, nclundo símbolos matemátcos e fórmulas O programa R esta dsponível como um programa lvre ( Free Software ) sob os termos da Free Software Foundaton s GNU General Publc Lcense Instalando o R Geralmente, o sstema R conste de duas partes Uma é denomnada de Sstema básco do R para o núcleo da lnguagem R e bblotecas fundamentas assocadas A outra consste de contrbções de usuáros que desenvolvem pacotes que são aplcações mas especalzadas Ambas as partes podem obtdas do Comprehensve R Archve Network (CRAN) do ste: A nstalação do sstema R é descrto a segur Instalando o Sstema básco do R Usuáros do Wndows podem baxar a últma versão do R no endereço Em Dowload and Install R, acone o lnk que corresponde ao sstema operaconal do seu computador ( no caso do Wndows Dowload R for Wndows e depos no lnk base Depos de baxar (salvar) o arquvo executável, basta executá-lo e segur a rotna de nstalação Neste mesmo endereço são dsponblzadas versões do R nas plataformas do Lnux,e MacOS X O endereço acma é o local dsponível mas próxmo de Jabotcabal, no caso a USP/Prassununga, SP Estatístca Expermental

4 3 Manpulando dados O R usa város tpos de dados que frequentemente são usados na maora de suas funções ou cálculos A segur uma lstagem dos mas mportantes tpos de dados e objetos: Um vetor pode ser numérco, complexo, um vetor de caracteres, ou um vetor lógco Estes vetores são sequêncas de números, números complexos, caracteres, ou valores lógcos, respectvamente; Uma arra é um vetor com um atrbuto de dmensão, em que atrbuto de dmensão é um vetor de nteros não negatvos Se a ampltude de um vetor é k, então o vetor é k-dmensonal A arra mas comumente usada é uma matrz,a qual é uma arra b-dmensonal de números Um fator objeto é usado para defnr varáves categórcas (nomnas ou ordenadas) Estes podem ser vstos como vetores nteros em que cada valor ntero tem um label correspondente Uma lsta é uma coleção de objetos ordenados Um vetor pode conter somente elementos de um tpo, mas uma lsta pode ser usada para crar uma coleção de vetores ou objetos msturados Um data frame é uma lsta de vetores ou fatores com uma mesma ampltude tal que cada lnha corresponde a uma observação Os seguntes códgos usam as funções c( ), factor( ), dataframe( ), e lst( ) para exemplfcar os dferentes tpos de dados vet <- 4 # Vetor numérco de dmensão vet [] 4 vet <- c(,,34,56,7) # Vetor numérco de dmensão 5 vet [] # Crando um vetor de caracteres vet3 <- c("joão", "Antôno", "Costa", "Slva", "Olvera") # Crando um vetor de valores lógcos vet4<- c(true, TRUE,TRUE, FALSE, TRUE) f<- factor(vet3) # Defnndo um vetor baseado em vet3 f [] João Antôno Costa Slva Olvera Levels: Antôno Costa João Olvera Slva x<- + # Entrando com um número complexo x [] + sqrt(-) # O R não reconhece número complexo [] NaN Mensagens de avso perddas: In sqrt(-) : NaNs produzdos Estatístca Expermental

5 4 sqrt(-+0) # Mas reconhece este [] 0+ m<- matrx(:6,,ncol=) m [,] [,] [,] 4 [,] 5 [3,] 3 6 lst(vet, comp=x, m) # Combna 3 dferentes objetos [[]] [] $comp [] + [[3]] [,] [,] [,] 4 [,] 5 [3,] 3 6 dataframe(vet, f, vet4) # Cra um dataframe vet f vet4 0 João TRUE 0 Antôno TRUE 3 34 Costa TRUE 4 56 Slva FALSE 5 70 Olvera TRUE Estatístca Expermental

6 5 Tabela Operadores matemátcos e funções Símbolo/ funções Descrção + adção - subtração * multplcação / dvsão ^ ou ** exponencação %% modulus % / % dvsão ntera abs (x) valor absoluto sqrt (x) raz quadrada celng (x) menor valor não menor que x floor (x) maor ntero não maor que x trunc (x) trunca x descartando as decmas round (x, dgts=0) arrendonda x para nº de dígtos dec sgnf (x, dgts=6) arredonda x para nº de dígtos sgnf cos (x), sn (x) e tan (x) coseno, seno e tangente log (x) logartmo natural (base = e) log (x, base=) logarítmo com base log0 (x) logarítmo decmal (base = 0) exp (x) função exponencal % * % multplcação de matrzes Usando funções matemátcas e operações Problema: Voce deseja aplcar funções matemátcas numércas báscas ou usar opradores artmétcos em seus cálculos Solução: O R contém um grande número de operadores artmétcos e funções matemátcas e algumas delas são lstadas na Tabela Os códgos abaxo são exemplos do uso destas funções 5/ + *(5-3) # Soma, subtração, multplcação e dvsão [] 8 **8 # elevado a potênca 8 [] 56 6^5 # 6 elevado a potênca 5 [] %% 3 # 0 modulus 3 tem resto [] 0 %/% 3 # dvsão ntera [] 3 abs( -3) # valor absoluto de -3 [] 3 celng(43) # menor ntero maor que 43 [] 5 floor(43) # maor ntero menor que 43 [] 4 Estatístca Expermental

7 6 trunc(43) # remove as decmas [] 4 round(45) # arredonda para 0 casas decmas [] 4 round(45) [] 5 round(45,dgts=) [] 45 # Angulos para funções trgonometrcas use radanos - não graus cos(p/) # coseno de p/ [] 6303e-7 sn(p/4) # seno de p/4 [] tan(p/6) # tangente de p/6 [] log(5) # logarítmo natural de 5 [] log(5,base=) # logarítmo de 5 na base [] 398 log0(5) # logarítmo de 5 na base 0 [] exp(log(5) + log(3)) # função exponencal [] 5 # Crando duas matrzes x <- matrx(:6,ncol=3) <- matrx(c(,, 0, 0, 0, ), ncol=) x [,] [,] [,3] [,] 3 5 [,] 4 6 [,] [,] [,] 0 [,] 0 [3,] 0 x%*% # Multplcação de matrzes [,] [,] [,] 4 5 [,] 6 6 %*%x # Multplcação de matrzes [,] [,] [,3] [,] 3 5 [,] 3 5 [3,] 4 6 Estatístca Expermental

8 7 Trabalhando com funções comuns Problema: Voce precsa dentfcar e/ou usar algumas funções comuns Solução: O grande número de funções no R pode trazer alguma dfculdade para os usuáros na dentfcação da função a qual fornece certa facldade A Tabela lsta algumas funções mas frequentemente usadas encontradas no R Símbolo/função mean (x) medan (x) sd (x) var (x) summar (x) IQR (x) cor (x,) length (x) sum (x) cumsum (x) sort (x) order (x) mn (x) e max (x) quantle (x) sna (x) nrow (df) e ncol (df) Descrção méda medana desvo padrão varânca sumáro estatístco ntervalo nter-quartílco correlação entre x e ampltude de x soma soma acumulatva ordenação de x postos de x mínmo e maxmo de x quants de x teste para observações perddas nº lnhas e colunas no data frame df x<- c(6, 8, :4) x [] mean(x) # méda [] 4 medan(x) # medana [] 35 sd (x) # desvo padrão [] IQR (x) # ampltude nter-quartle [] 35 summar (x) # sumáro estatístco Mn st Qu Medan Mean 3rd Qu Max <- (:6)** # novo vetor cor(x, ) # correlação de Pearson [] cor (x,, method="spearman") # correlação de Spearman [] cor(x,,method= "kendall") # correrelação e Kendall [] length (x) # ampltude de x [] 6 Estatístca Expermental

9 8 sum (x) # soma dos elementos em x [] 4 cumsum (x) # soma acumulatva de x [] sort (x) # ordenação do vetor x [] order (x) # postos dos elementos [] mn (x) # valor mínmo de x [] max (x) # valor máxmo de x [] 8 quantle (x) # fornece os quarts de x 0% 5% 50% 75% 00% quantle (x, probs= c(05, 05, 099)) # quants especfcados 5% 5% 99% x[c(,4)] <- NA # redefne x na ª e 4ª posção com NA sna(x) # dentfca os valores perddos [] FALSE TRUE FALSE TRUE FALSE FALSE df <-dataframe(x=c(,, 3, 4), =c(,, 3, )) df x nrow(df) # número de lnhas no data frame df [] 4 ncol(df) # número de colunas no data frame df [] Váras funções defndas acma usam argumentos opconas Em partcular a opção narm pode ser colocada como TRUE para assegurar que observações perddas são desconsderadas nos cálculos como é mostrado a segur Do mesmo modo, a opção decreasng = TRUE para as funções sort e optons revertem a ordem x # vetor com valores perddos [] 6 NA NA 3 4 sum(x) # sum não é avalável [] NA sum(x, narm=true) # a menos que os NA's sejam removdos [] 4 mean(x) # mean tmambém não é executado [] NA mean(x, narm = TRUE) # a menos que os NA's sejam removdos [] 35 order(x) # order coloca os NA's por últmo [] Estatístca Expermental

10 9 sort(x) # sort remove todos os NA's [] sort(x, nalast = TRUE, decreasng=true) # a menos que queremos mantê-los 3 Importando dados Problema: Voce deseja mportar um conjunto de dados (arquvo de dados) armazenado em arquvo texto ASCII (arquvos com extensão txt) Solução: Dados armazenados em smples arquvos textos podem ser ldos no R pela função readtable( ) Por default, as observações devem ser lstadas em colunas e os campos ndvduas são separados por um ou mas caracteres de espaço em branco, e cada lnha no arquvo corresponde a uma lnha no arquvo data frame Consdere o arquvo, dadostxt, com o segunte conteúdo anmal sexo acdo dgestao NA m ptuco m rufus f NA 87 pretnha f prncesa f 44 rose f 8 93 "" f O códgo default para observações perddas é a sequênca de caracteres NA, o qual aparece na ª observação da ª coluna e na 3ª lnha da 3ª coluna Os outros símbolos, " " e, tem de ser especfcados na opção nastrngs( ) O arquvo acma é ldo pelo R com o segunte comando: dadosn<-readtable("dadostxt", header=true, + nastrngs=c("na","","")) dadosn anmal sexo acdo dgestao rufus m ptuco m <NA f NA pretnha f prncesa f 44 NA 6 rose f <NA f O prmero argumento é o nome do arquvo, e o segundo (header=true) é opconal e deve ser usado somente se a prmera lnha do arquvo texto é composta por nomes das varáves (cabeçalho) e o tercero argumento especfca os símbolos NA, "", e como valores perddos O R procura o arquvo dadostxt no dretóro corrente de trabalho estabelecdo ncalmente pelos comandos: na janela da console acone as abas Arquvo/Mudar dretóro/ Se o dretóro de trabalho é o drve d, então o camnho é estabelecdo por Arquvo/Mudar dretóro/d:/ O camnho pode ser estabelecdo no própro comando de letura, ou seja, Estatístca Expermental

11 dadosn<-readtable("d:/dadostxt", header=true, nastrngs=c("na","","")) Outras funções usadas para obter e estabelecer o dretóro de trabalho são getwd( ) e setwd( ) getwd() # obtém o dretóro de trabalho corrente [] "C:/ " setwd("d:/") # estabelece o dretóro de trabalho par d:/ 3 Estatístca Descrtva 3 Símbolos: conjunto de dados e da somatóra Conjunto de dados: Consdere uma varável aleatóra de nteresse representada pela letra maúscula Y e os valores específcos assumdos por esta varável aleatóra pelas letras mnúsculas Para dstngur um valor do outro, utlzamos um subscrto Por exemplo,,,, n Em geral, um valor típco da varável aleatóra será desgnado por e o valor fnal desta amostra por n, sendo que n representa o tamanho da amostra Uma notação compacta para representar a soma de todos os valores de uma varável aleatóra de nteresse, por exemplo, Y, é n n A letra grega Σ (sgma) é usada como símbolo da soma para a soma e para o valor da observação, denomnado de snal de soma, será usado extensvamente neste curso Alguns exemplos e propredades da somatóra: A soma de n números,,, n, como vmos, pode ser expressa por n A soma dos quadrados de n números n n n,,, n é: A soma dos produtos de dos conjuntos de n números e,,, n : n x x x x n n x x,, x, Exemplo: Consdere um conjunto de 3 números:, 3 e 6 Os números Y,, 3,3,6 A soma e a soma dos quadrados destes números são: são smbolzados por: n 3 6 0, Consdere outro conjunto de números x, x 4 e x 3 5 A soma dos produtos de x e é: n n 0 Estatístca Expermental

12 3 x As três prncpas regras da adção são: ()()(4)(3)(5)(6) 44 A soma da adção de dos conjuntos de números é gual à adção das somas n ( x ) x A soma dos produtos de uma constante k e uma varável Y é gual ao produto da constante pela soma dos valores da varável ( ) n n k k 3 A soma de n constantes com valor k é gual ao produto n k n n n k k k k n k Atenção: notem que o cálculo da expressão n, denomnada de soma de quadrados é dferente do cálculo da expressão n ( ) ( ), denomnada de quadrado da soma n Outras notações: n + = n, e n n Notação com dos subescrtos Consdere dos grupos de dados n grupo controle: { 5, 7, 5, 4 }, o qual é representado por, 7, 5, 4, grupo tratado: { 7, 9, 6, 9, 8 }, o qual é representado por 7, 9, 3 6, 4 9, 5 8, sendo, =,, representando os grupos e j =,,, r representando as repetções dentro de cada grupo j Calcular o valor da expressão r Exemplo de Tabela de dupla entrada Qualquer observação é representada por j, sendo que, o índce refere-se às lnhas (=,,, k) e o índce j refere-se às colunas (j=,,, r) r ( j n ) Estatístca Expermental

13 j Colunas Lnhas 3 j r Total Méda 3 r + 3 r r 3+ k k k k3 kr k+ k Total + Y j +r ++ Méda 3 é o total da j ésma coluna; é o total da ésma lnha; é o total geral( soma de todas as observações ); j j j é a méda da ésma lnha; j+ 3 j r é a méda da j ésma coluna; é a méda geral 3 Meddas de tendênca central Um dos aspectos mas mportantes do estudo de um conjunto de dados é a posção do valor central Qualquer valor numérco que representa o centro de um conjunto de dados é denomnado de medda de locação ou medda de tendênca central As duas meddas mas comumente utlzadas é méda artmétca, ou smplesmente a méda, e a medana 3 Méda artmétca A mas famlar medda de tendênca central é a méda artmétca Ela é a medda descrtva que a maora das pessoas tem em mente quando elas falam de méda A méda pode ser expressa como n n n n n Vamos supor que a varável aleatóra Y assume os seguntes valores, { 0, 54,, 33, 53 }, então a méda destes 5 valores é dada por: Scrpt no R para o cálculo da méda 34, <-c(0,54,,33,53) meda<-sum()/length() # calculo da méda pela defnção meda [] 34 meda<-mean() # pela função mean( ) Estatístca Expermental

14 3 meda [] 34 Propredades da méda; a) Únca Para um conjunto de dados exste uma e somente uma méda artmétca b) Smplcdade A méda artmétca é fácl de ser entendda e fácl de ser calculada c) Dado que toda observação do conjunto de dados entra no seu cálculo, ela é afetada por cada valor Valores extremos têm nfluênca na méda e, em algumas stuações podem ocorrer dstorções, o que pode torná-la uma medda ndesejável como medda de tendênca central 3 Medana Uma alternatva à méda artmétca como medda de tendênca central é a medana A medana de um conjunto de valores fntos é o valor que ocupa a posção central dos dados ordenados, ou seja, aquele valor o qual dvde o conjunto de dados em duas partes guas tal que o número de valores guas ou maores que a medana é gual ao número de valores menores ou guas que a medana Temos que consderar duas stuações: ( k ) ~ ( ( k ) se n k ( n é mpar ) ( k ) ) se n k( n é par ) Exemplos: Consdere os dados 0, 54,, 33, 53, com n=5 observações, e a seqüênca ordenada fca 0,, 33, 53, 54 A medana é calculada como sendo a observação que ocupa a 3ª posção da seqüênca ordenada, ou seja, n k k ( n /), ou seja, k ~ 33 ( ) (3 ) Consdere os dados 0, 54,, 33, 53, 55, e a seqüênca ordenada fca 0,, 33, 53, 54, 55 Como o número de observações é par e a medana é calculada como sendo a méda das observações que ocupam a posção central, ou seja, n k k ( n /), ou seja, k 3 ~ ( (3 ) (3 ) ) ( (3 ) (4 ) (33 53) 43 Scrpt no R para o cálculo da medana medana<-medan() # calculo da medana pela função medan( ) medana [] 33 Propredades da medana; a) Únca Assm como a méda, para um conjunto de dados exste uma e somente uma medana b) Smplcdade A medana é fácl de ser calculada Estatístca Expermental

15 4 méda c) Ela não é drastcamente afetada por valores extremos, como a 33 Moda A moda é comumente defnda como a observação mas freqüente do conjunto de dados Se todas as observações são dferentes não exste moda; por outro lado um conjunto de dados pode ter mas de uma moda Exemplo: consdere o conjunto de dados {98, 0, 00, 00, 99, 97, 96, 95, 99, 00}, então a moda é mo = 00, e no conjunto de dados, abaxo, { 0,, 0, 0, 34,, 4, 7, 7, 7} exste duas modas 0 e 7 (bmodal) a) b) c) d) Fgura Dstrbuções de freqüênca mostrando as meddas de tendênca central Dstrbuções em a) e b) são smétrcas, c) é postvamente assmétrca, e d) é negatvamente assmétrca As dstrbuções a), c), e d) são unmodal, e a dstrbução b) é bmodal 33 Meddas de dspersão Apesar das meddas de tendênca central fornecerem uma déa do comportamento de um conjunto de dados, elas podem esconder valosas nformações Essas meddas não são sufcentes para descrever ou dscrmnar dferentes conjunto de dados Por exemplo, a Fgura 3 mostra os polígonos de freqüênca duas varáves que possuem a mesma méda, mas dferentes valores de dspersão A varável B, a qual tem maor varabldade que a varável A, é mas espalhada A dspersão de um conjunto de dados se refere à varedade que eles exbem Uma medda de dspersão fornece nformação a respeto da quantdade de varabldade presente no conjunto de dados Estatístca Expermental

16 Fgura 3 Dos polígonos de freqüênca com a mesma méda, mas com dferentes quantdades de dspersão Se todos os valores do conjunto de dados são guas, não exste dspersão; se eles são dferentes, a dspersão está presente nos dados A quantdade de dspersão pode ser pequena, quando os dados, embora dferentes, são muto próxmos 33 Ampltude A ampltude é defnda como a dferença entre o maor e o menor valor do conjunto de dados O problema desta medada é que ela só leva em conta dos valores do conjunto de dados e, assm, sera mas convenente consderarmos uma medada que utlzasse todas as observações do conjunto de dados A prmera déa que ocorre é consderar o desvo de cada observação em relação a um ponto de referênca e então calcular a sua méda Se tomarmos a méda artmétca como este ponto de referênca, temos a segunte stuação: Seja o conjunto de dados,,, n e, a méda destes dados Defnremos por d, os desvos destas observações em relação à sua méda Por exemplo, consdere os dados 4, 5, 3 6 e 4 9 Assm temos: , 4 d (4 6), d (5 6), d (6 6) 0, d (9 6) Reparem que a soma dos desvos é gual a zero, ou seja, d 0 Isto pode ser provado algebrcamente, da segunte forma, n d n n n n n n n ( ) n n n 4 0 n Portanto a soma destes desvos não sera nada nformatva sobre a dspersão dos dados Defnremos então, uma medda que utlza o quadrado dos desvos em relação à méda 33 Varânca e desvo-padrão A varânca de um conjunto de dados, é defnda como méda dos desvos das observações em relação à méda ao quadrado, ou seja, ( ) ( ) ( n ) s n Para manter a mesma undade dos dados orgnas, é convenente defnrmos o desvo-padrão como sendo a raz quadrada postva da varânca s, ( ) ( ) ( n ) s n A varânca amostral é frequentemente calculada usando-se a fórmula mas rápda e prátca 5 Estatístca Expermental

17 ( n ) s n n n n ( n ) n n Exemplo: Os pesos (em pounds) de uma amostra aleatóra de trutas em um lago são:,9; 0,93;,40;,7; 0,89;,74;,06;,6;,47;,5 A méda artmétca destes dados é 3,7 (,9 0,93,5),37pounds 0 0 E a varânca é s (,9,37) (0,93,37) (,5,37) 0 0,87( pounds) Alternatvamente, temos (,9 0,93,5) s,9 0,93, ,70 0,74 0,87( pounds), e 9 0 s 0,87 0,47pounds Scrpt no R para os cálculos acma # entrando com os dados pelo comando concaternar c( ) peso <- c(9, 093, 40, 7, 089, 74, 06, 6, 47, 5) # cálculo da méda pela defnção com os comandos sum() e length() mpeso <- sum(peso)/length(peso) mpeso [] 37 mpeso <- mean(peso) # cálculo da méda pela função mean() mpeso [] 37 # mas detalhes da função mean() execute o comando??mean() # 3 formas de se calcular a varânca pelas fórmulas do tem 33 vpeso <- sum((peso-mean(peso))^)/(length(peso)-) vpeso [] 087 vpeso <- (sum(peso^)-sum(peso)^/length(peso))/(length(peso)-) vpeso [] Estatístca Expermental

18 7 # cálculo pela função var( ) v3peso <- var(peso) v3peso [] 087 # cálculo do desvo padrão pela defnção sdpeso <- sqrt(v3peso) sdpeso [] # cálculo do desvo padrão pela função sd( ) sdpeso <- sd(peso) sdpeso [] Quarts Alguns quarts são defndos de modo análogo à medana Assm como a medana dvde o conjunto de dados em duas partes, os quarts dvdem os dados em quatro partes O segundo quartl, representado por Q é gual à medana, então Q ~ O prmero quartl, Q é defndo como aquele valor do conjunto de dados tal que não mas que 5% dos dados têm valores menores que Q e não mas que 75% dos dados têm valor maor que Q O tercero quartl, Q 3, pode ser defndo de manera smlar Assm como a medana, mas de uma observação pode satsfazer a defnção dos quarts As seguntes fórmulas podem ser utlzadas para calcular o prmero e o tercero quarts de um conjunto de dados n Q ésma observação ordenada 4 (3 n ) Q3 ésma observação ordenada 4 q5<-quantle(peso,05) # º quartl q5 5% 085 q50<-quantle(peso,050) # º quartl q50 50% 75 q75<-quantle(peso,075) # 3º quartl q75 75% Gráfco BOX-PLOT O gráfco tpo Box-plot é um recurso vsual útl de comuncação da nformação contda em conjunto de dados O objetvo de um gráfco tpo Box- Plot é mostrar as prncpas característcas de um conjunto de dados Para nterpretar um gráfco Box-Plot adequadamente, os valores devem ser vsualzados como pontos de lnha horzontal/vertcal localzada no centro do Estatístca Expermental

19 gráfco Valores grandes correspondem a grandes pontos na horzontal/vertcal Exstem três componentes mportantes no gráfco Box-plot: A caxa, a qual contém 50% dos valores, começa no prmero quartl Q e termna no tercero quartl, Q 3 As duas pontas (whskers), se extendem acma e abaxo da caxa até a localzação da maor e da menor observação que estão dentro da dstânca de 5 vezes o ntervalo nterquartl Os valores atípcos outlers, são os valores fora das pontas Exemplo: Consdere os dados a segur, os quas se referem a peso (g) de tumores cancerígenos extraídos do abdome de 57 cães O conjunto ordenado fca: Assm, a menor e a maor observação é e 79, respectvamente O número de observações é 57 O prmero quartl é a observação 8 e o tercero quartl 57 Q 45 (4,5 ) 5 g, 4 Scrpt no R para os cálculos acma (3 57 ) Q (43,5 ) 46,5 g 4 # entrando com os dados ptumor <- c(68, 63, 4, 7, 30, 36, 8, 3, 79, 7, +, 3, 4, 5, 44, 65, 43, 5, 74, 5, + 36, 4, 8, 3, 8, 5, 45,, 57, 5, +, 3, 49, 38, 4, 7, 3, 50, 38,, + 6, 4, 69, 47, 3,, 43, 7, 49, 8, + 3, 9, 46, 30, 43, 49, ) mnptumor <- mn(ptumor) # mínmo do vetor ptumor mnptumor [] maxptumor <- max(ptumor) # máxmo do vetor ptumor maxptumor [] 79 ampltude<-maxptumor-mnptumor # ampltude Estatístca Expermental

20 9 ampltude [] 67 q0 <- quantle(ptumor,00) # quantl 00 q0 0% 4 q <- quantle(ptumor,05) # quartl 05 q 5% 5 q <- quantle(ptumor,050) # º quartl 050 q 50% 3 q3<- quantle(ptumor,075) # 3º quartl 075 q3 75% 46 medana<- medan(ptumor) # medana medana [] 3 # reparem que a medana é gual ao segundo quartl # cálculo dos 3 quarts (05, 050, 075) de uma únca vez quarts <- c(05,050,075) quantle(ptumor,quarts) 5% 50% 75% summar(ptumor) # função summar( ) Mn st Qu Medan Mean 3rd Qu Max # gráfcos pela função boxplot() boxplot(ptumor) # gráfco default # ncrementando o gráfco boxplot(ptumor, + col=, # colocando cor no gráfco + horzontal= T, # na posção horzontal + man= "Gráfco Box-Plot") # colocando título prncpal Gráfco produzdo pela últma função boxplot( ) Estatístca Expermental

21 0 O exame deste Gráfco revela que 50% das observações estão no retângulo entre os valores do Q=5 e Q3=46,5 A lnha vertcal dentro da caxa representa o valor da medana, Q, a qual é 3 A longa cauda a dreta do gráfco ndca que a dstrbução de peso de tumores é levemente assmétrca à dreta O símbolo da bolnha ndca que exste uma observação atípca neste conjunto de dados, observação cujo valor é 79, com uma probabldade de ocorrênca muto baxa 335 Meddas da forma da dstrbução As meddas da forma de uma dstrbução são os coefcentes de assmetra (skewness) e curtoss (kurtoss) Assmetra é uma medda da assmetra da dstrbução de freqüênca Ela mostra se os desvos da méda são maores de um lado do que do outro lado da dstrbução Ela é dada por n 3 n ass ( n )( n ) s Para uma dstrbução smétrca o coefcente de assmetra é zero Ela é postva quando a cauda da dreta é mas alongada e negatva quando a cauda da esquerda é mas alongada a) b) Fgura 33 Ilustrações da assmetra a) negatva e b) postva Curtoss é uma medda da forma das caudas de uma dstrbução Ela é dada por n 4 ( n n ) (3 n ) ct ( n )( n )( n 3) s ( n )( n 3) Para varáves, tas como, peso, altura ou produção de lete, espera-se que a dstrbução de freqüênca seja smétrca em torno da méda e tenha a forma de um sno Estas são as dstrbuções normas Se as observações têm dstrbução normal então a curtoss é gual a zero (ct = 0) Uma dstrbução com curtoss postva tem uma grande freqüênca de observações próxmas da Estatístca Expermental

22 méda e caudas fnas Uma dstrbução com curtoss negatva tem as caudas mas grossas e uma baxa freqüênca de dados perto da méda No R pode-se defnr funções para executar tarefas que requer mas de um passo Funções pode smplfcar a dgtação, organzar nossos pensamentos, e salvar o nosso trabalho para reutlzação No R, uma função tem um nome (usualmente), uma regra (o corpo da função), um amanera de defnr as entradas (os argumentos da função), e uma saída ( 0 últmo comando avalado) Funções no R são cradas com palavra-chave functon ( ) Por exemplo: o scrpt no R para os cálculos dos coefcentes de assmetra e curtoss, podem ser fetos por meo de funções, como se segue: # defnndo uma função para o cálculo do coef de assmetra (tem 335) ass<-functon(x){ # defnndo a função + m3<-sum((x-mean(x))^3) # nco do corpo da função + s3<-sd(x)^3 + n <- length(x) + coef<- n/((n-)*(n-)) + coef*m3/s3 } # térmno do corpo da função ass(ptumor) # saída da função ass( ) [] # defnndo uma função para o cálculo do coef de curtoss ct <-functon(x) { + m4<-sum((x-mean(x))^4) # nco do corpo da função + s4<-sd(x)^4 + n<-length(x) + coef<-n*(n+)/((n-)*(n-)*(n-3)) + coef<- 3*(n-)^/((n-)*(n-3)) + coef*m4/s4 - coef} # térmno do corpo da função ct(ptumor) # saída da função [] A segur defnmos uma função ed( ) a qual calcula grande parte das estatístcas descrtvas de uma varável # defnndo uma função ed( ) que calcula todas as estatístcas descrtvas ed<-functon (x) { # nco da funçao + meda<-mean(x) # cálculo da méda + dp<-sd(x) # cálculo do desvo padrão + mnmo<-mn(x) # cálculo do mínmo + maxmo<-max(x) # cálculo do máxmo + q<-quantle(x,05) # cálculo do quartl + medana<-medan(x) # cálculo da medana q + q3<-quantle(x,075) # cálculo do tercero quartl + cv<-sd(x)/mean(x)*00 # cálculo do coef varação + m3<-sum((x-mean(x))^3) # cálculo do coef de assmetra + s3<-sd(x)^3 Estatístca Expermental

23 + n <- length(x) + coef<- n/((n-)*(n-)) + ass<-coef*m3/s3 + m4<-sum((x-mean(x))^4) # cálculo do coef curtoss + s4<-sd(x)^4 + n<-length(x) + coef<-n*(n+)/((n-)*(n-)*(n-3)) + coef<- 3*(n-)^/((n-)*(n-3)) + ct<-coef*m4/s4 - coef + # defnndo a saída + c(mínmo=mnmo,q=q,méda=meda,medana=medana,desv_pad=dp, + Q3=q3,máxmo=maxmo,CV=cv,Assmetra=ass,Curtoss=ct) + } # fnal da função ed( ) # aplcando a função ed( ) aos dados de ptumor round(ed(ptumor),) # a função round( ) controla as casas decmas Abaxo estão estas estatístcas calculadas pela função ed( ) aplcada aos dados do tumor armazenados no objeto mínmo Q5% medana desv_pad Q375% máxmo CV Assmetra Curtoss 08 0 Alternatvamente,város pacotes dsponblzam o cálculo das estatístcas descrtvas, dentre estes destacamos o pacote pastecs, e dentro deste pacote temos a função statdec ( ) Uma aplcação é apresentada a segur: lbrar(pastecs) # requrendo o pacote pastecs # usando o commando round ( ) junto com statdesc( ) # para arredondar para casa decmal round(statdesc(ptumor,basc=false,norm=t),) medan mean SEmean CImean095 var stddev coefvar skewness skewse kurtoss kurtse normtestw normtestp 00 Para uma melhor compreensão desta função basta aconar a ajuda no R, dgtando?statdec( ), ou help(statdec) 336 Hstograma e Box-Plot O gráfco do hstograma é outro recurso vsual muto usado para a análse da forma da dstrbução, enquanto que o gráfco Box-Plot mostra as cnco meddas resumo, as contém o mínmo, o º quartl (Q), a medana (Q), o 3º Quartl e a observação máxma No scrpt do R abaxo são apresentados alguns exemplos da função hst( ) e sua correspondênca com o gráfco Box- Plot para os dados ptumor Estatístca Expermental

24 Frequênca Frequênca hst(ptumor) # gráfco default do hstograma # hstograma com mas opções hst(ptumor, + col="lght blue", # colocando a cor azul + xlab=" Classes de Peso (g)", # título do exo x + lab="frequênca", # título do exo + nclass=8, # número de colunas + border="dark blue") # colocando bordas no gráfco Saída fornecda pelo scrpt acma Hstograma Classes de Peso (g) Apresentação do hstograma e do Box-Plot juntos em uma mesma janela gráfca par(mfrow=c(,)) #dvdndo a janela gráfca em lnhas e coluna # hstograma hst(ptumor, + col="lght blue", # colocando a cor azul + xlab=" Classes de Peso (g)", # título do exo x + lab="frequênca", # título do exo + nclass=8, # número de colunas + border="dark blue", # colocando bordas no gráfco + man="hstograma") # título prncpal # gráfco box plot boxplot(ptumor, + col=, # colocando cor no gráfco + horzontal= T, # na posção horzontal + man="gráfco Box-Plot") # colocando título prncpal Hstograma Classes de Peso (g) Gráfco Box-Plot mín Q medana Q3 máx (dado atípco outler ) Ilustração das 5 meddas resumo lustradas no gráfco Boxplot Estatístca Expermental

25 Número médo (±sd) Gráfcos para dados com uma classfcação é uma ferramenta muto útl na ánalse exploratóra de dados Consdere a questão nº da ª Lsta de exercícos, apresentada ao fnal da Aula Nesta questão é solctado a construção do gráfco de barras para cada tpo de comda O scrpt no R para construr estes gráfcos é: # entrando com as observações por tpo de comda moscascr <- c(5,0,3,6,,,3,33,38,8,5,0,,3,9,6, 40,0,9,3) moscassu<-c(6,9,0,,,,3,,5,6,,7,3,0,8,9,9,9,9,9) #calculando a méda para cada tpo de comda medacr<-mean(moscascr) medacr [] 5 medasu<-mean(moscassu) medasu [] 05 # reunndo as duas médas em um únco vetor meda<-c(medacr,medasu) #calculando o desvo-padrão para cada tpo de comda dpcr<-sd(moscascr) dpcr [] dpsu<-sd(moscassu) dpsu [] 6940 # reunndo os dos dp em um únco vetor dp<-c(dpcr,dpcr) # gráfco de barras do valor médo de cada tpo de comda barmoscas<-barplot(meda, cexnames=07, xlab="comda",col=c(,3), + lab="número médo (±sd)", lm=c(0,max(meda+*dp))) # colocando os exos do desvo-padrão no gráfco de barras arrows(barmoscas,meda-dp, barmoscas,meda+dp, length=0, angle=90, code=3) O scrpt acma fornecendo o segunte gráfco: 4 Exstem outros tpos de gráfcos que ajudam a entender a dstrbução dos dados Uma forma útl de se fazer sto para um conjunto de dados é com o Comda Estatístca Expermental

26 gráfco caule-e-folha (stem-and-leaf plot), o qual é uma manera de codfcar um conjunto de valores que mnmza a escrta e dá uma déa de como a ampltude e a dstrbução dos dados Cada observação é representada de uma manera bem compacta A função que faz o gráfco caule-e-folha no R é a stem( ) Aplcando esta função aos dados das moscas temos: stem(moscascr) The decmal pont s dgt(s) to the rght of the stem(moscassu) The decmal pont s dgt(s) to the rght of the Um número como 6 será escrto como como para o caule e 6 para a folha Um alternatva ao gráfco caule-e-folha é o gráfco de pontos (dot plot), o qual é feto pela função DOTplot ( ) avalável no pacote UsngR Usando esta função nos dados das moscas temos: lbrar(usngr) par(mfrow=c(,)) # dvdndo a janela gráfca em duas lnas e coluna DOTplot(moscascr,man="Grafco Dot Plot do nº de moscas na Comda regular") DOTplot(moscassu,man="Grafco Dot Plot do nº de moscas no Suco de uva") Cuja saída fornecda pelo R é Grafco Dot Plot do nº de moscas na Comda regular moscascr Grafco Dot Plot do nº de moscas no Suco de uva moscassu 37 Coefcente de varação (CV) Estatístca Expermental

27 O desvo-padrão é útl como medda de varação dentro de um conjunto de dados Quando desejamos comparar a dspersão de dos conjuntos de dados, a comparação dos desvos-padrões dos dos conjuntos de dados pode nos levar a conclusões falsas Pode acontecer que as duas varáves envolvdas estão meddas em undades dferentes Por exemplo, podemos estar nteressados em saber se os níves do soro de colesterol, meddo em mlgramas por 00 ml são mas varáves do que o peso corporal, meddo em klograma O que é necessáro nesta stuação é o uso de uma medda de varação relatva do que uma medda absoluta Tal medda é o COEFICIENTE DE VARIAÇÃO (CV), a qual expressa o desvo padrão como uma porcentagem da méda, e sua fórmula é s cv (00)%, a qual é uma medda ndependente da undade Exemplo: consdere os valores abaxo de méda e desvo-padrão de dos grupo de cães, dentfcados pelas suas dades Amostra Amostra Grupo 0 anos 4 anos Peso médo Desvo-padrão 0 0 Uma comparação dos seus respectvos desvos-padrões leva a uma conclusão de que as duas amostras têm a mesma varabldade Se calcularmos os coefcentes de varação, para o grupo 0 cv ( 00) 6, 9% 45 e para o grupo, 0 cv ( 00), 5%, 80 e comparando estes resultados temos uma mpressão bem dferente O grupo tem uma varabldade de,8 vezes maor em relação ao grupo O coefcente de varação é muto útl na comparação de resultados obtdos por dferentes pesqusadores que nvestgam a mesma varável Vsto que o coefcente de varação é ndependente da undade, ele é útl para comparar a varabldade de duas ou mas varáves meddas em dferentes undades No R é necessáro defnr uma função para o cálculo do CV Nos dados das moscas temos: # defnndo uma função para o cálculo do coefcente de varação cv <- functon(x) sd(x)/mean(x)*00 # aplcando a função aos dados das moscas temos cv(moscascr) [] cv(moscassu) [] Assm, pelos resultados acma vemos que o conjunto de dados do nº de moscas da comda regular tem menor varabldade do que o conjunto do nº de moscas do suco de uva 6 Estatístca Expermental

28 7 4ESTATÍSTICA EXPERIMENTAL 4 INTRODUÇÃO Numa pesqusa centífca o procedmento geral é formular hpóteses e verfcá-las dretamente ou por suas conseqüêncas Para sto é necessáro um conjunto de observações e o planejamento de expermentos é então essencal para ndcar o esquema sob o qual as hpóteses possam ser verfcadas com a utlzação de métodos de análse estatístca que dependem da manera sob a qual as observações foram obtdas Portanto, planejamento de expermentos e análses dos resultados estão ntmamente lgados e devem ser utlzados em uma seqüênca nas pesqusas centífcas das dversas áreas do conhecmento Isto pode ser vsto por meo da segunte representação gráfca da crculardade do método centífco () Observações () (3) Formulação de Hpóteses Verfcação das Hpóteses formuladas (4) Desenvolvmento da Teora Fca evdente nesta lustração que as técncas de planejamento devem ser utlzadas entre as etapas () e () e os métodos de análse estatístca devem ser utlzados na etapa (3) Desenvolvendo um pouco mas está déa podemos dzer que uma pesqusa centífca estatstcamente planejada consste nas seguntes etapas: Enuncado do problema com formulação de hpóteses Escolha dos fatores (varáves ndependentes) que devem ser ncluídos no estudo 3 Escolha da undade expermental e da undade de observação 4 Escolha das varáves que serão meddas nas undades de observação 5 Determnação das regras e procedmentos pelos quas os dferentes tratamentos são atrbuídos às undades expermentas (ou vceversa) 6 Análse estatístca dos resultados 7 Relatóro fnal contendo conclusões com meddas de precsão das estmatvas, nterpretação dos resultados com possível referênca a outras pesqusas smlares e uma avalação dos tens de a 6 (desta pesqusa) com sugestões para possíves alterações em pesqusas futuras Ilustrações destas etapas com exemplos Enuncado do problema Como vmos uma pesqusa centífca se nca sempre com a formulação de hpóteses Essas hpóteses são prmeramente formuladas em termos centífcos dentro da área de estudo (hpótese centífca) e em seguda em termos estatístcos (hpótese estatístca) Deve haver uma correspondênca perfeta entre as hpóteses centífca e estatístca para evtar ambgüdade Portanto, no enuncado do problema, a hpótese centífca deve ser formulada de manera precsa e objetva Estatístca Expermental

29 Exemplo:Um pesqusador está nteressado em estudar o efeto de város tpos de ração que dferem pela quantdade de potásso no ganho de peso de determnado tpo de anmal Este objetvo pode ser atngdo se planejarmos a pesqusa com uma das seguntes fnaldades: a) comparar as médas dos aumentos de peso obtdas com cada uma das rações (gualdade das médas); b) Estabelecer uma relação funconal entre o aumento do peso médo e a quantdade de potásso Escolha dos fatores e seus respectvos níves No exemplo apresentado em, a varável ndependente ração é um fator e os tpos de rações são os níves deste fator, ou tratamentos Assm, em um expermento para se estudar o efeto de 4 rações e 3 suplementos no ganho de peso de anmas, temos dos fatores: ração com quatro níves e suplementos com 3 níves Podemos dzer que este expermento envolve tratamentos, correspondentes às combnações dos níves dos dos fatores Pelo própro conceto de fator, temos que em um expermento, a escolha dos fatores e seus respectvos níves é bascamente um problema do pesqusador No entanto é mportante para o planejamento e análse dstngurmos as duas stuações, descrtas a segur: a) uma fazenda de nsemnação adquru 5 touros de uma determnada raça para a produção de sêmen, e está nteressada em realzar um expermento para verfcar se os cnco touros são homogêneos quanto a produção de sêmen b) A mesma fazenda de nsemnação está nteressada em realzar um expermento para verfcar se a produção de sêmen de touros, de uma determnada raça, é homogênea Como a população de touros da fazenda é muto grande o pesqusador decdu realzar um expermento com uma amostra de touros (5 touros), mas as conclusões devem ser estenddas para a população de touros Na stuação descrta em a) dzemos que o fator touro é fxo e na stuação em b) o fator touro é aleatóro A dferença fundamental entre estes dos tpos de fatores é, então, que no caso de fatores fxos, as conclusões se referem apenas aos níves do fator que estão presentes no expermento No caso de fatores aleatóros as conclusões devem ser estenddas para a população de níves 3 Escolha da undade expermental Em um grande número de stuações prátcas a undade expermental é determnada pela própra natureza do materal expermental Por exemplo, expermentos com anmas, em geral a undade expermental é um anmal Em outras stuações a escolha de outras undades expermentas não é tão evdente, exgndo do pesqusador juntamente com o estatístco algum estudo, no sentdo de escolher a undade expermental mas adequada A escolha de uma undade expermental, de um modo geral, deve ser orentada no sentdo de mnmzar o erro expermental, sto é, as undades devem ser as mas homogêneas possíves, para, quando submetdas a dos tratamentos dferentes, seus efetos, sejam faclmente detectados 8 Estatístca Expermental

30 4 Escolha das varáves a serem meddas As meddas realzadas nas undades expermentas após terem sdo submetdas aos tratamentos consttuem os valores da varável dependente A varável dependente, em geral, é pré-determnada pelo pesqusador, sto é, ele sabe qual varável que ele quer medr O que consttu problema, às vezes, é a manera como a varável é medda, pos dsto dependem a precsão das observações, e a dstrbução de probabldade da varável a qual é essencal para a escolha do método de análse Assm, por exemplo, se os valores de uma varável são obtdos dretamente por meo de um aparelho de medda (régua, termômetro, etc) a precsão das observações va aumentar se, quando possível, utlzarmos como observação a méda de três meddas da mesma undade expermental Com relação à dstrbução de probabldade em mutas stuações as observações não são obtdas dretamente e sm por expressões matemátcas que as lgam a outros valores obtdos dretamente Neste caso, a dstrbução de probabldade das observações va depender da dstrbução de probabldade da varável obtda dretamente e da expressão matemátca que as relacona Portanto, as varáves, necessaramente presentes em um expermento são: a varável dependente, medda nas undades expermentas, e o conjunto de fatores (varáves ndependentes) que determnam as condções sob as quas os valores da varável dependente são obtdos Qualquer outra varável que possa nflur nos valores da varável dependente deve ser mantda constante 5 Regras segundo as quas os tratamentos são atrbuídos às undades expermentas Nas dscussões apresentadas em cada um dos tens anterores a colaboração da estatístca é bem lmtada exgndo-se a essencal colaboração do pesqusador Porém, o assunto dscutdo neste tem é o que poderíamos denomnar de planejamento estatístco de expermento Trata-se das regras que assocam as undades expermentas aos tratamentos e que pratcamente determnam os dferentes planos expermentas, ou seja, a Aleatorzação ou Casualzação Lembramos, neste ponto, que os tratamentos são cada uma das combnações entre os níves de todos os fatores envolvdos no expermento Para que a metodologa estatístca possa ser aplcada aos resultados de um expermento é necessáro que em alguma fase do expermento, o prncpo a ser obedecdo é o da Repetção, segundo o qual devemos ter repetções do expermento para que possamos ter uma medda da varabldade necessára aos testes da presença de efetos de tratamentos ou a estmação desses efetos Aleatorzação Aleatorzação é a desgnação dos tratamentos às undades expermentas, tal que estas têm a mesma chance (mesma probabldade) de receber um tratamento Sua função é assegurar estmatvas não-vesadas das médas dos tratamentos e do erro expermental Nesta fase do planejamento de um expermento já sabemos quas fatores serão estudados e o número de níves de cada fator que estarão presentes no expermento Sabemos anda qual é a undade expermental escolhda e a varável dependente Podemos magnar que de um lado temos um conjunto 9 Estatístca Expermental

31 U de undades expermentas, e de outro, T um conjunto de tratamentos, que podem ser as combnações dos níves de todos os fatores envolvdos Precsamos estabelecer esquemas que assocam subconjuntos de elementos de U a cada elemento de T Vamos apresentar o esquema mas smples Para efeto de notação vamos supor que o conjunto U tem n elementos, o conjunto T tem a elementos, e o número de elementos de U submetdos ao tratamento T é n, com =,,, a, de tal modo que k n n O número de undades expermentas n para cada tratamento T é determnado a partr de nformações sobre a varabldade das undades expermentas em termos da varabldade da varável dependente O plano completamente aleatorzado é um esquema em que as undades expermentas que vão ser submetdas a cada tratamento são escolhdas completamente ao acaso Isto sgnfca que cada undade expermental tem gual probabldade de receber qualquer um dos tratamentos Por exemplo, um pesqusador quer realzar um expermento para estudar o efeto de um resíduo ndustral que é adconado em rações de anmas Ele suspeta que este resíduo contenha uma substânca tóxca, cuja presença no organsmo, produz um aumento relatvo de alguns órgãos, como o fígado, por exemplo Após uma entrevsta com o pesqusador consegumos as seguntes nformações O expermento rá envolver um únco fator, ração, com três níves: t - ração normal, sem resíduo ndustral (grupo controle); t - ração normal com o resíduo tratado, e t 3 - ração normal com resíduo não tratado Portanto, o conjunto T tem três tratamentos Um conjunto U, é formado por um grupo de 8 camundongos todos, recém nascdos, com o mesmo peso ncal e homogêneos com relação às característcas genétcas geras Por sto fo decddo dstrbur completamente ao acaso 6 anmas para cada tratamento A varável dependente (resposta) é o peso relatvo do fígado após 90 das do níco do expermento Uma manera de se proceder ao sorteo é a segunte: enumera-se as undades expermentas de a 8 coloca-se os tratamentos em seqüênca, por exemplo: T T T T T T, T T T T T T, T 3 T 3 T 3 T 3 T 3 T 3 sortea-se uma sequênca de 8 números aleatóros Pode-se obter, por exemplo, a sequênca : 3,,, 5, 8, 6, 4, 5, 9,, 8, 7, 7, 4,, 6, 3, 0 Gerando uma seqüênca de números aleatóros no R: # gerando uma sequenca de números de a 8 x<-seq(:8) x [] # sequenca aleatóra de tamanho 8 de x 30 Estatístca Expermental

32 3 sample(x,8,replace=f) [] Dstrbução das undades expermentas aos tratamentos de acordo com a seqüênca gerada no R Trat Repetções T u 4 u 5 u 7 u 0 u 7 u 8 T u 6 u 3 u u 4 u u 3 T 3 u 9 u u 8 u 6 u 5 u Este plano expermental é mas efcente quanto maor for o grau de homogenedade entre as undades expermentas em termos da varável dependente Se as undades expermentas são heterogêneas o número n de undades expermentas necessáras para uma boa precsão pode ser muto grande Algumas alterações no planejamento descrto, tal como, a ntrodução de blocos, ou smplesmente a utlzação de uma co-varável medda nas undades expermentas, a qual é correlaconada com à varável dependente, podem reduzr consderavelmente o erro expermental Observações: ) o plano expermental completamente aleatorzado não depende do numero de fatores envolvdos e nem da manera pela qual os fatores são combnados ) Exstem alguns fatores que pela própra natureza, mpõe restrções na aleatorzação, porém para efeto de análse, o expermento é consderado completamente aleatorzado Plano expermental em blocos Quando o conjunto U de undades expermentas for muto heterogêneo (em termos da varável ndependente), o plano expermental completamente aleatorzado torna-se pouco precso, pos o erro expermental fca muto grande Em algumas stuações dspomos de nformações segundo as quas, antes da realzação do expermento, é possível agruparmos as undades expermentas mas ou menos homogêneas, em que a é o número de tratamentos envolvdos no expermento Estes subconjuntos são denomnados de blocos Assm, a maor parte da heterogenedade nterna do conjunto U é expressa pela heterogenedade entre blocos A dstrbução das undades expermentas entre os tratamentos obedece a uma restrção mposta pelos blocos, sto é, as a undades de cada bloco são dstrbuídas aleatoramente entre os tratamentos Na análse de um expermento em blocos, além dos fatores de nteresse, deve-se levar em conta o fator expermental bloco, dmnundo desta forma o erro expermental Quanto maor for a heterogenedade entre blocos, maor é a efcênca deste plano expermental em relação ao completamente aleatorzado Exemplo: Um pesqusador deseja testar o efeto de três tratamentos (T, T, T 3 ) no ganho de peso de ovelhas Antes do nco do expermento as ovelhas foram pesadas e ordenadas de acordo com o peso e atrbuídas a 4 blocos Em cada bloco tnham 3 anmas aos quas os tratamentos foram sorteados Portanto, anmas foram usados Repetção Repetção sgnfca que o mesmo tratamento é aplcado sobre duas ou mas undades expermentas Sua função é fornecer uma estmatva do erro expermental e dar uma medda mas precsa dos efetos dos tratamentos O Estatístca Expermental

33 número de repetções requerdas em um partcular expermento depende da magntude das dferenças que o pesqusador deseja testar e da varabldade da varável dependente em que se esta trabalhando 3 Estatístca Expermental

34 º EXERCÍCIO PRÁTICO ESTATÍSTICA EXPERIMENTAL ) Em um estudo genétco, uma almentação regular era colocada em 0 frascos e o número moscas de um determnado genótpo era contado em cada frasco O número de moscas também era contado em outros 0 frascos que contnham suco de uva O número de moscas contados foram: Número de moscas Comda regular Suco de uva (a) Calcule a méda amostral, a varânca amostral, o desvo padrão amostral e o coefcente de varação de cada conjunto de dados Comente Qual destes dos conjuntos de dados tem maor varabldade? (b) Calcule a méda amostral, a varânca amostral, o desvo padrão amostral de cada conjunto de dados utlzando os recursos medatos de sua calculadora (c) Para cada conjunto de dados utlze o R para calcular a méda, a medana, o Q, o Q 3, a observações mínma e máxma, construa os gráfcos do Hstograma, do Box- Plot, do caule-e-folha (stem-plot), do Dot-plot e o gráfco de barras com os desvopadrões para cada tpo de comda Comente os resultados ) Demonstre sua famlardade com a notação da somatóra, desdobrando-as e calculando as seguntes expressões com x =, x = -, x 3 = 4, e x 4 = 5: Dca para o tem (a) 4 (a) 4 x 4 (b) 4 4 x x x x 3 x 4 ( ) x 4 4 (c) ( x 3) (d) ( x 4) (e) ( x 4) 4 (f) x (g) ( x ) (h) ( x 4x 4) 3) Uma observação qualquer do conjunto de dados abaxo pode ser representada por j, com o índce =,, 3 controlando as lnhas e j=,, 3, 4, 5, 6 controlando as colunas Por exemplo, 3 = 00 Calcule as seguntes expressões (fazendo o desdobramento): b) j c) j j d) j j a) C C C 3 C 4 C 5 C 6 L L L j e) j j 4) Os dados a segur referem-se ao nível de glcose em sangue de 0 cães Calcule manualmente e depos utlze o R para calcular: a) méda; b) a medana; c) mínmo e máxmo; d) os quarts Q e Q 3 Construa o hstograma e gráfco tpo Box Plot Comente a respeto da dspersão dos dados 7) Determnações de açúcar no sangue ( mg/ 00ml ) foram fetas em 5 raças de anmas expermentas, sendo 0 amostras por raça Os resultados foram: Raças A B C D E Estatístca Expermental

35 34 Utlze o R para calcular para cada raça: a) méda; b) a medana; c) desvo padrão; d) o erro padrão; e) mínmo e máxmo; f) os quarts Q e Q 3 Construa o hstograma, o gráfco tpo Box-Plot e o gráfco de barras para cada raça Comente a respeto da dspersão dos dados em cada raça Somatóro e Algebrsmo c) Seja Y a varável tempo de recuperação da anestesa de tlápas, com 0 observações: Y = { 7,0; 8,9; 8,7; 0,5; 8,9; 6,; 43,9 } Calcular passo-a-passo: 7 a) b) c) Quadrado da Soma 7 ; e) Suponha k = 5, calcule k ; 7 ; d) Soma de Quadrados f) Consderando-se Y como uma constante, desenvolva algebrcamente o segunte quadrado: n ( ), lembre-se que n n g) Reescreva a expressãos ( ) em função do desenvolvmento do tem f n h) Consdere a varável X tempo (segundos) de ndução da anestesa para as mesmas 7 tlápas, respectvamente: X = {65; 83; 6; 47; 46; 5; 74} Calcule: 7 x n Estatístca Expermental

36 Aula Testes de sgnfcânca Introdução Um dos prncpas objetvos da estatístca é a tomada de decsões a respeto de parâmetros da população com base nas observações de amostras AMOSTRAGEM 35 MÉDIA POPULACIONAL x MÉDIA AMOSTRAL INFERÊNCIA ESTATÍSTICA POPULAÇÃO AMOSTRA Ao tomarmos decsões, é convenente a formulação de Hpóteses relatvas às populações, as quas podem ser ou não verdaderas Exemplo: Um veternáro está nteressado em estudar o efeto de 4 tpos de rações que dferem pela quantdade de potásso no aumento de peso de coelhos H quasquer H 0 : Não exste dferença entre as rações,ou seja, dferençasobservadassão devdas a fatores nãocontrolados : As rações propcam aumentos de pesos dst nt os H 0 é denomnada de hpótese de nuldade, a qual assume que não exste efeto dos tratamentos e H é a contra hpótese Testes de hpóteses ou testes de sgnfcânca São os processos que nos permtem decdr se acetamos ou rejetamos uma determnada hpótese, ou se os valores observados na amostra dferem sgnfcatvamente dos valores esperados (População) Tpos de erros nos testes de sgnfcânca QUADRO RESUMO: condções sobre as quas os erros Tpo I e Tpo II podem ser cometdas Possível ação Condção da H pótese nula H 0 Verdadero H 0 Falsa Rejeção de H 0 Erro Tpo I () Decsão correta Não rejeção de H 0 Decsão correta Erro Tpo II () Erro Tpo I: é o erro cometdo ao rejetar H 0, quando H 0 é verdadera Erro Tpo II: é o erro cometdo ao acetar H 0, quando ela é falsa E P ErroTpoI ; e P ErroTpoII Estatístca Expermental

37 Esses dos erros estão de tal forma assocados que, se dmnurmos a probabldade de ocorrênca de um deles, automatcamente aumentamos a probabldade de ocorrênca do outro Em geral, controlamos somente o Erro Tpo I, por meo do nível de sgnfcânca (daí vem a denomnação de Testes de Sgnfcânca) do teste representado por, o qual é a probabldade máxma com que nos sujetamos a correr um rsco de cometer um erro do Tpo I, ao testar a hpótese H 0 Dado que rejetar uma hpótese nula, (H 0 ), verdadera consttu um erro, parece razoável fxarmos esta probabldade de rejetar uma hpótese nula, (H 0 ), verdadera pequena, e de fato, é sto que é feto Na prátca é comum fxarmos = 0,05 (5%) ou = 0,0 (%) Se, por exemplo, fo escolhdo = 0,05, sto ndca que temos 5 possbldades em 00 de rejetarmos a hpótese de nuldade (H 0 ), quando na verdade ela devera ser não rejetada, ou seja, exste uma confança de 95% de que tenhamos tomado uma decsão correta, esta confabldade é denomnada grau de confança do teste e é representada por - e expressa em porcentagem Nunca saberemos qual tpo de erro estamos cometendo ao rejetarmos ou ao não rejetarmos uma hpótese nula (H 0 ), dado que a verdadera condção é desconhecda Se o teste nos leva à decsão de rejetar H 0, podemos fcar tranqülos pelo fato de que fzemos pequeno e, portanto, a probabldade de cometer o erro Tpo I é bem pequena 3 Teste F para a Análse de Varânca (ANOVA) O teste F é a razão entre duas varâncas e é usado para determnar se duas estmatvas ndependentes da varânca podem ser assumdas como estmatvas da mesma varânca Na análse de varânca, o teste F é usado para testar a gualdade de médas, sto é, para responder a segunte questão, é razoável supor que as médas dos tratamentos são amostras provenentes de populações com médas guas? Consdere o segunte exemplo de cálculo da estatístca F; vamos supor que de uma população normal N(, ) foram retradas, aleatoramente, 5 (n=5) amostras de tamanho 9 (r=9) Calcule as médas das 5 amostras e s 9 ( ) (9 ) ( s s 5 ) Estme por meo da fórmula s, a qual é uma 5 méda das varâncas das amostras e será denomnada de varabldade dentro das amostras ( s ) Estme a varânca populaconal das médas 5 ( D 36, por meo das ) médas das 5 amostras: s 5 De s, estme novamente, usando a relação s s, ou s rs, r denomnada de varabldade entre as amostras ( s ) E Estatístca Expermental

38 Probabldade s Calcule Fc s A estmatva de E D s do numerador fo feta com base em n - = 4 graus E de lberdade (n é o número de amostras) e a estmatva de s D do denomnador fo feta com base em n(r ) = 5(9-) = 40 A repetção deste procedmento amostral mutas vezes gera uma população de valores de F, os quas quando colocados em um gráfco de dstrbução de freqüênca tem o segunte formato 37 Dstrbução F(4,40,005) 95% 5% 0 3 4,6 O valor de F =,6 é o valor acma do qual, 5% dos valores de F calculados têm valor acma dele Este é o valor para um encontrado na Tabela F para 4 e 40 graus de lberdade (veja Tabela F) Dado que as estmatvas da varânca utlzadas no cálculo da estatístca F são estmatvas da mesma varânca, espera-se que o valor de F seja bem próxmo de, a menos que um conjunto de amostras não usual fo retrado Para qualquer conjunto de amostras retradas de n = 5 e r = 9 a probabldade (ou a chance) de um valor de F calculado ser maor ou gual a,6 é 0,05 (5%) ( P [ F,6] 0,05) As hpóteses estatístcas que testamos quando aplcamos o teste F são H 0 : H 0 : ou H : H : A hpótese H 0 estabelece que as duas varâncas populaconas são guas, o que equvale a admtr que as amostras foram retradas da mesma população A hpótese H (contra hpótese, ou hpótese alternatva) estabelece que as varâncas são provenentes de populações dferentes e, mas anda, a varânca da prmera é maor que a varânca da segunda Os valores de F são tabelados em função dos graus de lberdade das estmatvas de s do Estatístca Expermental

39 numerador (n ) e do denomnador (n ) no cálculo da estatístca F e para dferentes valores de níves de sgnfcânca (5%, %, etc) Também podem ser fornecdos por comandos do programa R Os valores teórcos da dstrbução F podem ser faclmente obtdos no R Por exemplo, os valores de F, ( 0, 05, 4, 40 ) ; F( 0, 0, 4, 40 ) são obtdos com os seguntes comandos: # valores teórcos das dstrbuções F(0,05,4,40) qf(-005,4,40) [] qf(-00,4,40) [] (fazer os gráfcos destas dstrbuções com estes valores) Regra de decsão para o teste da estatístca F Todos os possíves valores que o teste estatístco pode assumr são pontos no exo horzontal do gráfco da dstrbução do teste estatístco e é dvddo em duas regões; uma regão consttu o que denomnamos de regão de rejeção e a outra regão consttu o que denomnamos de regão de não rejeção Os valores do teste estatístco que formam a regão de rejeção são aqueles valores menos prováves de ocorrer se a hpótese nula é verdadera, enquanto que os valores da regão de acetação são os mas prováves de ocorrer se a hpótese nula é verdadera A regra de decsão nos dz para rejetar H 0 se o valor do teste estatístco calculado da amostra é um dos valores que está na regão de rejeção e para não rejetar H 0 se o valor calculado do teste estatístco é um dos valores que está na regão de não rejeção O procedmento usual de teste de hpóteses é baseado na adoção de um crtéro ou regra de decsão, de tal modo que = P(Erro tpo I) não exceda um valor pré-fxado Porém, na maora das vezes, a escolha de é arbtrára Um procedmento alternatvo consste em calcular o menor nível de sgnfcânca para o qual a hpótese H 0 é rejetada, com base nos resultados amostras Este valor, denomnado de nível descrtvo do teste ou nível mínmo de sgnfcânca do teste, será denotado por valor de p ( p-value ) Todos os modernos programas computaconas fornecem este valor nos testes estatístcos A representação gráfca a segur mostra uma lustração da regra de decsão do teste F, vsto anterormente, 38 Estatístca Expermental

40 Probabldade Dstrbução F(4,40,005) 95% 5% 0 3 4,6 Regão de não rejeção Regão de rejeção Outro exemplo: Amostras aleatóras smples e ndependentes do nível de glcose no plasma de ratos após uma experênca traumátca forneceram os seguntes resultados para dos tpos de esforços: Esforço : Esforço : Estes dados fornecem sufcente evdênca para ndcar que a varânca é maor na população de ratos submetdos ao esforço do que nos ratos submetdos ao esforço Quas as suposções necessáras para se aplcar o teste? Solução: As varâncas amostras são s 85, 9333 e s 398, 44, respectvamente Suposções: Os dados consttuem amostras aleatóras ndependentes retradas, cada uma, de uma população com dstrbução normal (Esta é a suposção geral que deve ser encontrada para que o teste seja váldo) Hpóteses estatístcas H 0 : H : Cálculo da estatístca s 85,9333 F c,47 s 398,44 Dstrbução do Teste Estatístco: quando H 0 é verdadera a estatístca F tem dstrbução F com n e n graus de lberdade, ou seja, Regra de Decsão: o valor teórco da dstrbução Estatístca Expermental

41 Probabldade Exste duas maneras de tomar a decsão estatístca, ou seja, rejetar ou não rejetar H 0 : ) Pelo procedmento clássco: não rejetar H 0, dado que,47<,896; sto é, o valor de F c =,4 é menor que o valor teórco, F t =,896, portanto o valor de F c obtdo com base nos dados da amostra esta na regão de não rejeção; ) Usando o procedmento do valor- p: não rejetar H 0, o valor-p é 0,685 é maor que fxado anterormente da realzação do expermento O valor de 0,685 refere-se a cauda à dreta da dstrbução F ( 0 05, 9, ) como mostrado na fgura abaxo Dstrbução F(0,95,9,) Area em azul = 0,685 Área em vermelho = 0,05 0,4, Regão de não rejeção Regão de rejeção Conclusão: os dados não fornecem sufcente evdêncas para rejetarmos H 0, ou seja, as varâncas das observações dos esforços e não podem ser consderadas dferentes Scrpt no R para o teste F # entrando com os dados esf<-c(54,99,05,46,70,87,55,58,39,9) esf<-c(93,9,93,50,80,04,8,83,88,95,94,97) varesf<-var(esf) # calculo da varânca dos dados do esforço varesf [] varesf<-var(esf) # calculo da varânca dos dados do esforço varesf [] fc<-varesf/varesf # calculo da estatístca F fc [] 4744 # valor teórco desta dstrbução para alfa=0,05 Estatístca Expermental

42 4 ft<-qf(-005,length(esf)-,length(esf)-) ft [] 8963 # valor de p assocado a estatístca calculada fc valorp<--pf(fc,length(esf)-,length(esf)-) valorp [] 0685 Uma outra forma de se testar esta hpótese é usar a função vartest ( ), ou seja, vartest(esf,esf,alternatve="greater") F test to compare two varances data: esf and esf F = 47, num df = 9, denom df =, p-value = 068 alternatve hpothess: true rato of varances s greater than 95 percent confdence nterval: Inf sample estmates: rato of varances 4744 Exemplo da construção do gráfco de uma dstrbução demarcação do valor teórco de para com a # gráfco da dstrbução xv<-seq(0,4,00) # gerando uma sequênca de números de 0 a 4 v<-df(xv,9,) # gerando os valores de # dstr F(9,) com a sequenca xv plot(xv,v,tpe="l",man="dstrbução F(0,95,9,) ", + lab="probabldade",xlab="",lwd=3) # gráfco da dstrbução F fcr=qf(095,9,) fcr # valor crítco para alfa=5% [] lnes(c(fcr,fcr),c(0,06), + col=,lwd=,pch=) # lnha snalzando o valor crítco # preenchmento da área sob a curva acma do valor crítco polgon(c(xv[xv=605975],605975), + c(v[xv=60975],v[xv==4]),col="red") 4 Análse de varânca Embora o teste F possa ser aplcado ndependentemente, a sua maor aplcação é na análse de varânca dos Delneamentos Expermentas Vamos consderar os seguntes dados de Delneamento Interamente Casualzado, (DIC) Estatístca Expermental

43 4 Repetções Tratamentos 3 4 A,4 5, 4,3,6 B 3, 6, 4,8,9 C,,3 0,8,4 D 0,9 9,8 9,4 8,3 e e T Dentro de um mesmo tratamento o valor observado nas dferentes repetções não é o mesmo, pos estes valores estão sujetos à varação ao acaso ( e ) Quando passamos de um tratamento para outro, os dados também não são guas, pos estes estão sujetos a uma varação do acaso acrescda de uma varação devda ao efeto do tratamento, é, e T Quadro da análse de varânca do DIC Consdere os dados do exemplo anteror, onde tínhamos 4 tratamentos (k=4) e 4 repetções A Tabela da Análse de varânca fca sendo Fonte de varação GL Soma de Quadrados Quadrado médo Estatístca F Entre k - Dentro n - k k r ( ) kr k r k ( ) j j r S QTrat k S QRes kr k Q M Trat Q M Res Total n - k r j ( ) j kr Deste quadro notamos que o Quadrado médo do resíduo estma a varação casual (do resíduo) e Enquanto que o quadrado médo dos tratamentos estma a varação casual (resíduo) acrescda de uma possível varânca devdo ao efeto dos tratamentos ( ), então e T e T F e Se não houver efeto dos tratamentos os dos quadrados médos (Quadrado médo dos tratamentos e quadrado médo do resíduo) estmam a mesma varânca, o que mplca o valor de F,0, e qualquer dferença que ocorra entre os valores médos dos tratamentos é meramente casual 5 Teste t Student Consdere uma outra retrada de amostras repetdas de um determnado tamanho, por exemplo, r = 5 de uma população normal Para cada amostra calcule a méda o desvo padrão, s, o erro padrão da méda s e uma outra estatístca t c s Estatístca Expermental

44 Probabldade Probabldade Grafcamente temos População Normal am ostra s x ( 5 ) s ; s ; t 5 s am ostra am ostram s m ( 5 ) ; s m s ; t 5 m m s Organzando estes mlhares de valores da estatístca t em dstrbução de probabldade teremos a segunte forma Dstrbução t-student com 4 graus de lberdade área 95% área,5% área,5% Valor cr tco: -,77 Valor crítco:,77 Exste uma únca dstrbução t para cada tamanho de amostra Neste exemplo em que r = 5 (repetções = 5),,5 % dos valores de t serão maores ou guas do que,776 e,5% serão menores ou guas do que -,776 Os valores da estatístca t student são apresentados em tabelas (ver Tabela da dstrbução t ) Por exemplo, no exemplo acma, para 4 graus de lberdade, o valor tabelado esperado para t com probabldade de 0,05 (5%) é,77 No R a obtenção dos valores teórcos da dstrbução t-student é dado pela segunte função #valor teórco da dstrbução t-student pela função qt( ) para alfa=005 e 4 #graus de lberdade alfa<-005 qt(-alfa/,4) [] Estatístca Expermental

45 A dstrbução t student converge rapdamente para a dstrbução normal Quanto maor for a amostra maor é aproxmação da dstrbução t student com a dstrbução normal Quando os valores de t são calculados em amostras de tamanho r = 60, estes são bem próxmos dos valores da dstrbução normal Regra de decsão para a estatístca t-student 44 Todos os possíves valores que o teste estatístco pode assumr são pontos no exo horzontal do gráfco da dstrbução do teste estatístco e é dvddo em duas regões; uma regão consttu o que denomnamos de regão de não rejeção e a outra regão consttu o que denomnamos de regão de rejeção Os valores do teste estatístco que formam a regão de rejeção são aqueles valores menos prováves de ocorrer se a hpótese nula é verdadera, enquanto que os valores da regão de não rejeção são os mas prováves de ocorrer se a hpótese nula é verdadera A regra de decsão nos dz para rejetar H 0 se o valor do teste estatístco calculado da amostra (t c ) é um valor que está na regão de rejeção e para não rejetar H 0 se o valor calculado do teste estatístco é um dos valores que está na regão de não rejeção Em partcular, no caso do teste t student a regra de decsão fca sendo: rejeta-se H 0 se t t Outra forma de se tomar decsão sobre rejetar ou não c ( n, ) rejetar H 0 é pelo valor de p assocado ao valor calculado da estatístca t c Se p 0, 05 não se rejeta H 0, caso contráro ( p 0, 05 ) rejeta-se H 0 Neste caso não há necessdade de se consultar a Tabela teórca da dstrbução t-student Exemplo: Em um hosptal veternáro amostras de soro de amlase de 5 anmas sados e anmas hosptalzados foram colhdas Os resultados da méda e dos desvos-padrões foram os seguntes: 0 undades/ ml, 96 undades/ ml, s s 40 undades/ ml 35 undades/ ml Neste exemplo, o erro padrão amostral s da fórmula da estatístca t, será substtuído pelo erro padrão da méda pooled, ou seja, ( r ) s ( r ) s s P ( r )( r ) Cálculos: Suposções: os dados consttuem duas amostras ndependentes, cada uma, retrada de uma população normal As varâncas populaconas são desconhecdas e assumdas guas; Estatístca Expermental

46 H 0 : Hpóteses: ; H : ( Teste estatístco: t c )( ) s p s r r Dstrbução do teste estatístco: quando H 0 for verdadera, o teste segue uma dstrbução t Student com r + r graus de lberdade; Regra de decsão: Rejeta-se H 0 se t t, neste exemplo, t,030; c p c ; ( r r ; ) Cálculo do teste estatístco: prmero o cálculo da varânca amostral 4(40) (35) s p 375 e 4 (0 96) 0 4 tc, ,4 5 Decsão estatístca: não se rejeta H 0, vsto que -,030,88, 030, ou seja,,88 está na regão de não rejeção; Conclusão: com base nestes dados não podemos conclur que as médas das duas populações são dferentes Neste teste o nível mínmo de sgnfcânca do teste é p= 0,069 (p0,05) Scrpt no R para resolver o exemplo acma # defnção das médas, dos desvo padrões e do tamanho das amostras m<-0;m<-96;sd<-40;sd<-35;n<-5;n<- # calculo da varânca pooled vpool<-((n-)*sd^+(n-)*sd^)/((n-)+(n-)) vpool [] 375 # calculo da estatstca t tc<-(m-m)/sqrt(vpool/n+vpool/n) tc [] 9399 # valor de t tabelado a 5% e 35 graus de lberdade alfa<-005 ttab <- qt(-alfa/,35) ttab [] # valor de p correspondente a este valor de t # multplca-se o valor de p por pos o teste é b-lateral valorp <- *(-pt(tc,35)) valorp [] Estatístca Expermental

47 º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL - A tabela abaxo mostra a porcentagem de gordural corporal para város homens e mulheres Estas pessoas partcparam de um programa de controle de peso de três vezes por semana por um ano As meddas referem-se a porcentagem de gordura de seus corpos Homens 3,3 9,0 0,0 8,0 8,06,0 0,0 3,0,0,0 6,0,0 4,0 Mulheres,0 6,0 6,0,0,7 3,,0 8,0 30,0 3,0 a) Faça um gráfco de barras e um gráfco boxplot para cada grupo a) Quas as suposções sob as quas o teste F pode ser aplcado b) Podemos conclur que a varabldade do grupo das mulheres seja maor que o do grupo homens (Use 0, 05 e 0, 0) - Em um estudo, a seguntes contagens de lnfóctos fo obtdo em vacas de dos anos da raça Holsten e de vacas de dos anos da raça Guernses Os resultados estão na Tabela abaxo: Holsten Guernses Calcular: a)- a méda geral, um gráfco de barras para cada raça e um gráfco boxplot para cada raça, a méda de cada raça, a varânca amostral e o desvo-padrão de cada raça; b)- declare as suposções sob as quas o teste t student, para amostras ndependentes, pode ser aplcado; c)- teste se as varâncas das duas populações são guas (Teste F) d)- em função do resultado do teste do tem c) podemos conclur que a contagem de lnfóctos nas duas raças dferem assumndo que as varâncas são desconhecdas e guas? Consdere 5% 3- Retrou-se 5 amostras de tamanho 5 de uma população N(, ) Para cada amostra fo aplcado um antparastáro (tratamentos) Em seguda os pesos dos anmas foram analsados para cada tratamento Teste se exste efeto de antparastáro no peso dos anmas, ou seja, teste a hpótese estatístca, H 0 5 H para j j Os tratamentos (antparastáros) e os pesos, em qulogramas, dos anmas estão dados na tabela abaxo: Tratamentos Neguvon Methrdm TH Haloxon Controle (Méda) ( ) (Varânca) j S (Desvo padrão) S Rotero dos cálculos: a)- Faça uma estmatva da utlzando e pelas fórmulas: s D s s s 5 5 e de s E rs, sendos 5 ( j 5 ) 46 Estatístca Expermental

48 Calcule a estatístca se F e compare com o valor teórco da dstrbução F a 5%, sendo S D s D = varânca dentro dos tratamentos e S E = varânca entre os tratamentos 4- Obter por meo das tabelas das dstrbuções F e t os valores de a)-f F ; F ; F ; F b)- t ( 5, 6, 0, 05 ) ; ( 5, 6, 0, 0) ( 0, 5, 0, 05 ) ( 0, 5, 0, 0) (,, 0, 05 ); F(,, 0, 0) ( 7, 0,05) ; (7, t 0,0) ; (5, t 0,05) ; (6, t 0,05) ; (0, t 0,0) ; (8, t 0,0) ; (faça os desenhos das dstrbuções com os respectvos valores) Fnalmente, obtenha os mesmos valores e os mesmos gráfcos no R 47 Estatístca Expermental

49 Delneamento nteramente casualzado (DIC) Introdução O DIC é mas smples dos delneamentos Os tratamentos se dstrbuem ao acaso em todas as undades expermentas e o número de repetções por tratamento pode ser gual ou dferente O DIC é muto utlzado para estudos de métodos, técncas de trabalhos em laboratóro, ensaos de vegetação e em expermentos com anmas Para sua aplcação, há necessdade que o meo atue de forma unforme em todas as undades expermentas e que estas sejam faclmente dentfcadas para receber o tratamento Vamos começar com um exemplo: Em um estudo do efeto da glcose na lberação de nsulna, espéces de tecdo pancreátco dêntcas foram subdvddas em três grupos de 4 espéces cada uma Três níves (baxo - tratamento, médo tratamento - e alto tratamento - 3) de concentrações de glcose foram aleatoramente desgnados aos três grupos, e cada espéce dentro de cada grupo fo tratado com o nível de concentração de glcose sorteado a eles A quantdade de nsulna lberada pelos tecdos pancreátcos amostrados são as seguntes: 48 Tratamento T T T 3 Total Méda Varânca Repetções 3 4 r,59,73 3,64,97 4 8,93,3 0,9 3,36 4,0 3,49,89 4 3,75 3,44 0, 3,9 4,8 3,87 5,39 4 8,00 4,50 0,54 Total 40,68 Este é um estudo expermental com undades expermentas (amostras de tecdo pancreátco) e k=3 tratamentos Cada tratamento é um nível de fator smples: concentração de glcose Exstem 4 repetções para cada tratamento Os dados, quantdade de nsulna lberada pelo tecdo pancreátco podem ser consderados como três amostras aleatóras, cada uma com r=4 repetções, ou de tamanho r=4 sorteadas de três populações Estatístca Expermental

50 Dado que os tratamentos são desgnados às undades expermentas completamente ao acaso, este delneamento é denomnado de DELINEAMENTO INTEIRAMENTE AO ACASO (DIC) Em geral, em um DIC, um número fxo de k tratamentos são sorteados às N undades expermentas de tal forma que o -ésmo tratamento é sorteado a exatamente r undades expermentas Assm, r é o número de repetções do -ésmo tratamento e r r r r 3 k N No caso em que r são guas, é, r r r r 3 k r, então N rk e o delneamento é balanceado Notação: Repetções 3 j r Total Méda Tratamento 3 r 3 r r j k k k k3 kr k k N=rk Convenções: e representam, respectvamente, o total e a méda do - ésmo tratamento, respectvamente, e representam, respectvamente, o total geral (soma de todas as observações) e a méda geral de todas as observações 49 Quadro da Análse de Varânca (ANOVA) O método da análse de varânca pode ser vsto como uma extensão do teste t de student para amostras ndependentes Como no teste t de amostras ndependentes, o método da ANOVA compara uma medda da magntude da varabldade observada dentro das k amostras com uma medda da varabldade entre as médas das k amostras 3 Modelo matemátco do DIC com efetos de tratamentos fxos O modelo assocado ao DIC com efetos fxos é e, sendo, k j j é a observação na undade expermental que recebeu o -ésmo tratamento na j-ésma repetção; é a méda geral comum a todas as observações defnda como r, com a méda populaconal do -ésmo tratamento; N j Estatístca Expermental

51 restrção o efeto do -ésmo tratamento na varável dependente Y e mede o afastamento da méda em relação a, sto é, ; e e é um erro casual não observável j Pela defnção de e k n 50 acma, temos que este modelo possu a 0, pos, n n( ) n n 0 k k 4 Suposções assocadas ao modelo As suposções usualmente assocadas aos componentes do modelo do DIC são que os e são varáves aleatóras ndependentes e dentcamente j dstrbuídas com dstrbução N( 0, ) Como os j são funções lneares dos e j, das suposções sobre os erros decorre que: E( ) ; j Var( ) ; j j são normalmente dstrbuídos e ndependentes, ou, resumdamente que ~ N(, ) j Portanto, estamos supondo que as observações do expermento a ser analsado correspondem a amostras aleatóras de k populações normas com a mesma varânca e que podem ou não ter médas dferentes A fgura abaxo representa grafcamente esse fato, consderando, no caso, três tratamentos k 3 3 Fgura: Ilustrações das suposções do modelo matemátco assocado ao DIC com um fator fxo 5 Hpóteses estatístcas A Hpótese geral é: H0 : k 0, ou seja, vamos testar a não exstênca de efeto do fator (tratamento) 6 Partção da soma de quadrados Voltemos ao quadro de representação das observações no DIC na págna 30 Podemos dentfcar os seguntes desvos: j, como o desvo de uma observação em relação a méda amostral geral; Estatístca Expermental

52 j, como o desvo da observação em relação à méda de seu grupo ou do -ésmo tratamento;, como o desvo da méda do -ésmo tratamento em relação á méda geral Consderemos a dentdade ( )( j )( ) j, a qual dz que a a varação de uma observações em relação à méda geral amostral é gual à soma varação desta observação em relação à méda de seu grupo com a varação da méda do -ésmo tratamento em que se encontra esta observação em relação à méda geral amostral Elevando-se ao quadrado os dos membros da dentdade acma e somando em relação aos índces e j, obtemos: os duplos produtos são nulos O termo k r k r k ( ) ( ) r( ), j j j j k r j ( ), é denomnado de Soma de Quadrados Total e vamos denotá-lo por SQTO número de graus de lberdade assocado à SQT é kr -, ou N, pos temos N observações e a restrção A componente: k r j k j ( ) 0 r j j ( ), é denomnada de Soma de Quadrados Resdual, representada por SQR, e é uma medda da homogenedade nterna dos tratamentos Quanto mas próxmas estverem as observações dentro de cada grupo (tratamento), menor é a SQR Notem que a magntude da SQR não depende da dferença entre as médas dos tratamentos Consderando apenas o -ésmo tratamento, temos que r j j ( j possu r graus de lberdade Assm, o número de graus de lberdade assocado à SQR é: A componente k k ( r ) ) ( r ) kr k N k, mede a varabldade entre as médas dos tratamentos e por sso é denomnada de Soma de Quadrados Entre Tratamentos, representada por SQTr Quanto mas dferentes entre s forem as médas dos tratamentos, maor será a SQTr Desde que temos k tratamentos e a restrção de que 5 Estatístca Expermental

53 5 k ( r ) 0, A SQTr possu k - graus de lberdade Com esta notação, podemos escrever que: SQT = SQR + SQTr A lustração abaxo mostra como a varação total é partconada em varação entre grupos (tratamentos) e varação dentro dos grupos (erro) Varação Total Varação entre os grupos (tratamentos) Varação dentro dos grupos (erro) 6 Quadrados médos Dvdndo a SQR e SQTr pelos seus correspondentes graus de lberdade, obtemos, respectvamente o Quadrado Médo Resdual (QMR) e o Quadrado Médo Entre Tratamentos (QMTr), sto é, SQR SQTr QMR e QMTr N k k 7 Estatístca e regão crítca do teste A estatístca para o teste é QMTr F c, QMR a qual, deve ser próxmo de se H 0 for verdadera, enquanto que valores grandes dessa estatístca são uma ndcação de que H 0 é falsa A teora nos assegura que F c tem, sob H 0 dstrbução F Snedecor com (k -) e (N k) graus de lberdade Resumdamente, ndcamos: F ~ F sob H c ( k, N K ), 0 Rejetamos H 0 para o nível de sgnfcânca se F, c F( k, N K, ) sendo, F( k, NK, ) o quantl de ordem ( ) da dstrbução F-Snedecor com (k -) e (N k) graus de lberdade Grafcamente temos: Estatístca Expermental

54 53 8 Quadro da análse de varânca (ANOVA) Dspomos as expressões necessáras ao teste na Tabela abaxo denomnada de Quadro de Análse de Varânca (ANOVA) Fonte de varação gl SQ QM F c ( Y ) Tratamentos (Entre) k - r N r Y Resíduo (dentro dos trat) N - k Y j k r j TOTAL N - k r j k ( Y ) Y r ( Y ) j N SQTr QMTr k SQR QMR N k Pode-se provar que: E ( QMR ), ou seja, QMR é um estmador não vesado da varânca ; k r E( QMTr ), ou seja, QMTr é um estmador não ( k ) vesado da varânca se a hpótese H0 : k 0 é verdadera QMTr QMR 9 Detalhes dos cálculos Apresentaremos alguns passos que facltam os cálculos das somas de quadrados da ANOVA ( ) Calcule a correção para a méda CM ; N Calcule a Soma de Quadrados dos Totas (SQT) SQT k r j CM ; j Estatístca Expermental

55 Calcule a Soma de Quadrados Entre os Tratamentos (SQTr) r Y SQTr CM ; r Calcule a Soma de Quadrados Resdual (SQR) pela dferença, sto é, SQR SQT SQTr ; Calcule os Quadrados Médos Entre os Tratamentos (QMTr) e o SQTr SQR Quadrado Médo Resdual (QMR) QMTr e QMR k N k QMTr Calcule F c para tratamentos F c QMR Notem que estas fórmulas computaconas assumem que exste r repetções para o -ésmo tratamento; consequentemente, para um expermento balanceado com r repetções para cada tratamento, r deve ser substtuído por r Estas váras soma de quadrados obtdas nestes cnco passos podem ser resumdas no quadro da ANOVA apresentado no tem 8 Exemplo Vamos consderar os dados apresentados na pg 49 Desejamos testar a hpótese nula H : 0 H : j 3 para pelo m enosumpar j Os cálculos para montarmos o quadro da ANOVA são: temos k = 3, r = 4, e N = 3 x 4 = Então Graus de lberdade: Total N ; Trat k 3 Resduo N k 3 9 (40,68) CM 37, 9 SQT (,59) (,73) (5,39) CM 53,8 37,8 5, 8 ( 8, 93) ( 3, 75 ) ( 8, 00) SQTr CM 48, 0 37, 9 0, SQR SQT SQTr 5, 8 0, 30 4, 98 0, 30 4, 98 QMTr 5, 5 e QMR 0, 55 9 QMTr 4, 98 F c 9, 3 QMR 0, 55 O quadro da ANOVA para a varável nsulna lberada é o segunte: Fonte de var gl SQ QM F c Tratamentos (Entre) 0,30 5,5 9,3 Resíduo (dentro dos tratamentos) 9 4,98 0,55 TOTAL 5,8 Das tabelas das dstrbuções F, temos que 4 57 e F 8 0 O valor F c =9,3 é maor do que estes F(, 9, 0, 05 ), (, 9, 0, 0 ), 54 Estatístca Expermental

56 55 valores tabelados, então rejetamos a hpótese nula H 0 para 0, 0, ou % de probabldade (se é sgnfcatvo a %, logo também é sgnfcatvo a 5%) Podemos conclur que, para um nível de 0, 0, ou %, que a quantdade de nsulna lberada é dferente para pelo menos dos níves de glcose Scrpt da resolução do exemplo da pg 48 no R # # exemplo (DIC) pg 48 # # entrando com o número de repetções r <- 4 # entrando com os dados nsulna <- c(59, 73, 364, 97, 336, 40, 349, 89, 39, 48, 387, 539) # entrando com os níves da nsulna (Tratamentos) trat <- c(rep("baxo", r), rep("medo", r), rep("alto", r)) medageral<- mean(nsulna) # calculando a méda geral medageral [] 339 # aplcando o comando tappl ao objeto nsulna para o cálculo dos # totas dos tratamentos totaltrat <- tappl(nsulna, trat, sum) totaltrat Alto Baxo Medo # aplcando o comando tappl ao objeto nsulna para o cálculo das # médas dos tratamentos medatrat <- tappl(nsulna, trat, mean) medatrat Alto Baxo Medo # aplcando o comando tappl ao objeto nsulna para o cálculo dos # desvo-padrões dos tratamentos desvotrat <- tappl(nsulna, trat, sd) Estatístca Expermental

57 Valores de glcose desvotrat Alto Baxo Medo # fazendo a análse de varânca nsulnaav <- aov(nsulna~factor(trat)) #mprmndo o quadro da anova summar(nsulnaav) #mprmndo o quadro da anova summar(nsulnaav) Quadro da anova fornecdo pelos comandos báscos do R Df Sum Sq Mean Sq F value Pr(F) trat ** Resduals Sgnf codes: 0 *** 000 ** 00 * Notem que os comandos do scrpt acma não fornecem os resultados do da fonte de varação do Total e por outro lado fornecem uma coluna a mas referente a Pr(Fr) com o valor de p (p-value) da estatístca F Este valor deve ser comparado com o valor de probabldade referênca seleconado antes de fazer a análse Geralmente este valor de é fxado em 5% ou % Um gráfco muto prátco no DIC é o Box-Plot para cada tratamento (nível de nsulna), o qual pode ser obtdo pelos comandos # mostrando o s gráfcos box plot para cada tratamento boxplot(nsulna~factor(trat),xlab="nvel de nsulna",col="blue", + lab="valores de glcose", + man="gráfco Box-Plot") Gráfco Box-Plot Alto Baxo Medo Nvel de nsulna Outra forma de obter o quadro da ANOVA é pela função crd( ) do pacote ExpDes Pacotes (packages) ou bblotecas (lbrar) são os nomes mas usados para desgnar conjuntos de funções, exemplos, e documentações desenvolvdas para determnadas tarefas Os comandos báscos do R, por exemplo, estão em uma bbloteca chamada base Exstem númeras bblotecas, algumas já nclusas na nstalação do R No R pode-se encontrar pacotes desenvolvdos pelos responsáves pelo R ou mplementados por Estatístca Expermental

58 usuáros A segur apresentamos o scrpt da nstalação e do uso do pacote ExpDes # nstalando o pacote ExpDes (Expermental Desgns) #nstallpackages("expdes") # requerendo o ExpDes requre(expdes) Carregando pacotes exgdos: ExpDes # sntaxe do comando que faz a ANOVA no ExpDes # crd(treat, resp, qual = TRUE, mcomp = "tuke", sgt = 005, sgf = 005) crd(trat,nsulna,mcomp=f) Analss of Varance Table DF SS MS Fc PrFc Treatament Resduals Total CV = 94 % Shapro-Wlk normalt test p-value: Accordng to Shapro-Wlk normalt test at 5% of sgnfcance, resduals can be consdered normal Podemos chegar a mesma conclusão anterormente, smplesmente analsando o valor de p (PrFc, (p=0,006445)), o qual é bem menor que 0,0 Assm, sem recorrer à tabela F, concluímos que o teste F é sgnfcatvo pelo valor de p (p=0,006445) fornecdo pela função crd() do ExpDes, rejetamos H 0 e concluímos que a quantdade de glcose é dferente para pelo menos dos níves de glcose A função aov( ) armazena os valores da tabela da anova acma na forma matrcal ( x 5) Neste exemplo, nsulnaav é o objeto que recebeu os resultados do quadro da análse de varânca no scrpt R lstado anterormente O esquema das posções de armazenamento dos resultados do quadro da anova do DIC no R é Df Sum Sq Mean Sq F value Pr(F) trat [,] [,] [,3] [,4] [,5] Resduals [,] [,] [,3] Para obter o valor do quadrado médo de resíduo basta dgtar e executar o comando anova(nsulnaav)[,3] Uma forma de se obter ajuda de alguma função no R é por meo da execução do comando??nome da função() Por exemplo, para se obter uma ajuda da sntaxe da função mean( ) deve-se executar o comando??mean() 57 Estatístca Expermental

59 Informações sobre o pacote ExpDes(), basta executar o comando??expdes(), e segur a sequênca de passos ndcados abaxo 58 ExpDes::ExpDes-package/ Index/ Documentaton for package ExpDes verson /ExpDes-package/ crd E a segunte exlcação aparecerá crd(treat,resp,qual=true,mcomp="tuke",sgt=005,sgf=005) em que: treat resp qual Vetor numérco contendo os tratamentos; Vetor numérco contendo a varável resposta; Lógco Se TRUE (default), os tratamentos são assumdos qualtatvos, se FALSE, quanttatvos; mcomp Permte a escolha do teste de comparação múltplo; o default é o teste de Tuke, entretanto, as opções são: o teste LSD ('lsd'), o teste LSD com a proteção de Bonferron ('lsdb'), o teste de Duncan ('duncan'), o teste de Student-Newman-Keuls ('snk'), o teste de Scott-Knott ('sk') e o teste de comparação múltpla bootstrap ('ccboot'); sgt A sgnfcânca a ser usada para o teste de comparação múltpla; o default é 5%; sgf A sgnfcânca a ser usada no teste F da ANOVA; o default é 5%, são os argumentos desta função Exemplo Em um expermento em que se medu o peso corporal (kg), 9 porcos foram dstrbuídos aleatoramente a 4 grupos Cada grupo fo almentado com detas dferentes Deseja-se testar se os pesos dos porcos são os mesmos para as 4 detas Desejamos testar a hpótese nula H : H 0 j 3 4 : para pelo menos umpar j As observações obtdas foram: Tratamento Repetções Deta 60,8 57,7 65,0 58,6 6,7 Deta 68,7 67,7 74,0 66,3 69,8 Deta 3 0,6 0, 00, 96,5 * Deta 4 87,9 84, 83, 85,7 90,3 Temos um expermento desbalanceado com número de repetções desgual para os tratamentos Então, os cálculos para montarmos o quadro da ANOVA são: Graus de lberdade: Total N 9 8; Trat k 4 3 Res N k ( 489, ) CM 5736, 44 9 Estatístca Expermental

60 59 SQT ( 60, 8) 43575, ( 90, 3) CM 0069, , ( 3038, ) ( 3465, ) ( 404, ) ( 43, ) SQTr , , 4007, CM SQR SQT SQTr 43575, 4007, ,07 3,67 QMTr 400,69 e QMR 8, QMTr 40069, F c 69, 89 QmR 8, 4 O quadro da ANOVA para a varável peso (kg) é o segunte: Fonte de var gl SQ QM F c Tratamentos 3 40,07 400,69 69,89 Resíduo 5 3,67 8,4 TOTAL 8 435,75 Scrpt no R para resolver o exemplo Atenção, antes de rodar este scrpt é necessáro remover todos os objetos defndos no scrpt do exemplo com o comando rm(lst=ls(all=true)), ou pelo atalho na aba do menu da janela da console clcar em Msc/Remover todos os objetos Neste exemplo vamos organzar os dados na forma de arquvo que será a forma padrão a ser seguda a partr de agora em dante O prmero passo é montar o arquvo no Bloco de Nota ( notepad ) e gravá-lo no dretóro de trabalho com o nome de extxt na segunte forma: Deta Peso Deta 60,8 Deta 57,7 Deta 65,0 Deta 58,6 Deta 6,7 Deta 68,7 Deta 67,7 Deta 74,0 Deta 66,3 Deta 69,8 Deta3 0,6 Deta3 0, Deta3 00, Deta3 96,5 Deta3 NA Deta4 87,9 Deta4 84, Deta4 83, Deta4 85,7 Deta4 90,3 Este arquvo tem as seguntes característcas: é no formato lnhas e colunas, ou seja, duas colunas: uma denomnada de Deta, a qual recebe os níves dos tratamentos e outra, denomnada de Peso, com os valores do peso corporal dos suínos e lnhas, sendo 5 repetções para cada tratamento e uma para o cabeçalho A últma repetção da Deta3 é uma obeservação perdda mssng value Por sso, fo colocado o códgo NA, ncas de not avalable para dados faltantes Uma observação fnal é sobre o separador das casas decmas, neste caso a vrgula Scrpt no R para análse de varânca # exemplo da Aula 3 (DIC) pg 59 Estatístca Expermental

61 60 # entrando com os dados com o comando readtable( ) dadospeso<-readtable("extxt",header=true,dec=",", nastrngs="na") head(dadospeso) # mprmndo as 6 prmeras lnhas do arquvo Deta Peso Deta 608 Deta Deta Deta Deta 67 6 Deta 687 attach(dadospeso) # colocando o arquvo no camnho de procura # comando tappl() para o cálculo das médas dos tratamentos medadeta <- tappl(peso,deta,mean,narm=t) medadeta Deta Deta Deta3 Deta # comando b() para o cálculo das médas dos tratamentos b(peso,deta,mean,narm=t) Deta: Deta [] Deta: Deta [] Deta: Deta3 [] Deta: Deta4 [] 864 pesoav<-aov(peso~factor(deta))# anova pelo comando aov() summar(pesoav) # mprmndo o quadro da anova Df Sum Sq Mean Sq F value Pr(F) factor(deta) e- *** Resduals Sgnf codes: 0 *** 000 ** 00 * observaton deleted due to mssngness O símbolo *** na frente do valor de p (p=845e-) é o códgo de sgnfcânca fornecdo pelo R No caso ndca que o teste é sgnfcatvo para um valor de muto pequeno em torno de 0,0% requre(expdes) # requerendo o pacote ExpDes Carregando pacotes exgdos: ExpDes crd(deta,peso,mcomp=f) # usando o comando crd() Analss of Varance Table DF SS MS Fc PrFc Treatament e- Resduals Total CV = NA % Estatístca Expermental

62 Shapro-Wlk normalt test p-value: Accordng to Shapro-Wlk normalt test at 5% of sgnfcance, resduals can be consdered normal A forma tradconal de nterpretar o resultado do teste F da anova é consultar as tabelas das dstrbuções F Desta consulta, temos que 3 87 e F 5 47 O valor da estatístca F c =69,89 é bem F( 3, 5, 0, 05 ), ( 3, 5, 0, 0 ), superor que estes valores tabelados, assm, o valor desta estatístca fornecda pelos dados esta na regão de rejeção de H 0, logo rejetamos a hpótese nula H 0 a um nível 0, 0, ou % de probabldade (se é sgnfcatvo a %, logo também é sgnfcatvo a 5%) Atenção! Pode-se chegar a esta mesma conclusão analsando somente pelo valor de p assocado à estatístca F calculada, o qual é apresentado na forma exponecal p=8,45 e- ou p=8,45 x 0 -, bem menor que 0,00, portanto sgnfcatvo a 0,% Grafcamente a regra de decsão fca 6 Evdentemente que o valor 89,88 esta bem a dreta do valor crítco 5,47, assm podemos conclur que, para um nível de 0, 00, ou0, 0%, que os pesos dos porcos são dferentes para pelo menos duas detas Estmadores de mínmos quadrados Nesta seção mostraremos os estmadores dos termos do modelo matemátco do DIC e, os quas são obtdos mnmzando-se a expressão do erro deste modelo j j k r j ( ˆ ), em relação a e, =,, k, sujeto a restrção j j k r 0 Assm procedendo, obtemos os estmadores de, e, dados por ˆ, ˆ e de ˆ ˆ ˆ,,,, k Para construr um ntervalo de confança para a méda de cada tratamento, devemos notar que a estatístca: Estatístca Expermental

63 6 ~ ( t n k ), QMR r é, tem dstrbução t Student com (n k) graus de lberdade Um ntervalo de confança para com um coefcente de confança ( ) é dado pela expressão QM Res IC( ; ) t, ( ; N k ) r sendo, t o quantl de ordem ( ) da dstrbução t Student com (n (, Nk ) k) graus de lberdade, os mesmos graus de lberdade do resíduo da ANOVA Como exemplo, vamos consderar os dados do expermento apresentado no tem, cujos cálculos foram mostrados no tem 0 As médas destes dados são: 8,93 3,75 8,00,3 ; 3,44; 3 4,50 e ; 3,39 do quadro da ANOVA temos os valores de SQR para calcular QMR 0,553 0,37; r 4 o valor de t, 6 ( 0,05,9) Assm, os ntervalos são dados por: 0,553 IC( ; 95%),6 0,84 4 Resumndo temos o quadro a segur Nível baxo de glcose Nível médo de glcose Nível alto de glcose,3 3,44 4,50 IC(, 95%) (,389; 3,07) (,599; 4,8) (3,659; 5,34) Problema: dentfcar quas os níves de glcose (tratamentos) que tveram efetos não nulos sobre a lberação de nsulna dos tecdos Scrpt no R para o calculo dos ntervalos de confança do exemplo Atenção! É necessáro executar novamente o scrpt das págnas 55 e 56 # defnndo os objetos para o cálculo dos IC s # obtenção dos gl do resduo no quadro da anova glr <- anova(nsulnaav)[,] glr [] 9 # obtenção da QMR no quadro da anova qmr <- anova(nsulnaav)[,3] qmr [] Estatístca Expermental

64 63 # ntervalo de confança para o nível baxo de glcose cbaxo <- medatrat[] + qt(c(005, 0975), df = glr) * sqrt(qmr/r) cbaxo [] cbaxo # ntervalo de confança para o nível médo de glcose cmedo <- medatrat[3] + qt(c(005, 0975), df = glr) * sqrt(qmr/r) cmedo [] # ntervalo de confança para o nível baxo de glcose calto <- medatrat[] + qt(c(005, 0975), df = glr) * sqrt(qmr/r) calto [] Como segundo exemplo, vamos consderar os dados do expermento apresentado no tem As médas destes dados são: 303,8 346,50 40,4 60,76 ; 69,30; 3 00,35; , e 4 86,4 e a méda geral é 79,3 5 do quadro da ANOVA temos o valor do QMR para calcular desvo padrão médo para os tratamentos, e 4 é QMR 8,557,3 Para o tercero tratamento o erro padrão 5 r QMR 8,557 médo é, 46 4 r o valor de t( 0, 05; 5 ), 34 Assm, os ntervalos são dados por: 8,557 IC( ; 95%),34 5 e IC( ; 95%),34 8,557 4,3, para,, e 4,46, para 3 Resumndo temos o quadro abaxo Deta Deta Deta 3 Deta 4 60,76 69,30 00,35 86,4, %) (58,0; 63,48) (66,56; 7,04) (97,9; 03,4) (83,50; 88,98) IC( 95 Problema: dentfcar quas as Detas (tratamentos) que tveram efetos não nulos sobre o peso dos suínos Scrpt no R para calcular os IC s do exemplo Antes porém execute novamente o scrpt do R descrtos na págna 59 e 60 # defnndo os objetos para o cálculo dos IC s # defnndo o vetor de repetções dos tratamentos r<- c(5,5,4,5) Estatístca Expermental

65 64 # defnndo os objetos para o cálculo dos IC s # defnndo o vetor de repetções dos tratamentos r<- c(5,5,4,5) # obtenção dos gl do resduo no quadro da anova glr <- anova(pesoav)[,] glr [] 5 # obtenção da QMR no quadro da anova qmr <- anova(pesoav)[,3] qmr [] # ntervalo de confança para a Deta cdeta <- medadeta[] + qt(c(005, 0975), df = glr) * sqrt(qmr/r[]) cdeta [] # ntervalo de confança para a Deta cdeta <- medadeta[] + qt(c(005, 0975), df = glr) * sqrt(qmr/r[]) cdeta [] # ntervalo de confança para a Deta3 cdeta3 <- medadeta[3] + qt(c(005, 0975), df = glr) * sqrt(qmr/r[3]) cdeta3 [] # ntervalo de confança para a Deta4 cdeta4 <- medadeta[4] + qt(c(005, 0975), df = glr) * sqrt(qmr/r[4]) cdeta4 [] Coefcentes de determnação (R ) e de varação (CV) A parte da Soma de Quadrados Total (SQT), a varação total nas observações, que pode ser explcada pelo modelo matemátco do DIC, é denomnada de coefcente de determnação Assm, o coefcente de determnação para modelo do DIC, e, é defndo como j SQTr R x 00% SQT Pode ser verfcado que 0 R 00e que R 00% quando toda varabldade nas observações esta sendo explcada pelo modelo matemátco do DIC A varabldade entre as undades expermentas de expermentos envolvendo dferentes undades de meddas e/ou tamanhos de parcelas pode ser comparada pelos coefcentes de varação, os quas expressam o desvo padrão por undade expermental como uma porcentagem da méda geral do expermento, ou seja, j Estatístca Expermental

66 Da ANOVA sabemos que S S CV x 00% QMR, daí resulta que QMR CV *00 Como exemplo vamos consderar os dados do expermento apresentado no tem, cujos cálculos foram mostrados no tem 0 Neste exemplo temos: SQT 5,8 e SQTr 0,30, então SQTr 0,30 R x 00 67,4% SQT 5,8 QMR 0,55 CV * 00 *00,88% 3,39 Concluímos que 67,4% da varabldade que exste nas observações deste expermento em torno de seu valor médo é explcada pelo modelo matemátco do DIC e este expermento apresenta um coefcente de varação de aproxmadamente % Scrpt no R para calcular os coefcentes de determnação (R ) e de varação (CV) # calculo do CV cv <- sqrt(qmr)/mean(peso,narm=t)*00 cv [] sqtr <- anova(pesoav)[,] # obtenção da SQTr da anova sqtr [] sqr <- anova(pesoav)[,] # obtenção da SQR da anova sqr [] Checando as volações das suposções de normaldade dos dados e da homogenedade das varâncas dos tratamentos Anova De um modo geral, o teste F da ANOVA não é muto sensível às volações da suposção de dstrbução normal Ele também é moderadamente nsensível às volações de varâncas guas, se os tamanhos das amostras são guas e não muto pequenas em cada tratamento Entretanto, varâncas desguas podem ter um efeto marcante no nível do teste, especalmente se amostras pequenas estão assocadas com tratamentos que têm as maores varâncas Exste uma sére de procedmentos para se testar se as suposções da ANOVA são voladas Entre estes temos o teste de Anderson-Darlng, teste de Shapro-Wlks e teste de Kolmogorov-Smrnov, que testam a normaldade da população A gualdade das varâncas (homocedastcdade) pode ser testada pelo teste de Bartlett Com o advento dos modernos computadores, métodos gráfcos são ferramentas muto populares para a vsualzação das volações das suposções teórcas da ANOVA Alguns destes métodos gráfcos mas 65 Estatístca Expermental

67 comumente usados para checar as suposções da ANOVA são baseados em gráfcos dos resíduos Resíduos O resíduo correspondente a uma observação j é defndo como: e ˆ ˆ ˆ, j j j ou seja, o resíduo corresponde á parte da observação que não fo explcada pelo modelo Calculando os resíduos correspondentes a todas as observações de um expermento e analsando-os descrtvamente de forma aproprada, podemos ter alguma ndcação, grafcamente, se as suposções da ANOVA estão sendo satsfetas Gráfco dos resíduos para testar a normaldade Técncas gráfcas para checar se uma amostra de resíduos é provenentes de uma população normal ncluem os gráfcos do Hstograma, do Box Plot, etc Outra mportante técnca é o gráfco q-q normal (quantle-quantle normal plot) O gráfco q-q normal, é um gráfco entre os resíduos e um conjunto de percents devdamente escolhdos da normal padronzada Sob a hpótese de normaldade este gráfco q-q normal deve se aproxmar de uma reta Se o gráfco é sgmóde é uma ndcação de que a população tem as caudas pesadas ou leves A assmetra é ndcada por gráfcos côncavos (assmetra a esquerda) e convexos (assmetra a dreta) O prmero passo na construção de um gráfco q-q normal é o cálculo de n º de resíduos ej pj, a qual é denomnada de probabldade empírca N posto de ej acumulada, e está assocada a todo e j, de tal forma que pj N Como exemplo, a probabldade empírca acumulada assocada ao resíduo, cujo posto é o sexto (seu rank=6) em um conjunto de N=0 resíduos é p=6/ = 0545 O gráfco q-q normal de um conjunto de resíduos é obtdo com o gráfco dos resíduos e j vs q j z ( p j,) sendo que: z é o valor crtco de nível de uma dstrbução normal padronzada Vamos consderar os dados apresentados no tem e construr um gráfco q-q normal para ver se a suposção de normaldade parece razoável para a quantdade de nsulna lberada do exemplo O Quadro abaxo apresenta os dados, o valor estmado pelo modelo, os resíduos e os percents assocados: j Y j Y est e j R(e j ) P j Q j e o gráfco q-q normal ( e x ) fca sendo: j q j j j 66 Estatístca Expermental

68 67 e os gráfcos do Hstograma e do Box Plot dos resíduos fcam: Pelo gráfco qq normal, pelo hstograma e pelo Box-Plot é razoável supor a normaldade para os dados de lberação de nsulna O scrpt do R que fornece os resultados acma são: # extrando os resíduos do objeto pcav resduo <-nsulnaav$res resduo # fazendo o gráfco q-q plot qqnorm(resduo, lab ="Resíduos",man="Gráfco normal de probabldade") qqlne(resduo,lwd=) # dvdndo a tela gráfca em colunas e uma lnha par(mfrow=c(,)) # hstograma dos resíduos hst(resduo, man="hstograma dos Resíduos",lwd=,col="green") # gráfco boxplot dos resíduos boxplot(resduo, horzontal=t,man="boxplot dos resíduos", + col="blue",lwd=) Estes recursos gráfcos não são quanttatvos É necessáro um teste O scrpt no R que fornece o teste de normaldade de Shapro-Wlks para testar as hpóteses: Estatístca Expermental

69 68 H 0 : a população amostrada tem dstrução normal H : a população amostrada não tem dstrução normal ou H 0 : e j H : e é dado a segur j ~ N(0, ) não tem N(0, ) # teste de normaldade de Shapro-Wlks dos dados do exemplo shaprotest(resduo) Shapro-Wlk normalt test data: resduo W = 08796, p-value = No resultado fornecdo pelo R e pelo valor de p (p=0,08657) assocado a estatístca W=0,8796 do teste de Shapro-Wlks é não sgnfcatvo,portanto não rejetamos H 0, logo é razoável supor a normaldade para os dados de lberação de nsulna O teste de Bartlett testa as hpóteses H0 : 3, H : j ou seja, a homogenedade das varâncas dos tratamentos O scrpt no R que fornece este teste é # teste de homogenedade das varâncas dos tratamentos dos dados do #exemplo (Teste de Bartlett) bartletttest(nsulna ~ trat) Bartlett test of homogenet of varances data: nsulna b trat Bartlett's K-squared = 7, df =, p-value = 0599 Pelo valor de p=0,599 do teste de Bartlett, este teste não é sgnfcatvo, portanto não rejetamos H 0 Concluímos, então, que a homogenedade das varâncas é uma suposção plausível para os dados da lberação da nsulna Assm é razoável supor que este conjunto de dados suporta as suposções báscas de normaldade e homogenedade da varânca para a correta aplcação da ANOVA 4 Vantagens e desvantagens do DIC As prncpas vantagens do DIC são: é fácl de ser planejado e é flexível quanto ao número de tratamento e de repetções tendo como únca lmtação o número de undades expermentas dsponíves para o expermento; j Estatístca Expermental

70 o número de repetções pode varar de tratamento para tratamento, embora o desejável é ter o mesmo número de undades expermentas em todos os tratamentos; o DIC proporcona o número máxmo de graus de lberdade para o resíduo; a análse estatístca é smples mesmo que se perca algumas undades expermentas Algumas desvantagens são: é mas aproprado para um pequeno número de tratamentos e para um materal expermental homogêneo; todas as fontes de varação não assocadas aos tratamentos farão parte do resíduo, podendo comprometer a precsão das análses; super-estma a varânca resdual 69 5 Resumo O DIC é mas útl onde não exste nenhuma fonte de varação dentfcável entre as undades expermentas, exceto às dos efetos dos tratamentos É o mas flexível com respeto ao arranjo físco das undades expermentas Ele maxmza os graus de lberdade para a estmação da varânca por undade expermental (erro expermental ou erro resdual) e mnmza o valor da estatístca F requerda para a sgnfcânca estatístca Estatístca Expermental

71 70 3º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL - Para avalar o efeto de altos níves de cobre na almentação de pntnhos, ses pntnhos foram almentados com uma deta basal padrão às quas foram adconadas três níves de cobre (0, 400, e 800 ppm) Os dados abaxo mostram a razão da efcênca da deta (g deta/ g ganho de peso) ao fnal de 3 semanas Use o R para apresentar os resultados Tratamentos Pntnhos (nível de cobre) ,57,54,65,57,59,58 400,9,7,55,67,64,67 800,88,6,75,97,78,0 (extraído de Statstcal Research Methods n the Lfe Scence, P V Rao, pg 87) (a) Calcular os totas dos tratamentos +, =,,3, as médas dos tratamentos, os desvos padrões dos tratamentos s, =,,3, o total geral ++, e a méda geral (b) Estabelecer as hpóteses estatístcas H 0 e H e as suposções báscas para se testar estas hpóteses (c) Monte o quadro da anova Estatístca Expermental

72 7 (d) Com base nos resultados do teste F da anova faça as conclusões pertnentes sobre as hpóteses do tem (b) (e) Calcular os ntervalos de confança das médas dos tratamentos IC(µ ; 95%) Apresente os resultados (Sga o modelo da tabela pg 6 da apostla) (f) Calcular os coefcentes: de determnação R e o de varação do expermento (CV) Comente os resultados Estatístca Expermental

73 7 (g) Verfque as suposções báscas da ANOVA Apresente e comente os resultados - Num expermento nteramente casualzado com 5 tratamentos e 4 repetções, estudou-se o efeto de 5 carrapatcdas (tratamentos) no controle de carrapatos em bovnos Analsando- se o número de carrapatos que caram por anmal, obtveram-se as seguntes somas de quadrados: SQ Tratamentos = 4,08 SQ Total = 57,46 Estabelecer as hpóteses estatístcas H 0 e H, montar o quadro de análse de varânca, conclur e calcular o coefcente de determnação R 3- Cte as vantagens e as desvantagens do delneamento nteramente casualzado 4- Escreva o modelo matemátco do delneamento nteramente casualzado para os dados apresentados na ª questão 5- Descreva os procedmentos de um expermento cego, e dos expermentos duplamente cego 6- Quando um expermento será consderado planejado (Descreva as etapas) 7- Quas os prncípos báscos da expermentação Estatístca Expermental

74 Aula 4 Testes de comparações múltplas Introdução Os testes de comparações múltplas também conhecdos como testes de comparações de médas servem como um complemento ao teste F da análse de varânca quando este é sgnfcatvo e são usados para detectar dferença entre médas Consdere o exemplo a segur Exemplo Em um expermento de almentação de porcos, foram utlzados quatro rações (A, B, C e D), cada uma fornecda a 5 anmas Os ganhos de peso, kg, foram: Rações A B C D Calculando-se as somas de quadrados podemos construr o segunte quadro de análse de varânca: FV gl SQ QM F c Rações 3 83,75 74,58 3,99 Resíduo 6 00,00 68,75 Total 9 93,75 Das tabelas das dstrbuções F, temos que 3 4 e F 5 9 O valor F c =3,99 é maor que F( 3, 6, 0, 05 ), ( 3, 6, 0, 0 ), o valor do F tabelado a 5%, então, rejetamos a hpótese nula H 0 a 5 % de probabldade Dúvda: Qual é a ração que tem o melhor desempenho no ganho de peso? Para responder a questão, conheceremos alguns PROCEDIMENTOS DE COMPARAÇÕES DE MÚLTIPLAS ou MÉTODOS DE COMPARAÇÕES DE MÉDIAS, como por exemplo, os testes t-student, Scheffé, Tuke, Duncan, Dunnett e Bonferron, dentre outros Defnções báscas Consderemos um expermento com k tratamentos, cujas médas populaconas são,,, K e seus estmadores,,, k foram obtdas de amostras de tamanhos r, r,, r K k Defnção Um contraste de médas é qualquer função do tpo Y c c c k k, com c c c c k 0 e, é a méda do tratamento =,,, k 73 Estatístca Expermental

75 k a b Defnção Dzemos que dos contrastes são ortogonas se 0 r Quando o expermento é balanceado (r = r) a condção de ortogonaldade é que a soma dos produtos de seus coefcentes é nula, é, a b 0 Quando um expermento envolve k tratamentos, podemos defnr dversas comparações entre as k médas, mas somente (k ) são ortogonas; ( k k ) Nos contrastes envolvendo duas médas podemos defnr contrastes possíves, os quas não são ortogonas Supondo que os tratamentos têm varânca constante e que uma estmatva não vesada desta varânca é o QMR da ANOVA, tem-se que: Y ˆ cx c x c3x 3 c n x é um estmador não vesado do k contraste Y c c c k k ; n V(ˆ Y )( c c cn ) c e um estmador não r r n QMR QMR vesado é dado por V(ˆ Yˆ )( c c cn ) c, r r se o expermento é balanceado r = r = = r K =r, as expressões acma fcam, respectvamente, n V(ˆ Y )( c c cn ) c e r r n QMR QMR V(ˆ Yˆ )( c c cn ) c r r Exemplo Em um expermento dos antbótcos em duas dosagens cada um para a cura da mastte em bovnos A varável resposta é tempo de cura em das Tratamento Descrção T Dose baxa da droga A T Dose alta da droga A T3 Dose baxa da droga B T4 Dose alta da droga B Podemos defnr os seguntes contrastes: Y 3 4 : compara as doses da droga A com as doses da droga B; Y : compara as doses da droga A; Y : compara as doses da droga B A afrmação de que o contraste Y é nulo (Y = 0) é o mesmo que afrmar 3 4 que: 3 4, ou que,, ou anda, que a méda dos tratamentos e é gual à méda dos tratamentos 3 e 4 k 74 Estatístca Expermental

76 75 Para verfcarmos se estes contrastes são ortogonas é aconselhável uma tabela com os coefcentes dos (k ) contrastes e a partr daí, verfcar que a soma dos produtos dos coefcentes, aos pares, é nula Contraste Y Y Y Portanto estes contrastes são ortogonas a dos e ortogonas entre s 3 Teste t - student O teste t student pode ser utlzado para comparar médas de tratamentos Os requstos báscos para sua utlzação são: as comparações devem ser determnadas a pror, ou seja, antes de serem examnados os dados não exste lmte para o número de contrastes envolvendo as médas de tratamentos, porém, o número de contrastes ortogonas é, no máxmo, gual ao número de graus de lberdade dos tratamentos A ortogonaldade entre os contrastes de médas garante ndependênca entre as conclusões O objetvo é testar a hpótese H 0 : Y 0, H : Y 0 Yˆ ˆ Y Usamos a estatístca t ~ ( t, a qual sob k gl re s, ) V(ˆ Yˆ ) QMR c r H 0 verdadera tem dstrbução t-student com o mesmo número de graus de lberdade do resíduo, no DIC é ( n-k ) Para um valor fxado de nível de sgnfcânca, devemos buscar o valor de t tabelado (arquvo Tab_tstudent, dsponblzado na págna ou nos lvros ndcados na bblografa) e compará-lo com o valor da estatístca t c, calculada para o contraste Y e aplcar a regra de decsão: Se t t rejetamos H 0 para um determnado valor de, c Tabelado geralmente 5% ou %, caso contráro ( t t ), não rejetamos c Tabelado H 0 (veja o esquema gráfco desta regra de decsão apresentado no tem 6 da ª Aula) Exemplo : Num expermento nteramente casualzado com 4 tratamentos e 4 repetções, estudaram-se os efetos de Bactracna de znco(bdz) e Ant-stress sobre frangos de corte almentados com rações à base de sorgo, desde a fase ncal até a fnal A resposta medda fo conversão almentar Foram utlzados os seguntes tratamentos: Estatístca Expermental

77 76 Tratamento Descrção Méda(kg) Concentrado Comercal + Mlho,03 Concentrado Comercal + Sorgo,4 3 Concentrado Comercal + Sorgo + BDZ,04 4 Concentrado Comercal + Sorgo + Ant-stress, Sabendo-se que da ANOVA o valor do QMR 0, , com graus de lberdade Pode - se estabelecer os contrastes de médas dos tratamentos para cada componente do desdobramento: Mlho vs sorgos, o qual é expresso pela combnação lnear Y 3, estmado por Yˆ 3 ; Sorgo vs Sorgo + Adtvos, o qual é expresso pela combnação lnear Y 3 4, estmado por Yˆ 3 4 ; Bactracna vs Ant-stress, o qual é expresso por Y3 3 4, etmado por Y3 3 4 ; A verfcação se os contrastes são ortogonas pode ser feta faclmente no quadro abaxo: Contraste 3 4 Y ,4-3,55 (p=0,0098) Y , 6,70 (p=0,0097) Y ,8-3,8 (p=0,00) 3 p< 0,0 sgnfcatvo a % e a 5%; p< 0,05 sgnfcatvo a 5% e p 0,05 não-sgnfcatvo a 5% H 0 : Y 0 O objetvo é testar a hpótese, para =,,3 H : Y 0 Assm, para o contraste Y, temos que: H 0 : Y 0 H : Y 0 Yˆ (3,03)(,4)(,04)(,) 0,4e 4 ˆ QMR 0, V(ˆ Y) c 0,033 r 4 Yˆ 0,4 t c 3, 55 4 QMR 0,033 c r ( t, 0,05), 79 Como tc ttab, então rejetamos H 0 (0,005<p<0,00) (Repetr estes passos para os contrastes Y e Y 3 ) Scrpt do R para o cálculo dos resultados apresentados acma # é necessáro fornecer os valores # defnndo o número de repetções r <- 4 # defnndo os graus de lberdade do resíduo glr <- # quadrado médo do resíduo Ŷ I 4 I c t c Estatístca Expermental

78 qmr < # defnndo as médas dos tratamentos mtrat <- c( 03, 4, 04, ) # defnndo os coefcentes do contraste c <- c( 3, -,-,-) #calculo da varânca do contraste varc<- qmr/r*sum(c^) # cálculo da estatístca tc da estatístca t-student tc <- sum(c*mtrat)/sqrt(qmr/r*sum(c^)) tc [] # cálculo do valor de p assocado à estatstca t calculada anterormente valorp<- -pt(abs(tc),glr) valorp [] (repta este procedmento adaptando-o aos demas contrastes) Com base nos resultados dos testes de hpóteses, concluímos que: os anmas tratados com o concentrado comercal + mlho têm uma conversão almentar melhor do que os anmas tratados com concentrado comercal + sorgo; os anmas tratados com o concentrado comercal + sorgo+adtvos têm uma conversão almentar melhor do que os anmas tratados com concentrado comercal + sorgo, ou seja, os adtvos BDZ e ant-stress quando adconados ao concentrado comercal não melhoram a conversão almentar; os anmas tratados com o concentrado comercal + sorgo+bdz têm uma conversão almentar melhor do que os anmas tratados com concentrado comercal + sorgo+ant-stress 77 4 Teste de Scheffé O teste de Scheffé pode testar qualquer contraste envolvendo médas de tratamentos do tpo Y c c ck k defndo a pror ou não, sendo baseado na estatístca S, defnda como: r r para todo (Expermento balanceado) S ( k ) F ( k ) F ( k, gl res, ) ( k, gl res, ) QMR V(ˆ Yˆ ) k c ; r r r para j (Expermento desbalanceado) j k ( S ( k ) F k, gl res, ) QMR c ; r F( k, gl res, ) Sendo: k o número de graus de lberdade de tratamentos; é o valor crítco da Tabela F-Snedecor, a qual depende dos graus de Estatístca Expermental

79 lberdade de tratamentos e do resíduo; c são os coefcentes do contraste e r é o número de repetções do -ésmo tratamento A Regra de Decsão do teste de Scheffé para rejetarmos ou não se o contraste é dferente de zero é comparar a estmatva do contraste Ŷ com o valor de S: se Y S, rejetamos a hpótese H0 : Y 0, e concluímos que o contraste de médas é dferente de zero; se Y S, não rejetamos a hpótese H0 : Y 0, e concluímos que o contraste de médas não é dferente de zero Aplcando o teste de Scheffé ao exemplo anteror do teste de t-student, temos Contraste 3 4 Ŷ I 4 I Y ,4 0,3733 * Y , 6 0,640 * Y ,8 0,54 ns 3 * sgnfcatvo a 5%; ns não sgnfcatvo a 5% H 0 : Y 0 O objetvo é testar a hpótese, para =,,3 H : Y 0 Assm, para o contraste Y, temos que: H 0 : Y 0 H : Y 0 Yˆ (3,03)(,4)(,04)(,) 0,4e 4 ˆ QMR 0, V(ˆ Y) c 0,033 r 4 0, S (4 ) F(3,,0,05 ) (( 3) ) 4 0, (4 )(3,49)( )() 0,394 0, Pela regra de decsão Y S, logo rejetamos H 0 a 5% de probabldade e concluímos que a ração comercal com mlho tem uma conversão almentar melhor do que a que a ração comercal com sorgo O scrpt no R para o cálculo da estatístca de Scheffé é # é necessáro fornecer os valores # defnndo o número de repetções r <- 4 # defnndo os graus de lberdade dos tratamentos gltr<- 3 # defnndo os graus de lberdade do resíduo glr <- # quadrado médo do resíduo c S 78 Estatístca Expermental

80 79 qmr < # defnndo as médas dos tratamentos mtrat <- c( 03, 4, 04, ) # defnndo os coefcentes do contraste c <- c( 3, -,-,-) # cálculo da estmatva do contraste est<-sum(mtrat*c) est [] -04 # cálculo da varânca do contraste varc<- qmr/r*sum(c^) # cálculo da estatístca S de Scheffé s<- sqrt(gltr*qf(095,gltr,glr)*varc) s [] (Repetr esse procedmento para os contrastes Y e Y 3 e trar as conclusões) 5 Teste de Tuke O Teste de Tuke é baseado na ampltude total estudentzada (studentzed range) e pode ser usado para comparar todo contraste entre duas médas de tratamentos do tpo H 0 : Y j 0 para j Hpóteses: H : Y 0 j Calcular o valor da dferença mínma sgnfcatva (dms): r r para todo (Expermento balanceado) dms q ( k ; gl res, ) QMR r r r dms j para j q( k ; gl res, ) (Expermento desbalanceado) QMR ( ) r r j sendo: q( k, gl res, ) é o valor da ampltude total estudentzada e é obtdo de tabela própra, e depende do número de tratamentos (k) e do número de graus de lberdade para o resíduo, o qual neste exemplo é (n - k) Após calcular o dms, calculamos a estmatva dos contrastes entre os pares de médas Y ˆ x x e comparamos esses valores com o valor do dms, aplcando a j segunte regra de decsão: se Yˆ d m s rejetamos H 0, ao nível a de sgnfcânca, e concluímos que as médas dos tratamentos envolvdos são dferentes; Estatístca Expermental

81 se Yˆ d m s não rejetamos H 0 e concluímos que as médas dos tratamentos envolvdos são guas Exemplo 3: usaremos os dados do exemplo apresentado no níco desta aula, o quadro da anova fornece k = 4, QMR 68, 75 com 6 graus de lberdade e q( 5, 6, 0, 05), QMR 68,75 e dms q( k ; n k, ) 4,046 5, 00 r 5 Assm, toda estmatva de contraste do tpo Y ˆ que exceder o valor do dms= 5,00 é sgnfcatvo a 5% Estmatva do contraste Yˆ B A ns Yˆ C A ns Yˆ 3 D A 6 4 ns Yˆ 4 B C ns Yˆ 39 7 * 5 B D Yˆ 6 C D 3 0 ns * - sgnfcatvo a 5%; ns não sgnfcatvo a 5% Scrpt no R para o cálculo da anova e o teste de Tuke # entrando com os dados de ganho de peso gp <- c(35,9,3,5,30, + 40,35,46,4,33, + 39,7,0,9,45, + 7,,3,8,30) # entrando com o número de repetções dos tratamentos r <- 5 # entrando com os níves dos tratamentos trat <- c(rep("a",r),rep("b",r),rep("c",r),rep("d",r)) trat [] "A" "A" "A" "A" "A" "B" "B" "B" "B" "B" "C" "C" "C" "C" "C" "D" "D" "D" "D" [0] "D" # cálculo das medas dos tratamentos mtrat <- tappl(gp,trat,mean) mtrat A B C D # Gráfco Box-Plot boxplot(gp~trat, vertcal=t,lab="ganho de peso",col="green") j 80 Estatístca Expermental

82 Resduos ganho de peso A B C D # análse da varânca - ANOVA gpav <- aov(gp~factor(trat)) summar(gpav) Df Sum Sq Mean Sq F value Pr(F) factor(trat) * Resduals Sgnf codes: 0 *** 000 ** 00 * # obtendo os resduos resduo <- aov(gpav)$res resduo # gerando o gráfco normal de probabldade qqnorm(resduo,lab="resduos", man="gráfco Normal de Probabldade dos Resíduos", + xlab="quantles Teórcos",pch=6,col=) # colocando a reta da dstrbução teórca normal qqlne(resduo,lwd=) Gráfco da normaldade # testando a normaldade dos resíduos "Teste de Shapro-Wlks" shaprotest(resduo) Shapro-Wlk normalt test data: resduo W = 09387, p-value = Quants teórcos Estatístca Expermental

83 D-C D-B C-B D-A C-A B-A 8 # teste da homogenedade das varâncas "Teste de Bartllet" bartletttest(gp ~ trat) Bartlett test of homogenet of varances data: gp b trat Bartlett's K-squared = 584, df = 3, p-value = # Teste de Tuke comparatu <- TukeHSD(gpav) comparatu Tuke multple comparsons of means 95% faml-wse confdence level Ft: aov(formula = gp ~ factor(trat)) $`factor(trat)` dff lwr upr p adj B-A C-A D-A C-B D-B D-C # grafco do teste de Tuke plot(comparatu) 95% faml-wse confdence level Conclusões desta análse: Dfferences n mean levels of factor(trat) o teste F é sgnfcatvo (p=0,067), rejetamos H 0 Assm exste pelo menos dos tratamentos que dferem entre s o teste de Shapro-Wlks de normaldade é não sgnfcatvo (p=0,7), não rejetamos H 0 e concluímos que os dados deste expermento suportam a suposção de normaldade Estatístca Expermental

84 83 o teste de Bartlett é não sgnfcatvo (p=0,6757), não rejetamos H 0 e concluímos que os dados deste expermento suportam a suposção de homogenedade das varâncas populaconas dos tratamentos o teste de Tuke é sgnfcatvo (p=0,037) para o contraste entre as médas dos tratamentos D e B As outras comparações de pares de médas populaconas dos tratamentos não são sgnfcatvas Uma forma smples de apresentação destes resultados é a segunte: coloque as médas em ordem decrescente; una as médas que não dferem entre s por meo de uma lnha No exemplo temos: D A C B * * médas segudas pela mesma lnha não dferem entre s pelo teste de Tuke a 5% de probabldade Outra forma, muto utlzada pelos pesqusadores é a que substtu a lnha por letras, ou seja, D A C B a 6ab 3ab 39b, médas segudas pela mesma letra mnúscula não dferem entre s pelo teste de Tuke a 5% de probabldade ou anda, na forma Tratamentos D A C B Médas a 6 ab 3 ab 39 b médas segudas pela mesma letra mnúscula nas colunas não dferem entre s pelo teste de Tuke a 5% de probabldade A saída do pacote ExpDes para o teste de Tuke já contempla esta facldade das médas segudas pelas letras O scrpt do R usando os recursos deste pacote é dado por: # usando ao função crd( ) do ExpDes # requerendo o ExpDes lbrar(expdes) crd(trat,gp,qual=t,mcomp="tuke") Analss of Varance Table DF SS MS Fc PrFc Treatament Resduals Total CV = 787 % Estatístca Expermental

85 Shapro-Wlk normalt test p-value: Accordng to Shapro-Wlk normalt test at 5% of sgnfcance, resduals can be consdered normal Tuke's test Groups Treatments Means a B 39 ab C 3 ab A 6 b D Teste de Dunnet (comparando todas as médas com um controle) É um teste no qual as úncas comparações de nteresse são aquelas entre os tratamentos e um determnado tratamento padrão, geralmente a testemunha (controle), não havendo nteresse na comparação dos demas tratamentos entre s Para testarmos o contraste H 0 : c vsh : c, o qual envolve a méda do tratamento e do tratamento controle c, usamos a estatístca: D d ( ( k, gl res, ) ) QMR, r r sendo: d ( k, gl res, ) o valor tabelado para fxado freqüentemente em 5%, que depende do número total de tratamentos (k) (exclundo o controle), do número de graus de lberdade do resíduo (gl res), o qual neste exemplo é (n-k) e de ; r e r c correspondem ao número de repetções dos tratamentos e c A segur, calculamos uma estmatva para cada um dos contrastes Y ˆ e c comparamos o valor da estatístca D' e aplcamos a segunte regra de decsão: se ˆ D rejetamos H 0 e concluímos que a méda do tratamento Y dfere sgnfcatvamente da méda do tratamento c o padrão; se ˆ D não rejetamos H 0 e concluímos que a méda do Y tratamento é gual ao do tratamento padrão c Consdere os dados do exemplo, com o tratamento A sendo o controle, então, k = 3, QMR 68, 75 com 6 graus de lberdade e consultando a Tabela do Teste de Dunnett (VIEIRA, S pg 83 e 84) a 5% de probabldade, temos ( 68, 75) que d ( 3, 6, 0, 05 ), 63 e a estatístca D, 63 3, 79 5 Rações A (controle) B C D méda 6 a 39 a 3 a a Médas com a mesma letra do controle não dferem deste pelo teste de Dunnett a 5% de probabldade c 84 Estatístca Expermental

86 é fácl verfcar que os tratamentos B, C e D não dferem sgnfcatvamente do controle A, ou seja, apresentam resultados semelhantes ao do controle O teste de Dunnett no R está mplementado no pacote multcomp Um exemplo de sua utlzação para os dados do exemplo desta aula, consderando o tratamento A como controle, é dado pelo scrpt abaxo # nstalando o pacote multcomp # nstallpackages("multcomp") # requerendo o pacote multcomp requre(multcomp) # teste de Dunnett gpdunnet<- glht(gpav, lnfct = mcp(trat = "Dunnet")) summar(gpdunnet) Smultaneous Tests for General Lnear Hpotheses Multple Comparsons of Means: Dunnett Contrasts Ft: aov(formula = gp ~ trat) Lnear Hpotheses: Estmate Std Error t value Pr( t ) B - A == C - A == D - A == Sgnf codes: 0 *** 000 ** 00 * (Adjusted p values reported -- sngle-step method) Conclusão: todos os valores de p do teste t-student são superores a 0,05 (p 0,05) logo nenhum dos tratamentos B, C e D dferem do controle A 7 Teste de Duncan A aplcação do teste de Duncan é bem mas trabalhosa que o teste de Tuke, mas chega-se a resultados mas detalhados e se dscrmna com mas facldade entre os tratamentos Geralmente, o Teste de Duncan ndca resultados sgnfcatvos em casos em que o Teste de Tuke não permte obter sgnfcânca estatístca Para a aplcação do teste é mportante ordenarmos as médas dos tratamentos em ordem crescente ou decrescente de tamanho A segur, calculamos o valor da ampltude total mínma sgnfcatva (shortest sgnfcant range) para o contraste entre a maor e a menor das médas dos tratamentos, usando a fórmula: QMR d m s z( p, gl re s, ), r sendo: p=-j+ ( nº de médas abrangdas pelo ntervalo delmtado pelas médas comparadas), z ( p, gl res, ) é o nível da ampltude mínma estudentzada 85 Estatístca Expermental

87 de Duncan (obtdo da Tabela de Duncan arquvo Tab_Duncan_5%pdf), neste exemplo os graus de lberdade do resíduo é n-k A regra de decsão é: se Yˆ d m s rejeta-se H 0, ou seja, se o valor absoluto da dferença entre as médas em comparação é gual ou maor que a dms se Yˆ d m s não rejetamos H 0 Consdere os dados do exemplo O ordenamento dos tratamentos, segundo a grandeza das médas, é: Tratamentos D A C B Médas Os valores do dms para comparar as médas é: nº de tratamentos (k) 3 4 z 3,0 3,5 3,3 ( p, 6, 0, 05 ) dms,,68,98 Teste as dferenças na segunte ordem: a maor méda menos a menor, a maor méda menos a segunda maor, a segunda maor méda menos a menor, segunda maor méda menos a segunda menor méda, e assm por dante Do quadro de médas acma, a dferença entre as médas dos tratamentos D e B envolve 4 médas, assm, esta dferença para ser sgnfcatva Yˆ B , a qual é do que o D dms=,98, o que pela regra de decsão nos leva a rejetar a H0 : Y 0 e concluímos que a méda da Droga B é sgnfcatvamente maor que a méda da Droga D, a 5% de probabldade Em detalhes temos que as outras dferenças são dados por: As comparações entre a méda da Droga B e Drogas A e D, envolvem ntervalos de cnco médas e o calculo do dms do teste de Duncan fca: os contrastes Y B A e Y3 C D envolvem 3 médas, e suas estmatvas em módulo são Yˆ , ; sgnfcat vo ; Yˆ , ; nãosgnfcat vo 3 portanto, rejetamos a hpótese H 0 : Y B A 0 e não rejetam osh 0 : Y3 c D 0 e concluímos que o contraste Y é sgnfcatvo a 5% de probabldade e o contraste Y 3 é não sgnfcatvo a 5% de probabldade Da mesma forma para comparar o controle e as médas das Drogas B vs C, de C vs A e A vs D, todas elas envolvendo médas, temos, 86 Estatístca Expermental

88 os contrastes Y4 B C, Y5 C A e Y6 A D e seus valores de suas estmatvas em módulo são Y ˆ , Y e Y6 6 4 todos menores que, Portanto não rejetamos as hpóteses H 0 : Y4 B C 0; H 0 : Y5 C A 0 e H 0 : Y6 A D 0 e concluímos que estes contrastes não são sgnfcatvos a 5% de probabldade O resultado da aplcação do teste de Duncan é representado da segunte manera: Tratamentos D A C B médas ()b (8)b (0)ab (3)a Médas segudas pela mesma letra mnúscula não dferem entre s pelo teste de Duncan a 5% de probabldade # usando ao função crd( ) do ExpDes # requerendo o ExpDes (atenção!!! se o ExpDes já fo requerdo não é # necessáro requerê-lo novamente # lbrar(expdes) crd(trat,gp,qual=t,mcomp="duncan") Analss of Varance Table DF SS MS Fc PrFc Treatament Resduals Total CV = 787 % Shapro-Wlk normalt test p-value: Accordng to Shapro-Wlk normalt test at 5% of sgnfcance, resduals can be consdered normal Duncan's test Groups Treatments Means a B 39 ab C 3 b A 6 b D Conclusão (somente para o teste de Duncan): O tratamento B dfere sgnfcatvamente dos tratamentos A e D Reparem que o teste de Duncan ndcou uma dferença a mas, entre os tratamentos B e A, a qual não fo ndcada pelo teste de Tuke A função crd( ) do pacote ExpDes fornece outras opções de testes de comparações múltplas para serem colocadas no comando mcomp = " " O teste default é o teste de Tuke ("tuke") As outras opções são o teste LSD equvalente ao teste t-student ("lsd"); o teste LSD com proteção Bonferron 87 Estatístca Expermental

89 88 ("lsdb"); o teste de Duncan ("duncan"); o teste de Student-Newman-Kews ("snk") e o teste de Scott-Knott ("sk") 8 ALGUMAS CONSIDERAÇÕES SOBRE O USO DE PROCEDIMENTOS DE COMPARAÇÕES MÚLTIPLAS Quando desejamos comparar os dversos tratamentos com um tratamento controle ou padrão (testemunha), o teste de Dunnett é o mas ndcado Os testes de Duncan e de Tuke têm fundamentos muto semelhantes, mas o teste de Duncan é menos conservador e menos exgente que o teste de Tuke, sto é, ndca dferenças sgnfcatvas com mas facldade Vale lembrar também que o teste de Duncan é um teste seqüencal e a sua aplcação é mas trabalhosa Ambos os testes são exatos quando os números de repetções por tratamento forem guas; caso contráro os testes são apenas aproxmados O teste t-sudent é pouco rgoroso quando usado ndscrmnadamente, devendo ser usado com cautela para testar contrastes ortogonas defndos a pror Já o teste de Scheffé é bastante rgoroso e seu uso é desaconselhável (como o teste t-student) para a comparação entre duas médas de tratamentos, sendo mas ndcado para testar contrastes que envolvem mas de duas médas O pacote "agrcolae " também pode ser a utlzado para as comparações múltplas A segur é fornecdo um scrpt utlzando este pacote # entrando com os dados de ganho de peso gp <- c(35,9,3,5,30, + 40,35,46,4,33, + 39,7,0,9,45, + 7,,3,8,30) # entrando com o número de repetções dos tratamentos r <- 5 # entrando com os níves dos tratamentos trat <- c(rep("a",r),rep("b",r),rep("c",r),rep("d",r)) # análse da varânca - ANOVA gpav <- aov(gp~trat) summar(gpav) Df Sum Sq Mean Sq F value Pr(F) trat * Resduals Sgnf codes: 0 *** 000 ** 00 * # nstatlando o pacote "agrcolae" # nstallpackages("agrcolae") # requerendo o pacote agrcolae requre("agrcolae") # teste de Tuke comparatuke <- HSDtest(gpav,"trat",group=T) Estatístca Expermental

90 comparatuke $statstcs Mean CV MSerror HSD $parameters Df ntr StudentzedRange $means gp std r Mn Max A B C D $comparson NULL $groups trt means M B 39 a C 3 ab 3 A 6 ab 4 D b # bargroup(comparatuke,man="teste de Tuke", lm=c(0,50), xlab="tratamentos (Rações)") Teste de Tuke a ab ab b B C A D Tratamentos (Rações) # teste de Duncan comparaduncan <- duncantest(gpav,"trat") comparaduncan $statstcs Mean CV MSerror $parameters Df ntr 6 4 Estatístca Expermental

91 $Duncan Table CrtcalRange $means gp std r Mn Max A B C D $comparson NULL $groups trt means M B 39 a C 3 ab 3 A 6 b 4 D b # gráfco de barras das médas com as letras segundo o teste de Duncan # bargroup(comparaduncan,man="teste de Duncan",lm=c(0,50), # xlab="tratamentos (Rações)") Teste de Duncan a ab b b B C A D Tratamentos (Rações) comparascheffe <- scheffetest(gpav,"trat") comparascheffe $statstcs Mean CV MSerror CrtcalDfference $parameters Df ntr F Scheffe $means gp std r Mn Max A B Estatístca Expermental

92 C D $comparson NULL $groups trt means M B 39 a C 3 ab 3 A 6 ab 4 D b # gráfco de barras das médas com as letras segundo o teste de Scheffé #bargroup(comparascheffe, man="teste de Scheffé",lm=c(0,50), # xlab="tratamentos (Rações)") Teste de Scheffé a ab ab b B C A D Tratamentos (Rações) Estatístca Expermental

93 9 4º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL Três extratos de orgem vegetal foram fornecdos a 0 cães por va oral com a fnaldade de testar o possível efeto sobre a pressão arteral sstólca desses anmas Os cães foram dvddos em grupos de cnco anmas, recebendo cada grupo um tpo de extrato, ao acaso, B, C ou D, além de um grupo controle A, tratado com placebo Os dados obtdos foram: Trat(extratos) (Controle) A 74,0 7,0 73,0 79,0 68,0 B 99,0 9,0 94,0 0,0 97,0 C 00,0 95,0 97,0 99,0 98,0 D 78,0 74,0 75,0 86,0 7,0 (a) (b) (c) (d) (e) Cães Totas Médas s Total Geral Escreva o scrpt da lnguagem R para ler os dados da tabela acma e calcular os totas dos tratamentos, as médas dos tratamentos, os desvos padrões dos tratamentos, o total geral, e a méda geral Apresente os resultados na mesma tabela acma Escrever o modelo matemátco do expermento, estabelecer as hpóteses estatístcas H 0 e H e as suposções báscas para se testar estas hpóteses Escreva o scrpt para os cálculos do quadro da análse de varânca e apresente monte o quadro da anova Apresente as conclusões Aplque o teste de Tuke para comparar as médas a Apresente um quadro e um gráfco de barras das médas juntamente com as letras explcando as dferenças Tre as conclusões Aplque o teste de Duncan para comparar as médas a Apresente um quadro e um gráfco de barras das médas juntamente com as letras explcando as dferenças Tre as conclusões (f) Aplque o teste de Dunnett para comparar as médas com o controle A Comente os resultados - A redução da pressão sangüínea sstólca (RPS) depos da admnstração de drogas para hpertensão é um dos ndcadores de como os pacentes estão respondendo às drogas No tratamento da hpertensão, os efetos colateras assocados com as drogas têm um partcular nteresse Neste estudo, duas drogas X e Y para a redução dos efetos colateras de uma droga padrão (P) de hpertensão fo avalada O estudo fo conduzdo em um delneamento nteramente casualzado com cnco tratamentos, assm defndos: T Droga padrão (P) T P combnada com uma dose baxa de X (P+DBX) T 3 P combnada com uma dose alta de X (P+DAX) T 4 P combnada com uma dose baxa de Y (P+DBY) T 5 P combnada com uma dose alta de Y (P+DAY) A redução na pressão sangüínea (mm Hg) em um período de quatro semanas observadas em cães expermentas está tabulada abaxo: Tratamentos Repetção 3 4 Total Méda T T T T T Pede-se: a) A análse de varânca para testar a hpótese geral de gualdade das médas dos tratamentos; b) Aplque os testes t-student e Scheffé nos contrates abaxo: b Exste efeto das drogas combnadas (T T 3 T 4 T 5 ) na RPS? b Exste dferença entre os efetos médos das doses baxa e alta da droga Y? b3 Exste dferença entre a resposta méda esperada das duas doses de X? (extraído de Statstcal Research Methods n the Lfe Scence, P V Rao, pg 37) Estatístca Expermental

94 Aula 5 Testes F planejados No planejamento de um expermento, frequentemente pode-se utlzar o teste F para responder algumas questões mas específcas Isto mplca na decomposção dos graus de lberdade e da soma de quadrados do efeto dos tratamentos em componentes de comparações Estes componentes podem ser classes de comparações ou tendênca das respostas Eles podem ser testados pela partção dos graus de lberdade e da soma de quadrados dos efetos dos tratamentos em contrastes smples e específcos e suas soma de quadrados assocadas O número de contrastes ndependentes e ortogonas que podem ser defndos é gual ao número de graus de lberdade do efeto do tratamento O poder e a smplcdade deste método não são muto aprecados e compreenddos pelos pesqusadores com devera ser Esta metodologa envolve a defnção de contrastes ortogonas, e talvez este termo, cra a mpressão de que ele é complcado e dfícl Isto esta longe de ser verdade Atualmente este método tem três grandes vantagens: permte responder a questões específcas e mportantes a respeto dos efetos dos tratamentos; os cálculos são smples; e, proporcona uma checagem útl da soma de quadrados dos tratamentos Esta metodologa também é denomnada de desdobramento, ou a decomposção dos graus de lberdade de tratamentos Soma de quadrados de um contraste Quando utlzamos contrastes na decomposção dos graus de lberdade dos efetos dos tratamentos usamos a segunte defnção para o cálculo da soma de quadrados: Defnção: a soma de quadrados de um contraste é calculada pela k ( cy ) fórmula (ˆ Y ) SQ( Y ) ou SQ( Y ), sendo: c os k k r c r c coefcentes do contraste; Y os totas dos tratamentos e r o numero de repetções (neste caso r = r = = r k ) e k Y ˆ ( c Y ) é uma estmatva do contraste com base nos totas Observações mportantes: todo contraste tem sempre grau de lberdade, assm QM(Y ) = SQ(Y ) geralmente, testamos H 0 : Y = 0 vs H : Y 0 e para tanto usamos a estatístca F-Snedecor tendo como denomnador o quadrado médo do erro expermental (QMR) os contrastes devem ser planejados a pror e podem ser tão numerosos quanto acharmos necessáro o número de contrastes ortogonas entre os totas dos tratamentos é gual ao número de graus de lberdade assocados a essa fonte de varação, sto é, se o fator tratamento tem k níves então conseguremos defnr somente (k-) contrastes ortogonas 93 Estatístca Expermental

95 se Y, Y,, Y k são contrastes ortogonas envolvendo os totas dos k níves do fator, então SQ Y ) SQ ( Y ) SQ ( Y ) k SQTr ( a ortogonaldade dos contrastes garante a ndependênca entre as conclusões Exemplo : Foram comparados os efetos de cnco tratamentos no crescmento de alevnos de carpas (medu-se o comprmento em cm aos dos meses de dade) em um DIC T ração comum (rc) T ração comum + esterco (rce) T 3 ração comum + esterco de porco + vtamna B (rceb ) T 4 ração comum + farnha de osso (rcfo) T 5 ração comum + farnha de osso + vtamna B (rcfob ) Dados Repetções Trat 3 4 T 4,6 5, 5,8 5,5 T 6,0 7, 7, 6,8 T 3 5,8 7, 6,9 6,7 T 4 5,6 4,9 5,9 5,7 T 5 5,8 6,4 6,8 6,8 Análse de varânca usual Causas da Varação GL SQ QM F Tratamentos 4 7,7,9 7,9 Resíduo 5 4,03 0,7 Total 9,75 F, 5; 0, 05) 3 06 e F( 4, 5; 0, 0 ( 4, ), 4 89 Conclusão: o teste é sgnfcatvo a % de probabldade, portanto rejetamos H 0, os tratamentos apresentam efetos dstntos sobre o crescmento de alevnos de carpas Esta é uma nformação geral sobre os efetos dos tratamentos Para obtermos nformações detalhadas devemos decompor os 4 graus de lberdade dos efetos dos tratamentos em quatro contrastes ortogonas Comparações objetvas: rc vs demas Y ˆ 4T T T rce vs rcfo Y ˆ T rce vs rceb Y ˆ T T 3 T4 T5 4Y Y Y3 Y 4 T3 T4 T5 Y Y3 Y 4 Y5 3 3 Y Y3 rcfo vs rcfob Y ˆ T T Y Y5 94 Estatístca Expermental

96 Contraste Y Y Y 3 Y 4 Y 5 Y Y Y Y Usando a fórmula defnda acma para o cálculo da soma de quadrados dos contrastes temos: ) rc vs demas Y (4,0)7, 6,6, 5,6 7, 6 cm 5 ˆ c (4) ( ) ( ) ( ) ( ) 0 (ˆ Y ) ( 7,4) S Q(ˆ Y ) 3,78 5 (4 0) r c (A obtenção das SQ dos outros contrastes são dexadas como exercícos) A anova com os testes F planejados ou com os desdobramentos dos graus de lberdade do efeto dos tratamentos fca: Causas da Varação GL SQ QM F Pr(F) rc vs demas (Y ) 3,87 3,87 4, rce vs rcfo (Y ),0,0 7, rce vs rceb (Y 3 ) 0,03 0,03 0, Rcfo vs rcfob (Y 4 ),7,7 6, Tratamentos (4) (7,7),9 7, Resíduo 5 4,03 0,7 Total 9,75 F 4, 5; 0, 05 ) 3 06; F( 4, 5; 0, 0) 4, 89; F(, 5; 0, 05 ) 4, 54 e F(, 5; 0, 05 Conclusões: (, ) 95 8, 68 rc vs demas o contraste é sgnfcatvo (p<0,0) e pelo resultado do contraste devemos utlzar rce ou rceb, ou anda, rcfo ou rcfob, quando comparada com a rc rce vs rcfo o contraste é sgnfcatvo (p<0,05) e pelo resultado do contraste verfcamos que rce tem um efeto superor no crescmento dos alevnos, quando comparada com rcfo rce vs rceb - o contraste é não sgnfcatvo (p0,05), portanto o acréscmo de vtamna B à rce (rceb ) não afeta sgnfcatvamente, o crescmento dos alevnos, quando comparada com a rce rcfo vs rcfob o contraste é sgnfcatvo (p<0,05) e pelo resultado do contraste devemos adconar vtamna B à ração comum com farnha de osso,quando comparada com a rcfo Scrpt no R para os cálculos descrtos acma Estatístca Expermental

97 96 # lendo os dados do arquvo compdadostxt dadoscomp<-readtable("compdadostxt",h=t,dec=",") head(dadoscomp) trat comp T 46 T 5 3 T 58 4 T 55 5 T 60 6 T 7 attach(dadoscomp) # fazendo a análse da varânca - ANOVA compav <- aov(comp~factor(trat)) # mprmndo o quadro da ANOVA summar(compav) Df Sum Sq Mean Sq F value Pr(F) factor(trat) ** Resduals Sgnf codes: 0 *** 000 ** 00 * # defnção do nº de repetções r<-4 # Defnção do contraste c <- c(4,-,-,-,-) # contraste rc vs demas # obtenção do QMR no quadro da anova qmr <- anova(compav)[,3] qmr [] # obtenção dos gl do resduo no quadro da anova glr <- anova(compav)[,] glr [] 5 # cálculo dos totas por tratamento ttrat <- tappl(comp,trat,sum) ttrat T T T3 T4 T # estmatva do contraste Y com base nos totas est <-sum(c*ttrat) est [] -76 # cálculo da soma de quadrados sq <- (est^)/(r*sum(c^)) sq Estatístca Expermental

98 97 [] 387 # Cálculo da estatístca F fc <- sq/qmr fc [] 4498 # Cálculo do valor de p assocado à estatístca fc valorp <- -pf(fc,,glr) valorp [] Para obter os resultados referentes aos outros contrastes basta substtur o objeto c na lnha # Defnção do contraste pelo contraste correspondente defndo abaxo e executar todo o scrpt novamente #c <- c(0,,,-,-) # contraste rce vs rcfo #c <- c(0,,-, 0, 0) # contraste rce vs rceb #c <- c(0, 0, 0,,-) # contraste rcfo vs rcfob Estes resultados podem ser obtdos faclmente com o pacote gmodels # nstalando o pacote gmodels # nstallpackages("gmodels") # requerendo o pacote para o ambente R requre(gmodels) # juntando os 4 contrastes no objeto cte cte <-rbnd(c(4,-,-,-,-), c(0,,,-,-), + c(0,,-, 0, 0), c(0, 0, 0,,-)) # calculando a anova com desdobramento dos gl dos tratamentos compav <- aov(comp ~ trat,contrast = lst(trat = makecontrasts(cte))) # mprmndo o quadro da ANOVA summar(compav, splt = lst(trat = :4)) Df Sum Sq Mean Sq F value Pr(F) trat ** trat: C ** trat: C * trat: C trat: C * Resduals Sgnf codes: 0 *** 000 ** 00 * Tratamentos com níves quanttatvos Quando os tratamentos e/ou fatores utlzados num expermento são de natureza qualtatva (raça, sexo, cultvares, tratos culturas etc) os testes de comparações de médas (teste t-student, testes de Tuke, Duncan, Scheffé Estatístca Expermental

99 etc) se aplcam sem restrções A esses casos se equparam os fatores ou tratamentos quanttatvos (doses de uma droga, tempo, etc) quando há só dos níves (presença e ausênca, por exemplo) O mesmo não acontece, porém, quando o tratamento ou fator quanttatvo tem mas de dos níves, por exemplo: doses crescentes de cobre na almentação de galnhas (0, 400 e 800 ppm); doses crescentes de uma droga; 0%, 0%, 40% e 60% de substtução de um ngredente da ração por farelo de soja Em tas stuações é essencal avalar o comportamento da varável resposta ao longo dos níves do fator, através de uma equação de regressão Por exemplo: a equação que assoca a freqüênca cardíaca em função de doses de uma droga é quase sempre desconhecda, mas em geral, pode ser bem estmada por meo de uma equação polnomal do tpo: 3 Y a0 a x a x a3 x, sendo Y, a resposta avalada e x os níves quanttatvos do fator (tratamentos) O ajuste e a nterpretação da equação de regressão quando o polnômo é de grau muto elevado são tarefas bastante complexas Porém, quando os níves do fator quanttatvo são gualmente espaçados, o estudo do comportamento das médas pode ser feto utlzando o método dos polnômos ortogonas, que será apresentado a segur através de um exemplo Exemplo: os efetos de quatro tratamentos no ganho de peso (g) de alevnos de carpas foram comparados em um DIC T ração comum T ração comum + 0 mg de B T3 ração comum + 0 mg de B T4 ração comum + 30 mg de B Dados Repetções Trat ,80 6,50 6,40 6,50 0 7,90 6,60 6,80 6,0 0 8,30 8,40 8,60 9,0 30 9,50 9,80 0,00 0,70 H H 0 : 3 : pelo menos duas médas 4 Análse de varânca usual Causas da Varação GL SQ QM F Tratamentos 3 3,03 0,0 4,3 Resíduo,95 0,5 Total 5 33, F 5 95 F( 3, ; 0, 05 ), ( 3, ; 0, 0), O teste F é sgnfcatvo a % de probabldade, portanto rejeta-se Ho, os tratamentos apresentam efetos dstntos sobre o crescmento dos alevnos de carpas Como os níves são eqüdstantes, 0, 0, 0 e 30 mg a decomposção dos graus de lberdade pode ser feta com uso de polnômos ortogonas, 98 Estatístca Expermental

100 usando-se os coefcentes dos contrastes encontrados em tabelas As tabelas são construídas em função do número de tratamentos, denomnados níves Assm, como temos 4 tratamentos, temos 4 níves e o polnômo máxmo é o de grau 3 Consultando as tabelas dos coefcentes dos polnômos ortogonas (Gomes P, 966, p 34, Sampao, IBM, 998, p 5), podemos montar a segunte tabela Tratamentos Coefcentes para 4 níves (Totas) º grau º grau 3º grau T =6, T =7, T 3 =34, T 4 =40, ci I Assm, para o efeto lnear temos: ˆ Y Lnear ( 3)(6,0)( )(7,50)()(34,50)(3)(40,00) 48,40 ( 3) T ( ) T () T (3) T 3 (48,40) S Q( Y Lnear ) 9,8 (4)(0) (A obtenção das SQ dos efetos quadrátcos e cúbcos são dexados como exercíco) 4 99 A análse de varânca com desdobramento dos graus de lberdade dos tratamentos por polnômos ortogonas Causas da Varação GL SQ QM F Regressão lnear 9,8 9,8 9,3 Regressão Quadrátca,0,0 4,49 Regressão Cúbca 0,65 0,65,64 Tratamentos (3) (3,03) 0,34 4,5 Resíduo,95 0,5 Total 5 33, ; F 5, 95; F 4, 75 e F F( 3, ; 0, 05 ), ( 3, ; 0, 0) (, ; 0, 05 ) (, ; 0, 0) 9, 33 Conclusão: somente a componente do º grau fo sgnfcatva (p<0,0), ou seja, a dferença entre os valores médos dos tratamentos está sendo explcada por uma equação lnear, Y a bx, cujos parâmetros a e b são estmados por: sendo: k X k Y k X Y ˆ k e a Y ˆ b X k ( k X ) X k b ˆ, bˆ e aˆ, os estmadores de mínmos quadrados de b e a, respectvamente, x = 0, 0, 0 e 30 as doses de vtamna B ; = 6,55, 6,80, Estatístca Expermental

101 00 8,63 e 0,00 são os comprmentos médos dos alevnos, para =,, 3, 4 Utlzando essas fórmulas, obtemos a equação Y ˆ 6, 68 0, X Scrpt no R para os cálculos acma # entrando com os dados do arquvo gpdadosquanttatvostxt dadosgpq<-readtable("gpdadosquanttatvostxt",h=t,dec=",") head(dadosgpq) Dose gpeso attach(dadosgpq) # calculando o quadro da ANOVA gpqav <- aov(gpeso~factor(dose)) summar(gpqav) Df Sum Sq Mean Sq F value Pr(F) factor(dose) e-06 *** Resduals Sgnf codes: 0 *** 000 ** 00 * # mprmndo o quadro da anova com o comando anova( ) anova(gpqav) Analss of Varance Table Response: gpeso Df Sum Sq Mean Sq F value Pr(F) factor(dose) e-06 *** Resduals Sgnf codes: 0 *** 000 ** 00 * # obtenção do QMR no quadro da anova qmr <- anova(gpqav)[,3] qmr [] # obtenção dos gl do resduo no quadro da anova glr <- anova(gpqav)[,] glr [] # cálculo dos totas por tratamento ttrat <- tappl(gpeso,dose,sum) ttrat Estatístca Expermental

102 0 # defnndo o nº de repetções r<-4 # Defnção do contraste c <- c(-3,-,,3) # efeto lnear # estmatva do contraste lnear com base nos totas est <-sum(c*ttrat) est [] 484 # cálculo da soma de quadrados sq<- (est^)/(r*sum(c^)) sq [] 98 # calculo da estatístca F fc <- sq/qmr fc [] 9354 # calculo do valor de p da estatístca fc valorp <- -pf(fc,,glr) valorp [] e-07 Para obter os resultados referentes aos outros contrastes basta substtur o objeto c na lnha # Defnção do contraste pelo contraste correspondente defndo abaxo e executar todo o scrpt novamente #c <- c(,-,-,) # efeto quadrátco #c <- c(-,3,-3,) # efeto cúbco Este quadro da anova pode ser obtdo faclmente com o pacote gmodels Não há necessdade de nstalar o pacote gmodels novamente, dado que ele já fo nstalado no scrpt anteror Basta requerê-lo Scrpt no R utlzando o pacote gmodels # requerendo o pacote para o ambente R # requre(gmodels) # juntando os 3 contrastes no objeto cte cte<-rbnd(c(-3, -,, 3), c(, -, -, ), c(-, 3, -3, )) Dose<-factor(Dose) # cálculando a anova com desdobramento dos gl dos tratamentos gpesoav <- aov(gpeso ~ Dose,contrast = lst(dose = makecontrasts(cte))) # mprmndo o quadro da ANOVA summar(gpesoav, splt = lst(dose = :3)) Estatístca Expermental

103 0 Df Sum Sq Mean Sq F value Pr(F) Dose e-06 *** Dose: C e-07 *** Dose: C Dose: C Resduals Sgnf codes: 0 *** 000 ** 00 * Este quadro da anova com os desdobramentos dos graus de lberdade dos tratamentos junto com as equações lnear, quadrátca e cúbca são faclmente obtdos com o pacote ExpDes Scrpt no R utlzando o pacote ExpDes #requrendo o pacote ExpDes requre(expdes) #quadro da anova com o desdobramento dos graus de lberdade dos trat crd(dose,gpeso,qual=f) Analss of Varance Table DF SS MS Fc PrFc Treatament e-06 Resduals Total CV = 68 % Shapro-Wlk normalt test p-value: Accordng to Shapro-Wlk normalt test at 5% of sgnfcance, resduals can be consdered normal Adjustment of polnomal models of regresson $`Lnear Model\n ` Estmate StandardError tc pvalue b b $`R of lnear model` [] $`Analss of Varance of lnear model` DF SS MS Fc pvalue Lnear Effect Lack of ft Resduals Estatístca Expermental

104 $`Quadratc Model\n ` Estmate StandardError tc pvalue b b b $`R of quadratc model` [] $`Analss of Varance of quadratc model` DF SS MS Fc pvalue Lnear Effect Quadratc Effect Lack of ft Resduals $`Cubc Model\n ` Estmate StandardError tc pvalue b b b b $`R of cubc model` [] $`Analss of Varance of cubc model` DF SS MS Fc pvalue Lnear Effect Quadratc Effect Cubc Effect Lack of ft Resduals Levels Observed Means # entrando com os valores da dose (x) dose<-c(0,0,0,30) # cálculo das médas dos tratamentos () mtrat<-tappl(gpeso,dose,mean) mtrat # gráfco de dspersão (dose x ganho de peso) 03 Estatístca Expermental

105 ganho de peso (g) plot(dose,mtrat,pch=6, col="black",lab="ganho de peso (g)") # ajustando a reta de regressão regln<-lm(mtrat~dose) #mprmndo os resultados do ajuste summar(regln) Call: lm(formula = mtrat ~ dose) Resduals: Coeffcents: Estmate Std Error t value Pr( t ) (Intercept) ** dose * --- Sgnf codes: 0 *** 000 ** 00 * Resdual standard error: on degrees of freedom Multple R-squared: 09436, Adjusted R-squared: 0954 F-statstc: 3346 on and DF, p-value: 0086 # colocando a reta estmada no gráfco de dspersão ablne(regln,col="blue",lwd=) legend(,95,"equação da reta\n = 6,9 + 0, *dose") Ajuste lnear Equação da reta = 6,9 + 0, *dose detach(dadosgpq) dose Estatístca Expermental

106 5º EXERCÍCIO PRÁTICO DE ESTATÍSTICA EXPERIMENTAL ) Num expermento estudou-se a adção de trgulho, a uma deta básca de mlho e farelo de soja na almentação se suínos, mestços ( Landrace x Large Whte), com peso ncal de 0,5 kg durante um período expermental de 40 das, mantdos em gaolas metálcas de,90 x 0,74 m O delneamento expermental fo o nteramente casualzado com 5 tratamentos e 8 repetções e a parcela expermental representada por 4 anmas (dos machos castrados e duas fêmeas) Os tratamentos consstram na nclusão de 0; 7,5; 5,0;,5; e 30% de trgulho em detas à base de mlho e soja Os ganhos de peso médo dáro em gramas (méda dos 4 anmas na parcela) foram: Tratamentos Repetções Total % de trgulho , , , , , A análse de varânca prelmnar é a segunte: Causa da varação GL S Quadrados Q M F Tratamentos ,55 3,30** Resíduo 35 65,00 75,00 Total 39 ** Sgnfcatvo p<0,0 a- Escrever o scrpt na lnguagem do R para reproduzr o quadro da anova acma b- Escrever também o scrpt para montar a tabela de análse de varânca com desdobramento dos graus de lberdade de tratamentos por polnômos ortogonas Causa da varação GL S Q Q M F Vapor de p Tratamentos ,55 3,30** Y (Lnear) Y (Quadrátco) Y 3 (Cúbco) Y 4 (4ª grau) Resíduo 65,00 75,00 Total 0,346 c- Trar as conclusões prátcas possíves para este expermento d- Calcular as médas e os erros padrões das médas dos tratamentos e o coefcente de determnação e de varação do expermento Coefcentes dos polnômos ortogonas para 5 tratamentos: Lnear: Quadrátco : Cúbco: - 0-4º Grau : ) Num expermento nteramente casualzado de competção de lnhagens de aves vsando o ganho de peso aos 60 das de dade, foram utlzados 4 tratamentos e 6 repetções Os tratamentos, com as respectvas médas de ganho de peso foram as seguntes: - ARBOR ACRES,8 kg - KIMBER 44,59 kg 3- PILCH 3,6 kg 4- COBBS 4,7 kg Para a análse de varânca dos ganhos de peso, obteve-se: SQ Tratamentos = 0,66 e SQ Total = 0,346 a) Sejam os contrastes: 3 ; 4 ; Verfcar se estes contrastes são ortogonas entre s 05 b) Preencher o quadro da anova abaxo: Estatístca Expermental

107 FV GL S Q Q M F Vapor de p Tratamentos 0,66 Y Y Y 3 Resíduo Total 0,346 c) Apresente as conclusões destes testes d) Calcular R e o CV deste expermento e conclur 3- Num expermento nteramente casualzado, com 5 tratamentos e 6 repetções, estudou-se o efeto da nfestação de ovnos e caprnos por larvas de Gagera pachscels (Nematoda: Anclostomatodea) Os tratamentos aplcados foram: T - nfestação com 50 larvas por anmal T - nfestação com 300 larvas por anmal T 3 - nfestação com 600 larvas por anmal T 4 - nfestação com 00 larvas por anmal T 5 - nfestação com 400 larvas por anmal A análse de varânca do número de semanas decorrdas até a morte do anmal apresentou os seguntes resultados SQ Tratamentos = 5,704 SQ Total =3,89 Sabendo-se, também que as médas do número de semanas, decorrdas até a morte do anmal, por tratamento foram:,8 4,6 = 3,55 = 3, =, Pede-se: a) Montar a análse de varânca e conclur FV GL S Q Q M F Vapor de p Tratamentos 5,704 Resíduo Total 3,89 b) Verfcar pelo teste de Tuke, Duncan e Scheffé ao nível de 5% de probabldade, quas as médas de tratamentos que estão dferndo sgnfcantemente entre s 06 Estatístca Expermental

108 Aula 6 Delneamento em blocos casualzados (DBC) Suponha que um expermentador esteja nteressado em estudar os efetos de 3 dferentes detas A prmera provdênca do pesqusador fo a de se nterar a respeto da natureza do materal expermental dsponível Feto sto, constatou que ele dspora de anmas com aproxmadamente o mesmo peso Entretanto, estes anmas eram provenentes de 4 nnhadas, cada uma contendo três anmas Dentro de uma nnhada, os três anmas foram sorteados às três detas Os anmas foram colocados em baas dêntcas e almentados com as detas sorteadas, em dêntcas condções Medu-se, então, o ganho de peso desses anmas depos de semanas Os dados obtdos são apresentados no quadro abaxo: Deta Nnhada 3 4 Total A 8,7 9,3 8, 8,6 4,8 B 30,7 34,9 3,6 34,4 3,6 C 3,9 34, 34,9 35,3 36,3 Total 9,3 98,4 95,7 98,3 383,7 Organzando as observações em arquvos com extensão xls ou txt detaxls deta nnhada gpeso A Nnhada 87 A Nnhada 93 A Nnhada3 8 A Nnhada4 86 B Nnhada 307 B Nnhada 349 B Nnhada3 36 B Nnhada4 344 C Nnhada 39 C Nnhada 34 C Nnhada3 349 C Nnhada4 353 detatxt deta nnhada gpeso A Nnhada 87 A Nnhada 93 A Nnhada3 8 A Nnhada4 86 B Nnhada 307 B Nnhada 349 B Nnhada3 36 B Nnhada4 344 C Nnhada 39 C Nnhada 34 C Nnhada3 349 C Nnhada4 353 (Dca: prmero dgte os dados no excel, para depos colocá-lo no bloco de notas) O delneamento expermental para este ensao de detas é um exemplo de um Delneamento em Blocos Casualzados com três tratamentos e quatro blocos Os tratamentos são níves de um fator expermental, as três detas; os blocos são os níves do fator confunddo, as nnhadas Dado que os anmas em dferentes nnhadas respondem dferentemente a uma dada deta, a nnhada é consderada, um fator de confundmento As undades expermentas (anmas) são agrupados em 4 blocos, de tal forma que, dentro de cada grupo, três undades são afetadas pelo mesmo nível do fator de confundmento Por causa da porção das característcas nerentes aos anmas dentro de uma mesma nnhada (bloco), suas respostas serão muto smlares, enquanto que as respostas dos anmas pertencentes a dferentes nnhadas rão varar muto; sto é, as undades expermentas são mas homogêneas dentro dos blocos do que entre os blocos Assm, resumdamente, podemos defnr que um DBC é um delneamento no qual as undades (undades expermentas) às quas os tratamentos são aplcados são subdvddos em grupos homogêneos, denomnados de blocos, tal que o número de undades expermentas em um bloco é gual ao número (ou algum múltplo do número) de tratamentos estudados Os tratamentos são então sorteados às undades expermentas 07 Estatístca Expermental

109 dentro de cada bloco Deve-se ressaltar que cada tratamento aparece em cada bloco, e todo bloco recebe todos os tratamentos Quando se usa o DBC, o objetvo é solar e remover do termo de erro (resíduo) a varação atrbuída ao bloco, garantndo assm, que as médas dos tratamentos estão lvres do efeto dos blocos A efetvdade deste delneamento depende da habldade em se obter blocos homogêneos de undades expermentas A habldade para formar blocos homogêneos depende do conhecmento que o pesqusador tem do materal expermental Quando os blocos são usados adequadamente, o QMR (quadrado médo do resíduo) no quadro da ANOVA será reduzdo, a estatístca F aumentará, e a chance de se rejetar H 0 (hpótese de nuldade) será maor Em expermentos com anmas, quando suspeta-se que dferentes raças de anmas responderá dferentemente ao mesmo tratamento, a raça do anmal pode ser usada como um fator a ser consderado na formação dos blocos O DBC pode, também, ser empregado efetvamente quando um expermento deve ser conduzdo em mas de um laboratóro (bloco) ou quando város das (blocos) são requerdos para a realzação do expermento No DBC temos os três prncípos báscos da expermentação: repetção, casualzação e controle local Vantagens do DBC Com o agrupamento das parcelas, geralmente se obtém resultados mas precsos que aqueles obtdos num DIC Desde exsta materal expermental sufcente, o delneamento será sempre balanceado, podendo-se nclur qualquer número de tratamentos A análse estatístca é bastante smples Se a varânca do erro expermental é maor para alguns tratamentos que para outros, pode-se obter um erro não vesado para testar qualquer combnação específca das médas dos tratamentos Prncpal desvantagem Ocorre quando da perda de parcela(s) em algum tratamento Apesar de exstr um método aproprado de estmação desses valores, há a perda de efcênca na comparação de médas envolvendo esses tratamentos Esquematcamente para um DBC com 4 tratamentos e 3 blocos (classes de dade) temos: 08 ) Undades expermentas heterogêneas (Fonte: Vera, 006, pag 5) Estatístca Expermental

110 09 ) Consttução dos 3 blocos ( 3 classes de dades ) 3) Delneamento de um expermento em blocos casualzados Organzação dos dados no DBC Vamos consderar k -tratamentos; r blocos e j é o valor observado na parcela que recebeu o tratamento e se encontra no bloco j Assm, um quadro para representar os valores amostras de um DBC pode ser da forma abaxo: Estatístca Expermental

111 Trat Blocos 3 j r Total Méda Y Y Y 3 Y r Y + Y Y Y Y 3 Y r Y + Y 3 Y 3 Y 3 Y 33 Y 3r Y 3+ k Y k Y k Y k3 Y kr Y k+ Y k TOTAL Y + Y + Y +3 Y +j Y +r Y ++ 3 Modelo matemátco Y Y j j j j, Y 3,,, k e j,, r sendo: a observação que recebeu o ésmo tratamento no j ésmo bloco; é méda geral comum a todas as observações ; j j j é o efeto do j ésmo bloco, com é efeto do ésmo tratamento com é o efeto do erro aleatóro r j 0; r j 0; j 4 Suposções do modelo Neste modelo, cada observado consttu uma amostra aleatóra ndependente j de tamanho de cada uma das kr populações os j são ndependentes e normalmente dstrbuídos com méda 0 e varânca, ou seja, ~ N(, ) Isto mplca em que as kr j 0 populações são normalmente dstrbuídas com méda j e a mesma varânca, ou seja, ~ N(, ) ; j os efetos de blocos e tratamentos são adtvos Esta suposção pode ser nterpretada como não exste nteração entre tratamentos e blocos Em outras palavras, uma partcular combnação blocotratamento não produz um efeto que é maor que ou menor que a soma dos efetos ndvduas j 0 4 Hpótese estatístca Podemos testar H : 0, com,,, k 0 H : nem todos os 0 ou H : 0 0 H : j j k Estatístca Expermental

112 Geralmente o teste de hpótese com relação aos efetos de blocos não é feto por dos motvos: prmero o nteresse prncpal é testar os efetos de tratamento, o propósto usual dos blocos é elmnar fontes estranhas de varação Segundo, embora as undades expermentas sejam dstrbuídas aleatoramente aos tratamentos, os blocos são obtdos de uma manera não aleatóra 6 Partção da soma de quadrados Voltemos ao quadro de representação das observações no DBC no tem Podemos dentfcar os seguntes desvos: j, como o desvo de uma observação em relação a méda amostral geral;, como o desvo da observação em relação à méda de seu j grupo ou do -ésmo tratamento;, como o desvo da méda do -ésmo tratamento em relação á méda geral j como o desvo da méda do j-ésmo bloco em relação á méda geral Consderemos a dentdade )( )( )( ) ( j j j j, a qual representa a a varação de uma observações em relação à méda geral amostral como uma soma da varação desta observação em relação à méda de seu grupo, com a varação desta observaçãoem relação à méda do j- ésmo bloco em que se encontra esta observação, com a varação do erro expermental Elevando-se ao quadrado os dos membros da dentdade acma e somando em relação aos índces e j, obtemos: k j ) j j j k r ( r ( j k j r ( j ), ) k r j ( Descrção de cada termo da expressão acma O termo k r j ( ), é denomnado de Soma de Quadrados Total e vamos denotá-lo por SQTO número de graus de lberdade assocado à SQT é kr -, ou N, pos temos N observações e a restrção O termo: k r j k j j ( ) 0 r j ( ), j ) é denomnado de Soma de quadrados de tratamentos, representada por SQTr, e é uma medda da varabldade entre os tratamentos Quanto mas Estatístca Expermental

113 dferentes entre s forem as médas dos tratamentos, maor será a SQTr Desde que temos k tratamentos e a restrção de que k ( 0, ) a SQTr está assocada a k- graus de lberdade O termo k r j ( ), é denomnado de Soma de quadrados de blocos, representada por SQB, e é uma medda da varabldade entre os blocos Quanto mas dferentes entre s forem as médas dos blocos, maor será a SQB, justfcando assm, a utlzação do delneamento em blocos Desde que temos r blocos e a restrção r j j ( ) 0, a SQB está assocada a r- graus de lberdade Fnalmente, o termo k r j j ( j é denomnado SQR Notem que a magntude da SQR não depende da dferença entre as médas dos tratamentos Os graus de lberdade assocada à SQR é (k-)(r-), sto é, o produto dos graus de lberdade dos tratamentos e blocos Assm, SQT SQB SQTr SQR, e os graus de lberdade assocados a cada membro da equação acma fca total blocos tratamentos resíduo kr- = (r-) + (k-) + (k-)(r-) 7 Quadrado médos Dvdndo a SQB, SQTr e SQR pelos correspondentes graus de lberdade, obtemos, respectvamente o Quadrado Médo Blocos (QMB), o Quadrado Médo Entre Tratamentos (QMTr) e o Quadrado Médo Resíduo, sto é, SQB SQTr SQR QMB e QMTr e QMR r k ( k )( r ) 8 Estatístca e regão crítca do teste A estatístca para o teste é QMTr F c, QMR a qual, deve ser próxmo de se H 0 for verdadera, enquanto que valores grandes dessa estatístca são uma ndcação de que H 0 é falsa A teora nos assegura que F c tem, sob H 0 dstrbução F Snedecor com (k -) e (k-)(r-) graus de lberdade no numerador e no denomnador, respectvamente Resumdamente, ndcamos: F ~ F sob H c j ), ( k (, k )( r ), ), 0 Rejetamos H 0 para o nível de sgnfcânca se Estatístca Expermental

114 3 F, c F( k (, k )( r ), ) sendo, F( k,( k )( r ), ) o quantl de ordem ( ) da dstrbução F-Snedecor com (k -) e (k-)(r-) graus de lberdade no numerador e no denomnador 9 Quadro de análse de varânca (anova) Dspomos as expressões necessáras ao teste na Tabela abaxo, denomnada de Quadro de Análse de Varânca (ANOVA) Fonte de varação gl SQ QM F r Y j ( Y ) Blocos r j k kr k Y ( Y ) Tratamentos k - r kr Resíduo (k-)(r-) SQB r SQTr k SQR ( k )( r ) QMTr QMR TOTAL kr k r Y J ( Y ) j kr Pode-se provar que: E( QMR ), ou seja, QMR é um estmador não vesado da varânca ; k r E( QMTr ), ou seja, QMTr é um estmador não ( k ) vesado da varânca se a hpótese H0 : k 0 é verdadera r k E( QMB ) j ( r ) j 0 Detalhes computaconas Apresentaremos alguns passos que facltam os cálculos das somas de quadrados da ANOVA ( ) Calcule a correção para a méda CM ; N Calcule a Soma de Quadrados dos Totas (SQT) SQT k r j j CM ; Calcule a Soma de Quadrados Entre os Tratamentos (SQTr) r Y SQTr CM ; r Calcule a Soma de Quadrados de blocos (SQB) r Y j SQB CM ; k j Calcule a Soma de Quadrados Resdual (SQR) pela dferença, sto é, SQR SQT SQTr SQB ; Estatístca Expermental

115 Calcule o Quadrado Médo entre os Tratamentos (QMTr) e o Quadrado Médo Resdual (QMR) SQB SQTr SQR QMB, QMTr e QMR r k ( k )( r ) QMTr QMB Calcule F c para tratamentos FcTr e FcBl QMR QMR Exemplo Vamos consderar os dados apresentados no tem Os cálculos para montar-mos o quadro da ANOVA são: k = 3, r = 4, e kr = N =(3)(4) = Então Graus de lberdade: Total kr N ( 3 )( 4 ) ; Trat k 3 Blocos r 4 3 e Res ( k )( r ) ( 3 )( ) 6 ( 383, 80) CM 75, 0 SQT ( 8, 7 ) ( 9, 3 ) ( 35, 3 ) 353, 35 68, 8 84, 54 ( 4, 8 ) ( 3, 6 ) ( 36, 3 ) SQTr , 87 68, 8 66, 06 CM CM 4 ( 9, 3 ) ( 98, 4 ) ( 95, 7 ) ( 98, 3 ) SQB CM , 88 68, 8, 07 SQR SQT SQTr SQB 84, 54 66, 06, 07 7, 4 66, 06, 07 7, 4 QMTr 33, 03, QMB 3, 69 e QMR, QMTr 33, 03 QMB 3, 69 FcTr 6, 64 e FcBl, 99 QMR, 4 QMR, 4 Organzando estes resultados no Quadro da ANOVA, temos: Fonte de varação gl SQ QM F c Detas 66,06 33,03 6,75 Nnhadas 3,07 3,69,99 Resíduo 6 7,4,35 Total 84,54 Das tabelas das dstrbuções F, temos que 5 4 e F 0 9 O valor F ctr = 6,75 é maor do que estes F(, 6, 0, 05 ), (, 6, 0, 0 ), valores tabelados, então rejetamos a hpótese nula H 0 para um nível 0, 0, ou % de probabldade (se é sgnfcatvo a %, também é sgnfcatvo a 5%), e concluímos que exste uma dferença entre as três detas As conclusões sobre as dferenças entre os efetos de nnhadas (blocos) podem ser baseadas no F c para blocos (F cbl =,98 com p=0,8) Os resultados ndcam que não exste uma varação sgnfcatva entre as nnhadas nos ganhos de peso Estatístca Expermental

116 O teste F da ANOVA para os blocos é um teste aproxmado mesmo quando as suposções são satsfetas Alguns pesqusadores sugerem que não se consdere o efeto colocado nos blocos em futuros estudos smlares, somente se o valor mínmo sgnfcatvo (valor de p) assocado à estatístca calculada for maor ou gual a 0,5 ( p 0, 5) Para estes dados, F cbl =,99 tem um p = 0,8 Portanto, mesmo que exste nsufcentes evdêncas para rejetar H : 0, ou seja, não exste efeto de nnhada, não é uma boa déa 0 j gnorar os efetos de nnhada em futuros estudos O scrpt no R para obter os resultados acma é apresentado abaxo # lendo o arquvo detatxt e armazenando no objeto dados dadosex <- readtable("detatxt",h=t) head(dadosex) deta nnhada gpeso A Nnhada 87 A Nnhada 93 3 A Nnhada3 8 4 A Nnhada B Nnhada B Nnhada 349 # anexando o objeto dadosex no camnho de procura attach(dadosex) # cálculo da méda da coluna com dados de ganho de peso (gpeso) mean(gpeso) [] 3975 # mostra o camnho agora com o objeto dadosex ncluído search() [] "GlobalEnv" "dadosex" "package:expdes" [4] "package:stats" "package:graphcs" "package:grdevces" [7] "package:utls" "package:datasets" "package:methods" [0] "Autoloads" "package:base" # gráfcos box-plot para cada deta com a cor 5 boxplot(gpeso~deta,col=5) # estatstcas descrtvas do box-plot de cada deta edes<- tappl(gpeso,deta,summar) edes $A Mn st Qu Medan Mean 3rd Qu Max $B Mn st Qu Medan Mean 3rd Qu Max $C Mn st Qu Medan Mean 3rd Qu Max Estatístca Expermental

117 # méda do ganho de peso de cada deta mgpeso <- tappl(gpeso,deta,mean) mgpeso A B C # desvo padrão do ganho de peso de cada deta sdgpeso <- tappl(gpeso,deta,sd) sdgpeso A B C # análse de varânca gpesoav <- aov(gpeso~factor(nnhada) + factor(deta)) summar(gpesoav) Df Sum Sq Mean Sq F value Pr(F) factor(nnhada) factor(deta) ** Resduals Sgnf codes: 0 *** 000 ** 00 * # outra forma de se obter as médas do gpeso das detas e das nnhadas modeltables(gpesoav,tpe="means") Tables of means Grand mean 3975 factor(nnhada) factor(nnhada) Nnhada Nnhada Nnhada3 Nnhada factor(deta) factor(deta) A B C # efetos das detas e das nnhadas modeltables(gpesoav,tpe="effects") Tables of effects factor(nnhada) factor(nnhada) Nnhada Nnhada Nnhada3 Nnhada factor(deta) factor(deta) A B C Estatístca Expermental

118 7 # obtendo os resíduos de cada observação resduos <- resd(gpesoav) resduos # gráfco Q-Q da normaldade qqnorm(resduos,pch=6,col=) qqlne(resduos,lwd=,col=) # teste de normaldade de Shapro-Wlks para os resíduos shaprotest(resduos) Shapro-Wlk normalt test data: resduos W = 0904, p-value = 065 # teste de Bartlett para a gualdade das varânca populaconas das detas bartletttest(gpeso~factor(deta)) Bartlett test of homogenet of varances data: gpeso b factor(deta) Bartlett's K-squared = 4933, df =, p-value = 09 # requerendo o pacote ExpDes requre(expdes) # anova pelo ExpDes rbd(deta,nnhada,gpeso,qual=t,mcomp=f) Analss of Varance Table DF SS MS Fc PrFc Treatament Block Resduals Total CV = 348 % Shapro-Wlk normalt test p-value: Accordng to Shapro-Wlk normalt test at 5% of sgnfcance, resduals can be consdered normal detach(dadosex) Estatístca Expermental

119 8 # mostra o camnho agora com o objeto dadosex excluído search() [] "GlobalEnv" "package:expdes" "package:stats" [4] "package:graphcs" "package:grdevces" "package:utls" [7] "package:datasets" "package:methods" "Autoloads" [0] "package:base" NOTA IMPORTANTE: Sempre use detach () antes de anexar um novo arquvo de dados, especalmente se as colunas dos dos arquvos tem nomes dêntcos, se não haverá problemas! Parcela perdda Um problema relatvamente comum neste tpo de delneamento ocorre quando perdemos uma (ou mas) parcela(s) durante o desenvolvmento do expermento Vamos consderar o segunte exemplo: Exemplo: Classe de dade (Blocos) Trat 3 4 Total A B C * D E Total A generalzação destes dados pode ser representada no quadro abaxo Blocos Trat 3 j r Total Y Y Y 3 Y r Y Y Y Y 3 Y r Ŷ j K Y k Y k Y k3 Y kr Total Y Y Y Y Y Y j Y Y r sendo: Yˆ Y Y Y j I j a estmatva da parcela perdda; k o número de tratamentos e r o número de blocos; o total o total das parcelas res tantes o total das parcelas dsponíves ; das parcelas res tantes no no tratamento onde ocorreu a b loco onde ocorreu a parcela perdda; parcela perdda Atualmente a perda de parcela não causa problemas de estmabldade, ou seja todos os os efetos são estmáves, bem como todos os contrastes Estatístca Expermental

120 Rode a análse comum aov(~factor(blocos)+factor(trat)) com o códgo NA para a o dado da parcela perdda O que acontece são precsões dferentes nas estmatvas dos efetos e sto mpossblta o uso de testes de médas com base no dms constante, como os testes de Tuke, t-student, etc Um scrpt no R para o exemplo acma é dado por: # lendo o arquvo detatxt e armazenando no objeto dados dadosexpp <- readtable("ex ppdbctxt",h=t) # mprmndo os dados dadosexpp trat blocos resp A I 5 A II 3 A III 0 4 A IV 8 5 B I 6 B II 3 7 B III 45 8 B IV 6 9 C I 33 0 C II 37 C III NA C IV 30 3 D I 44 4 D II 3 5 D III 49 6 D IV 34 7 E I 37 8 E II 30 9 E III 36 0 E IV # anexando o objeto dadosex no camnho de procura attach(dadosexpp) # análse de varânca respav <- aov(resp~factor(blocos) + factor(trat)) summar(respav) Df Sum Sq Mean Sq F value Pr(F) factor(blocos) factor(trat) ** Resduals Sgnf codes: 0 *** 000 ** 00 * observaton deleted due to mssngness Observação: Nesta análse, a soma de quadrados, bem como o quadrado médo dos tratamentos e dos resíduos está corretamente estmada, mas a soma de quadrados dos blocos esta subestmada 9 Estatístca Expermental

121 0 Fazendo esta mesma análse no MnTab, com astersco no lugar da parcela perdda temos o segunte resultado General Lnear Model: Y versus Bloco; Trat Factor Tpe Levels Values Bloco fxed Trat fxed 5 A B C D E Analss of Varance for Y, usng Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P Bloco Trat Error Total Reparem que a SQTr e de Bloco esta corrgda, ou seja, quando se usa o MnTab ou o SAS Nestes programas a correção da SQTr é feta automatcamente No MnTab é necessáro segur os seguntes passos: Stat/ANOVA/General Lnear Models e nesta janela colocar os termos do modelo em Model na ordem apresentada Antes de aconar o OK nesta janela vá à janela General Model Optons marcar na Sum of Square a opção Adjusted (Tpe III) e OK Estatístca Expermental

Estatística Experimental Medicina Veterinária. Faculadade de Ciências Agrárias e Veterinárias. Campus de Jaboticabal SP. Gener Tadeu Pereira

Estatística Experimental Medicina Veterinária. Faculadade de Ciências Agrárias e Veterinárias. Campus de Jaboticabal SP. Gener Tadeu Pereira MATERIAL DIDÁTICO Estatístca Expermental Medcna Veternára Faculadade de Cêncas Agráras e Veternáras Campus de Jabotcabal SP Gener Tadeu Perera º SEMESTRE DE 03 ÍNDICE AULA ESTATÍSTICA DESCRITIVA º EXERCÍCIO

Leia mais

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA CAPÍTULO DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA. A MÉDIA ARITMÉTICA OU PROMÉDIO Defnção: é gual a soma dos valores do grupo de dados dvdda pelo número de valores. X x Soma dos valores de x número de

Leia mais

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média. Estatístca Dscplna de Estatístca 0/ Curso de Admnstração em Gestão Públca Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos uns dos

Leia mais

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média. Estatístca Dscplna de Estatístca 0/ Curso Superor de tecnólogo em Gestão Ambental Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos

Leia mais

7 - Distribuição de Freqüências

7 - Distribuição de Freqüências 7 - Dstrbução de Freqüêncas 7.1 Introdução Em mutas áreas há uma grande quantdade de nformações numércas que precsam ser dvulgadas de forma resumda. O método mas comum de resumr estes dados numércos consste

Leia mais

Redução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma

Redução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma Redução dos Dados Júlo Osóro Meddas Característcas da Dstrbução Tendênca Central (Localzação) Varação (Dspersão) Forma 1 Meddas Característcas da Dstrbução Meddas Estatístcas Tendênca Central Dspersão

Leia mais

Probabilidade e Estatística I Antonio Roque Aula 4. Resumos Numéricos de Distribuições

Probabilidade e Estatística I Antonio Roque Aula 4. Resumos Numéricos de Distribuições Probabldade e Estatístca I Antono Roque Aula Resumos umércos de Dstrbuções As representações tabulares e grácas de dados são muto útes, mas mutas vezes é desejável termos meddas numércas quanttatvas para

Leia mais

Resumos Numéricos de Distribuições

Resumos Numéricos de Distribuições Estatístca Aplcada à Educação Antono Roque Aula Resumos umércos de Dstrbuções As representações tabulares e grácas de dados são muto útes, mas mutas vezes é desejável termos meddas numércas quanttatvas

Leia mais

UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO FACULDADE DE CIÊNCIAS AGRÁRIAS E VETERINÁRIAS CAMPUS DE JABOTICABAL MATERIAL DIDATICO DO CURSO

UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO FACULDADE DE CIÊNCIAS AGRÁRIAS E VETERINÁRIAS CAMPUS DE JABOTICABAL MATERIAL DIDATICO DO CURSO UNIVERSIDADE ESTADUAL PAULISTA JÚLIO DE MESQUITA FILHO FACULDADE DE CIÊNCIAS AGRÁRIAS E VETERINÁRIAS CAMPUS DE JABOTICABAL MATERIAL DIDATICO DO CURSO ESTATISTICA EXPERIMENTAL: Com aplcaçoes em R Medcna

Leia mais

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 014 Estatístca Descrtva e Análse Exploratóra Etapas ncas. Utlzadas para descrever e resumr os dados. A dsponbldade de uma grande quantdade de dados e de

Leia mais

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) UNDADE V DELNEAMENTO NTERAMENTE CASUALZADO (DC) CUABÁ, MT 015/ PROF.: RÔMULO MÔRA romulomora.webnode.com 1. NTRODUÇÃO Este delneamento apresenta como característca prncpal a necessdade de homogenedade

Leia mais

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro. Aplcação Por exemplo, se prepararmos uma área expermental com todo cudado possível e fzermos, manualmente, o planto de 100 sementes seleconadas de um mlho híbrdo, cudando para que as sementes fquem na

Leia mais

DELINEAMENTOS EXPERIMENTAIS

DELINEAMENTOS EXPERIMENTAIS SUMÁRIO 1 Delneamentos Expermentas 2 1.1 Delneamento Interamente Casualzado..................... 2 1.2 Delneamento Blocos Casualzados (DBC).................... 3 1.3 Delneamento Quadrado Latno (DQL)......................

Leia mais

Algarismos Significativos Propagação de Erros ou Desvios

Algarismos Significativos Propagação de Erros ou Desvios Algarsmos Sgnfcatvos Propagação de Erros ou Desvos L1 = 1,35 cm; L = 1,3 cm; L3 = 1,30 cm L4 = 1,4 cm; L5 = 1,7 cm. Qual destas meddas está correta? Qual apresenta algarsmos com sgnfcado? O nstrumento

Leia mais

4 Critérios para Avaliação dos Cenários

4 Critérios para Avaliação dos Cenários Crtéros para Avalação dos Cenáros É desejável que um modelo de geração de séres sntétcas preserve as prncpas característcas da sére hstórca. Isto quer dzer que a utldade de um modelo pode ser verfcada

Leia mais

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 014 Estatístca Descrtva e Análse Exploratóra Etapas ncas. Utlzadas para descrever e resumr os dados. A dsponbldade de uma grande quantdade de dados e de métodos

Leia mais

8 - Medidas Descritivas

8 - Medidas Descritivas 8 - Meddas Descrtvas 8. Introdução Ao descrevemos um conjunto de dados por meo de tabelas e gráfcos temos muto mas nformações sobre o comportamento de uma varável do que a própra sére orgnal de dados.

Leia mais

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas 3.6. Análse descrtva com dados agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca

Leia mais

Estatística II Antonio Roque Aula 18. Regressão Linear

Estatística II Antonio Roque Aula 18. Regressão Linear Estatístca II Antono Roque Aula 18 Regressão Lnear Quando se consderam duas varáves aleatóras ao mesmo tempo, X e Y, as técncas estatístcas aplcadas são as de regressão e correlação. As duas técncas estão

Leia mais

Estatística Experimental Medicina Veterinária. Faculadade de Ciências Agrárias e Veterinárias. Campus de Jaboticabal SP. Gener Tadeu Pereira

Estatística Experimental Medicina Veterinária. Faculadade de Ciências Agrárias e Veterinárias. Campus de Jaboticabal SP. Gener Tadeu Pereira MATERIAL DIDÁTICO Medcna Veternára Faculadade de Cêncas Agráras e Veternáras Campus de Jabotcabal SP Gener Tadeu Perera º SEMESTRE DE 04 ÍNDICE INTRODUÇÃO AO R AULA ESTATÍSTICA DESCRITIVA 3 º EXERCÍCIO

Leia mais

4.1. Medidas de Posição da amostra: média, mediana e moda

4.1. Medidas de Posição da amostra: média, mediana e moda 4. Meddas descrtva para dados quanttatvos 4.1. Meddas de Posção da amostra: méda, medana e moda Consdere uma amostra com n observações: x 1, x,..., x n. a) Méda: (ou méda artmétca) é representada por x

Leia mais

3 A técnica de computação intensiva Bootstrap

3 A técnica de computação intensiva Bootstrap A técnca de computação ntensva ootstrap O termo ootstrap tem orgem na expressão de língua nglesa lft oneself by pullng hs/her bootstrap, ou seja, alguém levantar-se puxando seu própro cadarço de bota.

Leia mais

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3 FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3 Nome Nº Turma: Data: / / Professor 10.º Ano Classfcação Apresente o seu racocíno de forma clara, ndcando todos os cálculos que tver de efetuar e todas

Leia mais

CURSO de ESTATÍSTICA Gabarito

CURSO de ESTATÍSTICA Gabarito UNIVERSIDADE FEDERAL FLUMINENSE TRANSFERÊNCIA o semestre letvo de 010 e 1 o semestre letvo de 011 CURSO de ESTATÍSTICA Gabarto INSTRUÇÕES AO CANDIDATO Verfque se este caderno contém: PROVA DE REDAÇÃO com

Leia mais

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 2

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 2 FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 2 Nome Nº Turma: Data: / / Professor 10.º Ano Classfcação Apresente o seu racocíno de forma clara, ndcando todos os cálculos que tver de efetuar e todas

Leia mais

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência. MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada,

Leia mais

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4 FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4 Nome Nº Turma: Data: / / Professor 10.º Ano Classfcação Apresente o seu racocíno de forma clara, ndcando todos os cálculos que tver de efetuar e todas

Leia mais

CAPÍTULO 2 - Estatística Descritiva

CAPÍTULO 2 - Estatística Descritiva INF 16 Prof. Luz Alexandre Peternell CAPÍTULO - Estatístca Descrtva Exercícos Propostos 1) Consderando os dados amostras abaxo, calcular: méda artmétca, varânca, desvo padrão, erro padrão da méda e coefcente

Leia mais

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Regressão Múltipla. Parte I: Modelo Geral e Estimação Regressão Múltpla Parte I: Modelo Geral e Estmação Regressão lnear múltpla Exemplos: Num estudo sobre a produtvdade de trabalhadores ( em aeronave, navos) o pesqusador deseja controlar o número desses

Leia mais

TABELAS E GRÁFICOS PARA VARIÁVEIS ALEATÓRIAS QUANTITATIVAS CONTÍNUAS

TABELAS E GRÁFICOS PARA VARIÁVEIS ALEATÓRIAS QUANTITATIVAS CONTÍNUAS TABELAS E GRÁFICOS PARA VARIÁVEIS ALEATÓRIAS QUANTITATIVAS CONTÍNUAS Varável Qualquer característca assocada a uma população Classfcação de varáves Qualtatva { Nomnal sexo, cor dos olhos Ordnal Classe

Leia mais

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro UNIVERIDADE DE ÃO PAULO FACULDADE DE ECONOMIA, ADMINITRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE ADMINITRAÇÃO RAD1507 Estatístca Aplcada à Admnstração I Prof. Dr. Evandro Marcos adel Rbero

Leia mais

2 Incerteza de medição

2 Incerteza de medição 2 Incerteza de medção Toda medção envolve ensaos, ajustes, condconamentos e a observação de ndcações em um nstrumento. Este conhecmento é utlzado para obter o valor de uma grandeza (mensurando) a partr

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Constata-se, freqüentemente, a estênca de uma relação entre duas (ou mas) varáves. Se tal relação é de natureza quanttatva, a correlação é o nstrumento adequado para descobrr e medr

Leia mais

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 1

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 1 FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 1 Nome Nº Turma: Data: / / Professor 10.º Ano Classfcação Apresente o seu racocíno de forma clara, ndcando todos os cálculos que tver de efetuar e todas

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análse Exploratóra de Dados Objetvos Análse de duas varáves quanttatvas: traçar dagramas de dspersão, para avalar possíves relações entre as duas varáves; calcular o coefcente de correlação entre as duas

Leia mais

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo 3 Metodologa de Avalação da Relação entre o Custo Operaconal e o Preço do Óleo Este capítulo tem como objetvo apresentar a metodologa que será empregada nesta pesqusa para avalar a dependênca entre duas

Leia mais

MODELOS DE REGRESSÃO PARAMÉTRICOS

MODELOS DE REGRESSÃO PARAMÉTRICOS MODELOS DE REGRESSÃO PARAMÉTRICOS Às vezes é de nteresse nclur na análse, característcas dos ndvíduos que podem estar relaconadas com o tempo de vda. Estudo de nsufcênca renal: verfcar qual o efeto da

Leia mais

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira UNIVERSIDADE DE PERNAMBUCO ESCOLA POLITÉCNICA DE PERNAMBUCO Físca Expermental Prof o José Wlson Vera wlson.vera@upe.br AULA 01: PROCESSOS DE ANÁLISE GRÁFICA E NUMÉRICA MODELO LINEAR Recfe, agosto de 2015

Leia mais

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos Curso de extensão, MMQ IFUSP, feverero/4 Alguns exercíco báscos I Exercícos (MMQ) Uma grandeza cujo valor verdadero x é desconhecdo, fo medda três vezes, com procedmentos expermentas dêntcos e, portanto,

Leia mais

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS 1 A análse de dagnóstco (ou dagnóstco do ajuste) confgura uma etapa fundamental no ajuste de modelos de regressão. O objetvo prncpal da análse de dagnóstco

Leia mais

IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO

IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO Alne de Paula Sanches 1 ; Adrana Betâna de Paula Molgora 1 Estudante do Curso de Cênca da Computação da UEMS, Undade Unverstára de Dourados;

Leia mais

AULA 4. Segundo Quartil ( Q observações são menores que ele e 50% são maiores.

AULA 4. Segundo Quartil ( Q observações são menores que ele e 50% são maiores. Estatístca Aplcada à Engenhara AULA 4 UNAMA - Unversdade da Amazôna.8 MEDIDA EPARATRIZE ão valores que separam o rol (os dados ordenados) em quatro (quarts), dez (decs) ou em cem (percents) partes guas.

Leia mais

Capítulo 2 Estatística Descritiva Continuação. Prof. Fabrício Maciel Gomes

Capítulo 2 Estatística Descritiva Continuação. Prof. Fabrício Maciel Gomes Capítulo Estatístca Descrtva Contnuação Prof. Fabríco Macel Gomes Problema Uma peça após fundda sob pressão a alta temperatura recebe um furo com dâmetro especfcado em 1,00 mm e tolerânca de 0,5 mm: (11,75

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ 1 É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

Representação e Descrição de Regiões

Representação e Descrição de Regiões Depos de uma magem ter sdo segmentada em regões é necessáro representar e descrever cada regão para posteror processamento A escolha da representação de uma regão envolve a escolha dos elementos que são

Leia mais

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 014 Estatístca Descrtva e Análse Exploratóra Etapas ncas. Utlzadas para descrever e resumr os dados. A dsponbldade de uma grande quantdade de dados e de métodos

Leia mais

MEDIDAS DE TENDÊNCIA CENTRAL

MEDIDAS DE TENDÊNCIA CENTRAL 3.1- Introdução. ESTATÍSTICA MEDIDAS DE TENDÊNCIA CENTRAL Como na representação tabular e gráfca dos dados a Estatístca Descrtva consste num conjunto de métodos que ensnam a reduzr uma quantdade de dados

Leia mais

CONCEITOS INICIAIS DE ESTATÍSTICA MÓDULO 2 DISTRIBUIÇÃO DE FREQÜÊNCIA - ELEMENTOS Prof. Rogério Rodrigues

CONCEITOS INICIAIS DE ESTATÍSTICA MÓDULO 2 DISTRIBUIÇÃO DE FREQÜÊNCIA - ELEMENTOS Prof. Rogério Rodrigues CONCEITOS INICIAIS DE ESTATÍSTICA MÓDULO DISTRIBUIÇÃO DE FREQÜÊNCIA - ELEMENTOS Prof. Rogéro Rodrgues I) TABELA PRIMITIVA E DISTRIBUIÇÃO DE FREQÜÊNCIA : No processo de amostragem, a forma de regstro mas

Leia mais

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma:

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma: Professora Janete Perera Amador 1 8 Meddas Descrtvas Vmos anterormente que um conjunto de dados pode ser resumdo através de uma dstrbução de freqüêncas, e que esta pode ser representada através de uma

Leia mais

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 1 O nosso objetvo é estudar a relação entre duas varáves quanttatvas. Eemplos:. Idade e altura das cranças.. v. Tempo de prátca de esportes e rtmo cardíaco

Leia mais

1. CORRELAÇÃO E REGRESSÃO LINEAR

1. CORRELAÇÃO E REGRESSÃO LINEAR 1 CORRELAÇÃO E REGREÃO LINEAR Quando deseja-se estudar se exste relação entre duas varáves quanttatvas, pode-se utlzar a ferramenta estatístca da Correlação Lnear mples de Pearson Quando essa correlação

Leia mais

Variável discreta: X = número de divórcios por indivíduo

Variável discreta: X = número de divórcios por indivíduo 5. Análse descrtva com dados agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas

Leia mais

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha) Estatístca p/ Admnstração II - Profª Ana Cláuda Melo Undade : Probabldade Aula: 3 Varável Aleatóra. Varáves Aleatóras Ao descrever um espaço amostral de um expermento, não especfcamos que um resultado

Leia mais

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 011 Estatístca Descrtva e Análse Exploratóra Etapas ncas. Utlzadas para descrever e resumr os dados. A dsponbldade de uma grande quantdade de dados e de

Leia mais

AEP FISCAL ESTATÍSTICA

AEP FISCAL ESTATÍSTICA AEP FISCAL ESTATÍSTICA Módulo 11: Varáves Aleatóras (webercampos@gmal.com) VARIÁVEIS ALEATÓRIAS 1. Conceto de Varáves Aleatóras Exemplo: O expermento consste no lançamento de duas moedas: X: nº de caras

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

Aula Características dos sistemas de medição

Aula Características dos sistemas de medição Aula - Característcas dos sstemas de medção O comportamento funconal de um sstema de medção é descrto pelas suas característcas (parâmetros) operaconas e metrológcas. Aqu é defnda e analsada uma sére destes

Leia mais

Gráficos de Controle para Processos Autocorrelacionados

Gráficos de Controle para Processos Autocorrelacionados Gráfcos de Controle para Processos Autocorrelaconados Gráfco de controle de Shewhart: observações ndependentes e normalmente dstrbuídas. Shewhart ao crar os gráfcos de controle não exgu que os dados fossem

Leia mais

2ª Atividade Formativa UC ECS

2ª Atividade Formativa UC ECS I. Explque quando é que a méda conduz a melhores resultados que a medana. Dê um exemplo para a melhor utlzação de cada uma das meddas de localzação (Exame 01/09/2009). II. Suponha que um professor fez

Leia mais

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma Capítulo 8 Dferencação Numérca Quase todos os métodos numércos utlzados atualmente para obtenção de soluções de equações erencas ordnáras e parcas utlzam algum tpo de aproxmação para as dervadas contínuas

Leia mais

Análise Descritiva com Dados Agrupados

Análise Descritiva com Dados Agrupados Análse Descrtva com Dados Agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas descrtvas

Leia mais

3. Estatística descritiva bidimensional

3. Estatística descritiva bidimensional 3. Estatístca descrtva bdmensonal (Tabelas, Gráfcos e números) Análse bvarada (ou bdmensonal): avala o comportamento de uma varável em função da outra, por exemplo: Quantas TV Phlps são venddas na regão

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

Neste capítulo abordam-se os principais conceitos relacionados com os cálculos de estatísticas, histogramas e correlação entre imagens digitais.

Neste capítulo abordam-se os principais conceitos relacionados com os cálculos de estatísticas, histogramas e correlação entre imagens digitais. 1 1Imagem Dgtal: Estatístcas INTRODUÇÃO Neste capítulo abordam-se os prncpas concetos relaconados com os cálculos de estatístcas, hstogramas e correlação entre magens dgtas. 4.1. VALOR MÉDIO, VARIÂNCIA,

Leia mais

2 Metodologia de Medição de Riscos para Projetos

2 Metodologia de Medição de Riscos para Projetos 2 Metodologa de Medção de Rscos para Projetos Neste capítulo remos aplcar os concetos apresentados na seção 1.1 ao ambente de projetos. Um projeto, por defnção, é um empreendmento com metas de prazo, margem

Leia mais

Associação entre duas variáveis quantitativas

Associação entre duas variáveis quantitativas Exemplo O departamento de RH de uma empresa deseja avalar a efcáca dos testes aplcados para a seleção de funconáros. Para tanto, fo sorteada uma amostra aleatóra de 50 funconáros que fazem parte da empresa

Leia mais

REGRESSÃO NÃO LINEAR 27/06/2017

REGRESSÃO NÃO LINEAR 27/06/2017 7/06/07 REGRESSÃO NÃO LINEAR CUIABÁ, MT 07/ Os modelos de regressão não lnear dferencam-se dos modelos lneares, tanto smples como múltplos, pelo fato de suas varáves ndependentes não estarem separados

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análse Exploratóra de Dados Objetvos Análse de duas varáves quanttatvas: obter uma reta que se ajuste aos dados segundo o crtéro de mínmos quadrados; apresentar outros crtéros para a determnação de uma

Leia mais

Métodos Avançados em Epidemiologia

Métodos Avançados em Epidemiologia Unversdade Federal de Mnas Geras Insttuto de Cêncas Exatas Departamento de Estatístca Métodos Avançados em Epdemologa Aula 5-1 Regressão Lnear Smples: Estmação e Interpretação da Reta Tabela ANOVA e R

Leia mais

CURSO A DISTÂNCIA DE GEOESTATÍSTICA

CURSO A DISTÂNCIA DE GEOESTATÍSTICA CURSO A DISTÂNCIA DE GEOESTATÍSTICA Aula 6: Estaconardade e Semvarânca: Estaconardade de a. ordem, Hpótese ntríseca, Hpótese de krgagem unversal, Crtéros para escolha, Verfcação, Representatvdade espacal,

Leia mais

Análise de Variância. Comparação de duas ou mais médias

Análise de Variância. Comparação de duas ou mais médias Análse de Varânca Comparação de duas ou mas médas Análse de varânca com um fator Exemplo Um expermento fo realzado para se estudar dabetes gestaconal. Desejava-se avalar o comportamento da hemoglobna (HbA)

Leia mais

Cap. IV Análise estatística de incertezas aleatórias

Cap. IV Análise estatística de incertezas aleatórias TLF 010/11 Cap. IV Análse estatístca de ncertezas aleatóras Capítulo IV Análse estatístca de ncertezas aleatóras 4.1. Méda 43 4.. Desvo padrão 44 4.3. Sgnfcado do desvo padrão 46 4.4. Desvo padrão da méda

Leia mais

FAAP APRESENTAÇÃO (1)

FAAP APRESENTAÇÃO (1) ARESENTAÇÃO A Estatístca é uma cênca que organza, resume e smplfca nformações, além de analsá-las e nterpretá-las. odemos dvdr a Estatístca em três grandes campos:. Estatístca Descrtva- organza, resume,

Leia mais

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

DEFINIÇÃO - MODELO LINEAR GENERALIZADO DEFINIÇÃO - MODELO LINEAR GENERALIZADO 1 Um modelo lnear generalzado é defndo pelos seguntes três componentes: Componente aleatóro; Componente sstemátco; Função de lgação; Componente aleatóro: Um conjunto

Leia mais

2. MEDIDAS DE TENDÊNCIA CENTRAL OU MEDIDAS DE POSIÇÃO

2. MEDIDAS DE TENDÊNCIA CENTRAL OU MEDIDAS DE POSIÇÃO Materal elaborado por Mara Tereznha Marott, Rodrgo Coral e Carla Regna Kuss Ferrera Atualzado por Mlton Procópo de Borba. MEDIDAS DE TENDÊNCIA CENTRAL OU MEDIDAS DE POSIÇÃO Para melhor caracterzar um conjunto

Leia mais

Tabela 1. Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de menores de 5 anos para 20 países, 1992.

Tabela 1. Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de menores de 5 anos para 20 países, 1992. Regressão Lnear Algumas vezes estamos nteressados não apenas se exste assocação entre duas varáves quanttatvas x e y, mas nós temos também uma hpótese a respeto de uma provável relação de causa e efeto

Leia mais

Estatística stica Descritiva

Estatística stica Descritiva AULA1-AULA5 AULA5 Estatístca stca Descrtva Prof. Vctor Hugo Lachos Davla oo que é a estatístca? Para mutos, a estatístca não passa de conjuntos de tabelas de dados numércos. Os estatístcos são pessoas

Leia mais

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES Capítulo. Aproxmações numércas 1D em malhas unformes 9 Capítulo. AROXIMAÇÕS NUMÉRICAS 1D M MALHAS UNIFORMS O prncípo fundamental do método das dferenças fntas (MDF é aproxmar através de expressões algébrcas

Leia mais

Testes não-paramétricos

Testes não-paramétricos Testes não-paramétrcos Prof. Lorí Val, Dr. http://www.mat.ufrgs.br/val/ val@mat.ufrgs.br Um teste não paramétrco testa outras stuações que não parâmetros populaconas. Estas stuações podem ser relaconamentos,

Leia mais

Experiência V (aulas 08 e 09) Curvas características

Experiência V (aulas 08 e 09) Curvas características Experênca (aulas 08 e 09) Curvas característcas 1. Objetvos 2. Introdução 3. Procedmento expermental 4. Análse de dados 5. Referêncas 1. Objetvos Como no expermento anteror, remos estudar a adequação de

Leia mais

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012 Notas Processos estocástcos Nestor Catcha 23 de abrl de 2012 notas processos estocástcos 2 O Teorema de Perron Frobenus para matrzes de Markov Consdere um processo estocástco representado por um conunto

Leia mais

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

ANÁLISE DA VARIÂNCIA DA REGRESSÃO ANÁLISE DA VARIÂNCIA DA REGRESSÃO PROCEDIMENTO GERAL DE REGRESSÃO Em um modelo de análse de varânca, como no DIA, o fator em estudo pode ser quanttatvo ou qualtatvo. FATOR QUANTITATIVO: é aquele cujos

Leia mais

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA Análse de Regressão Profa Alcone Mranda dos Santos Departamento de Saúde Públca UFMA Introdução Uma das preocupações estatístcas ao analsar dados, é a de crar modelos que explctem estruturas do fenômeno

Leia mais

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall Sstemas Intelgentes Aplcados Carlos Hall Programa do Curso Lmpeza/Integração de Dados Transformação de Dados Dscretzação de Varáves Contínuas Transformação de Varáves Dscretas em Contínuas Transformação

Leia mais

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral. DEFINIÇÕES ADICIONAIS: PROBABILIDADE Espaço amostral (Ω) é o conjunto de todos os possíves resultados de um expermento. Evento é qualquer subconjunto do espaço amostral. Evento combnado: Possu duas ou

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~vall/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal http://www.mat.ufrgs.br/~vall/ ou expermental. Numa relação

Leia mais

MAP Cálculo Numérico e Aplicações

MAP Cálculo Numérico e Aplicações MAP0151 - Cálculo Numérco e Aplcações Lsta 5 (Correção Neste ponto, todos já sabemos que todas as questões têm o mesmo valor, totalzando 10.0 pontos. (Questão 1 Fque com vontade de fazer mas do que fo

Leia mais

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear normal com erros heterocedástcos O método de mínmos quadrados ponderados Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

Resumo de Álgebra Linear - parte II

Resumo de Álgebra Linear - parte II Aula 7 Resumo de Álge Lnear - parte II 7.1 Resumo Nesta aula contnuamos desenvolvendo concetos báscos de álge lnear, aprmorando a famlardade com a notação de Drac. Bblograa: Moysés, 8.7 (em parte), e Cohen-Tannoudj,

Leia mais

3 Algoritmos propostos

3 Algoritmos propostos Algortmos propostos 3 Algortmos propostos Nesse trabalho foram desenvolvdos dos algortmos que permtem classfcar documentos em categoras de forma automátca, com trenamento feto por usuáros Tas algortmos

Leia mais

Estatística Aplicada II CORRELAÇÃO. AULA 21 07/11/16 Prof a Lilian M. Lima Cunha

Estatística Aplicada II CORRELAÇÃO. AULA 21 07/11/16 Prof a Lilian M. Lima Cunha 09//06 Estatístca Aplcada II CORRELAÇÃO AULA 07//6 Prof a Llan M. Lma Cunha CORRELAÇÃO: Identfcar a estênca ou não de assocação lnear entre varáves: -Preço de um produto em regões; -Frete e Km percorrdo;

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ Em mutas stuações duas ou mas varáves estão relaconadas e surge então a necessdade de determnar a natureza deste relaconamento. A análse

Leia mais

Introdução. Uma lâmpada nova é ligada e observa-se o tempo gasto até queimar. Resultados possíveis

Introdução. Uma lâmpada nova é ligada e observa-se o tempo gasto até queimar. Resultados possíveis Introdução A teora das probabldades é um ramo da matemátca que lda modelos de fenômenos aleatóros. Intmamente relaconado com a teora de probabldade está a Estatístca, que se preocupa com a cração de prncípos,

Leia mais

Ajuste de Curvas Regressão. Computação 2º Semestre 2016/2017

Ajuste de Curvas Regressão. Computação 2º Semestre 2016/2017 Ajuste de Curvas Regressão Computação 2º Semestre 2016/2017 Ajuste de Curvas Quando apenas sabemos alguns valores de uma função contínua e queremos estmar outros valores ntermédos Quando queremos obter

Leia mais

Teoria Elementar da Probabilidade

Teoria Elementar da Probabilidade 10 Teora Elementar da Probabldade MODELOS MATEMÁTICOS DETERMINÍSTICOS PROBABILÍSTICOS PROCESSO (FENÓMENO) ALEATÓRIO - Quando o acaso nterfere na ocorrênca de um ou mas dos resultados nos quas tal processo

Leia mais