Investigação por Inquérito

Tamanho: px
Começar a partir da página:

Download "Investigação por Inquérito"

Transcrição

1 UIVERSIDADE DOS AÇORES DEPARTAMETO DE MATEMÁTICA LICECIATURA EM MATEMÁTICA APLICADA Ivestgação por Iquérto Trabalho elaborado por: sa Ávla do Couto Alves Pota Delgada, ao lectvo 005/006

2 ÍDICE ITRODUÇÃO... - IMPORTÂCIA DOS IQUÉRITOS ETAPAS DA IVESTIGAÇÃO POR IQUÉRITO ETAPA : PLAEAMETO E DESEHO DO IQUÉRITO AMOSTRAGEM TÉCICAS DE AMOSTRAGEM Amostragem Aleatóra: Amostragem ão Aleatóra DIMESÃO DA AMOSTRA MÉTODOS DE RECOLHA DOS DADOS COCEPÇÃO DAS QUESTÕES DESEHO DO QUESTIOÁRIO PRÉ-TESTE DO QUESTIOÁRIO O PLAO DO QUESTIOÁRIO ETAPA : RECOLHA DOS DADOS ETAPA 3: ACESSO AOS DADOS ETAPA 4: PREPARAÇÃO DOS DADOS ETAPA 5: AÁLISE DOS DADOS ESTATÍSTICA DESCRITIVA versus ESTATÍSTICA IDUTIVA ESTATÍSTICA DESCRITIVA ESTATÍSTICA IDUTIVA Itervalos de Cofaça Testes de Hpóteses Relação etre Testes de Hpóteses e Itervalos de Cofaça MÉTODOS PARAMÉTRICOS versus MÉTODOS ÃO-PARAMÉTRICOS MÉTODOS ÃO-PARAMÉTRICOS Testes de Ajustameto Testes de Aleatoredade Testes de Smetra Tabelas de Cotgêca Testes de Localzação Testes de escala e outros problemas de duas amostras Testes de Assocação MÉTODOS QUE AALISAM DIFEREÇAS versus MÉTODOS QUE AALISAM RELAÇÕES MÉTODOS QUE AALISAM DIFEREÇAS MÉTODOS QUE AALISAM RELAÇÕES TÉCICAS UIVARIADAS, BIVARIADAS E MULTIVARIADAS TÉCICAS MULTIVARIADAS Regressão múltpla Regressão logístca Aálse dscrmate Árvores dscrmates (de decsão) Aálse de varâca multvarada Aálse em compoetes prcpas (ACP) Aálse factoral Aálse de clusters Aálse loglear Aálse de correspodêcas Aálse cojuta Correlação caóca Escaloameto multdmesoal Modelos de equações estruturas Téccas emergetes REPRESETAÇÕES GRÁFICAS ETAPA 6: PRODUÇÃO DO RELATÓRIO ETAPA 7: DIVULGAÇÃO DOS RESULTADOS COCLUSÃO BIBLIOGRAFIA sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

3 ITRODUÇÃO Este trabalho fo elaborado o âmbto do Trabalho Fal de Curso da Lcecatura em Matemátca Aplcada. Tetou-se abordar o assuto da vestgação por quérto de uma forma equlbrada em relação à complexdade e à abragêca/profuddade para que pudesse ser um strumeto útl a aluos teressados estas temátcas. De modo que, à medda que as téccas estatístcas aqu apresetadas se vão torado mas complexas (omeadamete as téccas de aálse multvarada), os aspectos matemátcos das mesmas vão sedo omtdos apresetado-se apeas a aplcabldade e os fudametos geras de cada um dos métodos. Ica-se por elucdar a mportâca dos quértos a socedade actual, stetzado-se depos, as etapas de uma vestgação por quérto. Desevolve-se especalmete a etapas referetes ao plaeameto e deseho do questoáro, à preparação dos dados e, à de aálse dos dados. o capítulo do plaeameto e deseho do questoáro, abordam-se, etre outros, assutos como a amostragem, métodos de recolha de dados, cocepção das questões e deseho do questoáro. o capítulo referete à aálse dos dados apresetam-se dversas téccas de aálse (descrtvas, dutvas, paramétrcas, ão-paramétrcas, para aalsar dfereças, para aalsar relações: uvaradas, bvaradas, multvaradas e ada represetações gráfcas). sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

4 - IMPORTÂCIA DOS IQUÉRITOS Os quértos estatístcos são usados para recolher formação quattatva os campos de marketg, sodages polítcas, e pesqusa as cêcas socas, etre outros. Um quérto pode cdr sobre opões ou formação factual, depededo do seu objectvo, mas todos os quértos evolvem a admstração de pergutas a dvíduos. Quado as pergutas são colocadas por um pesqusador, o quérto é chamado etrevsta ou quérto mstrado por um pesqusador. Quado as questões são admstradas pelo qurdo, o quérto é referdo por questoáro ou quérto auto-admstrado. os processos de tomada de decsão de qualquer orgazação é essecal obter o máxmo de formação sobre o meo que a evolve. Deste modo, os quértos, se correctamete utlzados são meos efcazes de obter a formação ecessára. Cotudo, os quértos estatístcos apresetam vatages e desvatages. De seguda apresetam-se algumas dessas vatages e desvatages. As vatages dos quértos estatístcos cluem: São uma forma efcete de recolher formação de um grade úmero de qurdos. Podem ser usadas téccas estatístcas para determar a valdade, a fabldade e a sgfcâca estatístca. São flexíves o setdo em que pode ser recolhda uma grade varedade de formação. Podem ser usados para estudar attudes, valores, creças e comportametos passados. São relatvamete fáces de admstrar. Há uma ecooma da recolha dos dados devdo à focalzação provdecada por questões padrozadas, ou seja, ão há um gasto de tempo e dhero em questões tagecas. As desvatages dos quértos cluem: Depedem da motvação, hoestdade, memóra e capacdade de resposta dos sujetos. ão são aproprados para estudar feómeos socas complexos. Se a amostra ão for represetatva da população etão as característcas da população ão podem ser ferdas. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 3

5 É ecessáro ter em cosderação que fazer um quérto é muto mas que costrur um questoáro. É um processo com múltplos passos e em que cada etapa está claramete defda para se ter sucesso deve-se plaear cudadosamete todas estas etapas desde a forma de recolha da formação até à apresetação dos resultados. De modo a aumetar a sua efcêca, qualquer quérto deve ter as segutes característcas: ser claro os seus objectvos devem ser precsos; fáces os qurdos devem perceber faclmete o seu coteúdo; fáves os dados recolhdos devem traduzr a opão do qurdo sem erros; aalsado os dados devem ser sujetos a aálse estatístca para se poder ferr resultados e tomar decsões e, atempado o tempo etre o seu plaeameto e a obteção de resultados deve ser o meor possível para que seja útl à decsão. Quem promove um quérto procura cohecer característcas, comportametos ou opões de uma população usado um processo de amostragem. Deste modo, um quérto ajuda o decsor a: Obter formação adcoal sobre o que pesam os cletes ou os utlzadores dos servços, os empregados ou, em últma stâca, a população em geral sobre determado assuto; Crar mas valor do de ecotro às expectatvas do mercado, ou seja, ajuda o decsor a cohecer o mercado; Efretar maor cocorrêca cohecedo as expectatvas dos cletes e a avalação que fazem dos produtos tato da própra empresa como das cocorretes com o objectvo de ovar, fdelzar e dferecar-se; Idetfcar oportudades de, por exemplo, cração de ovos produtos; Aumetar o retoro do vestmeto cofrotado o cohecmeto das relações etre a empresa e as pessoas ou sttuções que com ela se relacoam com a opão que estes expressam os quértos que se promove, ou seja, quato mas satsfetos estverem os melhores cletes, maor a fdelzação e mas seguro será o futuro da empresa. Algumas pessoas pesam que fazer um quérto é somete colocar questões. Mas sso ão é verdade, actualmete deve-se ecará-lo como um processo. Quado é correctamete executado obtêm-se dados de boa qualdade sobre os quas se pode agr. O processo de qurção pode falhar se correctamete mplemetado em qualquer das suas etapas. Algus dos erros mas frequetes relacoam-se com a qualdade das 4 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

6 questões colocadas; com os erros cometdos a etrada de dados ou com o tempo etre o laçameto do quérto e a tomada de decsão. - ETAPAS DA IVESTIGAÇÃO POR IQUÉRITO A pesqusa por quérto, de acordo com o ste do PSE (Produtos e Servços de Estatístca, Lda.), pode ser dvdda em sete etapas, como se mostra abaxo. Para que se obteha sucesso, qualquer uma delas deve ser correctamete mplemetada.. Plaeameto e deseho do quérto. Recolha dos dados 3. Acesso aos dados 4. Preparação dos dados 5. Aálse dos dados 6. Produção do relatóro 7. Dvulgação dos resultados A Fgura esquematza as etapas de realzação de uma pesqusa por quérto. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 5

7 Plaeameto e deseho do quérto Recolha dos dados Acesso aos dados Defr objectvos e hpóteses a testar Determar orçameto, caledáro e recursos Defr a população Determar dmesão da amostra e técca amostral a utlzar Escolher método de recolha de dados Elaborar o questoáro Testar o questoáro Obter dados claros, ão evesados e actualzados Método de recolha atractvo para obter uma boa taxa de resposta Acelerar o processo (métodos automátcos de etrada de dados) Passar dados para o software de aálse Compatbldade etre software de aálse e de recolha de dados Examar os dados Preparação dos dados Idetfcar outlers e mssg values. Ecotrar solução adequada Verfcar pressupostos dos métodos de aálse Cálculo de varáves trasformadas Defr a escala das varáves Escolher um software aalítco Aálse dos dados Produzr estatístcas descrtvas e represetações gráfcas Costrur modelos explcatvos Regstar aálses executadas Iterpretar resultados Preparação do relatóro fal Persoalzar quadros e gráfcos Torar relatóro smples e de fácl terpretação Preparar apresetação dos resultados em software adequado Dvulgação dos resultados Dstrbur rapdamete Permtr teracção dos decsores Cotrolar seguraça e cofdecaldade FIGURA. ETAPAS DE REALIZAÇÃO DE UMA PESQUISA POR IQUÉRITO sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 6

8 3- ETAPA : PLAEAMETO E DESEHO DO IQUÉRITO Ates de se car o processo é ecessáro determar os objectvos, orçameto e recursos do projecto, bem como plafcar o caledáro. ehum quérto deve prossegur sem que os seus propóstos sejam claros e acetes para que ão se esteja a coleccoar formação desecessára e cara. Um bom formuláro começa com uma boa hpótese cudadosamete estudada. GOODE (979). Para que se possa testar correctamete as hpóteses operacoas covém que estas sejam especfcadas ates da recolha de dados. É essecal saber quas as relações e padrões que se pesa poder vr a ecotrar e quas as aálses estatístcas a efectuar, pos estas depederão do tpo de dados recolhdos. Deve-se pesar para que servem os resultados a obter. Ou seja, as aálses desejadas, os relatóros a escrever e a forma como a formação resultate será utlzada. Ates de se crar as questões e o formato do questoáro a utlzar, é precso ter em ateção o tpo de população a qurr por exemplo, dade, ível educacoal ou motvação. É ada ecessáro determar o método de recolha de dados a utlzar. Depos etão será ecessáro estmar a dmesão da amostra requerda. A amostragem é um assuto bastate complexo e será abordado o sub capítulo AMOSTRAGEM Se se tvesse a possbldade de estudar todos os membros da população, estar-se-a a preseça de um ceso. Cotudo promover um ceso é extremamete caro e moroso, assm, faz-se uma sodagem que, segudo FERRÃO (00) é a resposta ao cohecmeto de uma população tomado por base uma fracção da população a amostra. Os maores esforços este processo estão relacoados com a determação de uma amostra da população, para a qual são utlzados métodos probablístcos. A amostra deve ter a dmesão adequada para obter a precsão pretedda e ão deve ser superor, pos à medda que cresce a dmesão da amostra os custos do processo aumetam e os gahos de precsão são mímos. Uma vez seleccoada a amostra, é ecessáro verfcar que a amostra é represetatva da população, ou seja, que os dvíduos que ão respodem são smlares sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 7

9 aos que respodem. Caso cotráro, os resultados serão evesados. Uma amostra represetatva é aquela que reflecte os aspectos típcos da população. Pode-se dscrmar as etapas do plao amostral do segute modo: º Defr o Uverso; ª Se possível, detfcar a base de sodagem (lstagem dos elemetos da qual se va seleccoar a amostra); 3º Escolher uma técca amostral; O sub capítulo.. abordará as dversas téccas de amostragem com base em FERRÃO (00) TÉCICAS DE AMOSTRAGEM Segudo BACELAR (999), as téccas de amostragem são utlzadas para seleccoar os elemetos da população de forma a obter uma amostra represetatva. Podem-se dvdr as téccas de amostragem em amostragem aleatóra e ão aleatóras sub dvddo-se cada uma delas em dversas sub categoras. Cada um dos métodos apreseta vatages e desvatages que devem ser tdas em cosderação aquado da escolha de uma ou outra técca. Deste modo, a amostragem aleatóra apreseta algumas vatages como o facto de os crtéros de selecção dos elemetos estarem rgorosamete defdos, ão permtdo que a subjectvdade dos vestgadores ou do etrevstador terveham a escolha dos elemetos e mmzado assm o evesameto mutas vezes troduzdo pelos etrevstadores. São gualmete vatages a possbldade de se determar matematcamete a dmesão da amostra em fução da precsão e grau de cofaça desejados para os resultados. Cotudo, também apreseta desvatages, omeadamete: dfculdade em obter lstages ou regstos actuas e completos da população (base de amostragem); a selecção aleatóra pode orgar uma amostra muto dspersa geografcamete aumetado o tempo e os custos dos estudos e, pode haver dfculdade em estabelecer cotacto com os potecas qurdos. ote-se que a desactualzação ou dados em falta as bases de amostragem (lsta dos elemetos que compõem a população), das quas se extra a amostra, leva a que em todos os elemetos da população teham a mesma probabldade de selecção (os que fazem parte sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 8

10 da população, mas ão da base de amostragem, têm uma probabldade ula de serem seleccoados). Em relação às téccas de amostragem ão aleatóra, estas têm a vatagem de permtr que se obteha a formação com custos mas reduzdos, mas rapdamete e com meores ecessdades de pessoal. Como desvatages, é de referr que há udades do uverso que ão têm possbldade de ser escolhdas; pode ser troduzdo evesameto pela opão pessoal e, ão se sabe com que grau de cofaça as coclusões obtdas são geeralzáves à população. As téccas de amostragem ão aleatóra têm em comum o facto de ão utlzarem o método de selecção aleatóra para os elemetos da amostra. Isto sgfca que ão há garata estatístca de que a amostra seleccoada seja represetatva. ote-se que a aleatoredade ão garate que a amostra a obter seja represetatva, garate apeas que exste uma probabldade sgfcatvamete elevada de que a amostra possua esse qualfcatvo. BACELAR (999). As vatages e desvatages de cada tpo de amostragem devem ser poderadas em cada estudo. O camho a percorrer deve ser o que permta que o erro os resultados dervado de questões amostras seja o mas pequeo possível. A fgura segute apreseta algumas das téccas de amostragem categorzadas em ão aleatóras ou aleatóras. Téccas de amostragem ão Aleatóras Por coveêca Bola de eve Itecoal Por quotas Radom route Aleatóras Smples Estratfcada Por Clusters Mult-etapas Outras FIGURA. TÉCICAS DE AMOSTRAGEM. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 9

11 os próxmos dos sub-capítulos sumaram-se as etapas, desvatages, vatages ou cocetos assocados a dversos tpos de téccas de amostragem aleatóra e ão aleatóra, respectvamete Amostragem Aleatóra: Smples Correspode a um método de selecção dos elemetos da amostra, em que cada um deles tem uma probabldade gual (e ão ula) de ser seleccoado. Cosste em:. umerar cosecutvamete os elemetos da população de a ;. Escolher elemetos medate o uso de um procedmeto aleatóro; 3. Uma vez escolhdos os úmeros, os elemetos da população que lhes correspodem costtuem a amostra. Esta técca raramete é adoptada, pos para além de ser cara é mutas vezes mpratcável por exgr que todos os elemetos da população sejam eumerados. Sstemátca Segudo BACELAR (999), a amostragem sstemátca é uma varate da amostragem aleatóra smples que se usa quado os elemetos da população estão orgazados de forma sequecal. O prmero elemeto é seleccoado aleatoramete; calcula-se em seguda o tervalo de amostragem ( = dmesão da população / dmesão da amostra). Sedo o tervalo da amostragem, cada -ésmo elemeto, a partr do prmero já seleccoado, rá costtur a amostra. O resultado duma tragem sstemátca é, a maor parte das vezes, equvalete ao duma amostra aleatóra smples. A excepção ocorre quado a sequêca dos elemetos da população é afectada pela perodcdade. Se aquela apresetar uma regulardade, um padrão peródco, pode-se correr o rsco de um vés sstemátco. Sumara-se em:. Calcular o tervalo da amostra (k) obtdo pelo quocete /, que deverá ser arredodado ao tero mas próxmo por defeto;. Escolher aleatoramete um úmero j etre e k; 3. Partdo desse úmero, adcoar sucessvamete o valor k, fcado assm seleccoados os elemetos j, j+k, j+k, j+3k,, j+ (-)k, perfazedo. 0 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

12 Estratfcada Esta técca de amostragem usa formação exstete sobre a população para que o processo de amostragem seja mas efcete. A lógca que assste à estratfcação de uma população é a da detfcação de grupos que varam muto etre s, o que dz respeto ao parâmetro em estudo, mas muto pouco detro de s, ou seja, cada um é homogéeo e com pouca varabldade. As três etapas para se defr uma amostra estratfcada são:. Defr os estratos;. Seleccoar os elemetos detro de cada estrato medate um processo aleatóro smples; 3. Cojugar os elemetos seleccoados em cada estrato, que a sua totaldade costtuem a amostra. Pode ser partcularmete efcaz quado a população exstem valores extremos para a característca em estudo, sedo possível agregá-los um estrato separado. Por clusters Requer meos formação a pror, sedo útl a ausêca duma base de amostragem, o que sucede mutas vezes. É especalmete útl quado o uverso estatístco é formado por populações de grade dmesão, dspersas por vastas áreas geográfcas. A amostragem por clusters usa agrupametos aturas de elemetos da população, os quas cada elemeto da população pertece a um só grupo. Só exge que se dspoha de uma lstagem completa das udades amostras prmáras (por exemplo, as turmas de uma escola). Os clusters são escolhdos aleatoramete e detro de cada cluster todos os elemetos são seleccoados, ou seja, só exste uma etapa de amostragem. Está oretada para a selecção de grupos de elemetos e ão de elemetos dvduas. As etapas da amostragem por clusters são: 4. Especfcar os clusters; 5. Seleccoar uma amostra. Mutas vezes é a úca possível de obter porque só exstem dspoíves bases de sodagem que lstam clusters de elemetos da população. A amostragem por clusters é frequetemete usada a prátca porque mutas populações estão já agrupadas em subgrupos aturas. Uma grade vatagem ecoómca é o baxo custo deste método. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

13 Mult-etapas Seleccoa-se em prmero lugar, aleatoramete uma amostra por clusters repare-se que é muto mas fácl obter uma lsta de clusters (por exemplo de escolas) do que uma lsta exaustva dos elemetos que compõem a população (por exemplo, todos os aluos). Em seguda, pode-se realzar ou ão uma seguda etapa, a qual são escolhdos aleatoramete algus elemetos dos clusters seleccoados a fase ateror ou etão, cotuado com a selecção de clusters até se chegar às udades elemetares. Ou seja: Defr os clusters; e seleccoar a amostra. Este tpo de amostragem apreseta as mesmas vatages que a amostragem por clusters Amostragem ão Aleatóra Itecoal Resulta em elemetos seleccoados delberadamete pelo vestgador, geralmete por este cosderar que possuem característcas que são típcas ou represetatvas da população. Isso ão sgfca que a amostra assm obtda seja ecessaramete represetatva da população ada que o vestgador possa ter essa opão. Pode ser aplcada com sucesso as segutes stuações: estudos exploratóros, amostras de dmesão reduzda, mpossbldade de cosegur uma amostra aleatóra, pretede-se delberadamete uma amostra evesada. Cotudo, frequetemete surgem evesametos dfíces de avalar. Sowball bola de eve Idetfcam-se um ou mas dvíduos da população a estudar e pede-se-lhes para que detfquem outros elemetos da mesma população. Este processo repete-se sucessvamete, sedo a amostra fal composta por todos os elemetos detfcados. É ormalmete utlzada quado os elemetos da população são de dfícl acesso ou detfcação e estão ter-relacoados por redes de cohecmeto. Um dos coveetes é que os qurdos tedem a dcar o ome de amgos ou pessoas de relação mas próxma, o que pode orgar uma amostra de pessoas que pesam e se comportam de modo smlar àquele que as dca. Da mesma forma são aqueles socalmete mas vsíves os que têm mas possbldade de serem seleccoados. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

14 Coveêca ão é represetatva da população. Ocorre quado a partcpação é volutára ou os elemetos da amostra são escolhdos por uma questão de coveêca, por sso, o processo amostral ão garate à partda que a amostra seja represetatva. Pode ser usada com êxto em stuações as quas seja mas mportate captar deas geras, detfcar aspectos crítcos do que propramete a objectvdade cetífca, como é o caso a maora dos quértos dspoblzados a web. Quotas É uma amostragem sem-aleatóra. Justfca-se fudametalmete pela exstêca de lstages da população. O pressuposto é o de que as varáves de cotrolo, que defem as quotas, justfcam toda a varação sstemátca a população relatvamete à característca em estudo. Os dos passos fudametas para a sua execução são:. Defr as quotas as quotas são detfcadas dvddo a população em categoras, usado varáves de cotrolo pré-defdas;. Seleccoar os elemetos. Podem-se utlzar quotas depedetes que facltam o trabalho aos etrevstadores, ou quotas terrelacoadas que são mas fáves uma vez que os etrevstadores têm de cumprr uma amostra específca, dstrbuída por dversos factores de estratfcação. as tabelas e apreseta-se um exemplo muto smples de quotas depedetes e de quotas terrelacoadas. Sexo Idade Sexo Masculo Idade Masculo Femo Femo TOTAL TABELA : QUOTAS IDEPEDETES TABELA : QUOTAS ITERRELACIOADAS Como vatages pode-se referr a rapdez, ecooma e facldade de admstração. em sempre garate à partda a represetatvdade da amostra, pos: A amostra pode estar loge de reflectr algus aspectos mportates capazes de fluecar os resultados, por estes ão serem tomados como quotas. O sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 3

15 estabelecmeto de quotas para todas as característcas potecalmete mportates sera uma solução por um lado, mas uma dfculdade por outro, uma vez que, quatos mas crtéros forem detfcados mas dfícl se tora ecotrar dvíduos que os preecham a todos; Como a selecção está a cargo do lvre arbítro dos etrevstadores, estes têm tedêca a segurem certas prátcas sstemátcas como escolher determado tpo de qurdos e evtar outros. Segudo BACELAR (999), aparetemete, esta técca é semelhate à amostragem estratfcada, mas de facto é bastate dferete, uma vez que a selecção dos elemetos da população ão é aleatóra. O objectvo desta técca é o de tetar compesar as otóras sufcêcas da amostragem acdetal. ormalmete procura-se combar a técca de amostragem por quotas com outras téccas (por exemplo radom route) complemetares e sstemátcas que possbltem gerar alguma dversdade a amostra e cotrolar os evesametos sstemátcos mas grtates. Para efectuar a amostragem estratfcada é ecessáro possur uma base de amostragem a qual são cohecdas para cada elemeto da população as característcas que forem usadas como crtéros de estratfcação. De cada um destes estratos populacoas será seleccoada uma amostra. a amostragem por quotas ão é ecessára qualquer base de amostragem. Basta cohecer, a população, a dstrbução das característcas a utlzar. Também os elemetos da amostra ão são seleccoados aleatoramete: são apeas ecotrados segudo um acaso que ão correspode às regras do acaso estatístco, sto é, ão garate a equprobabldade de selecção dos elemetos da população. Radom route percurso aleatóro É utlzado para defr crtéros de movmetação do etrevstador o terreo. Cosste em:. Seleccoar aleatoramete a partr de uma lsta/mapa um edereço ou poto de referêca esta escolha servrá de poto de partda para o etrevstador;. Defr as regras de oretação para o etrevstador o etrevstador é struído para realzar o seu trabalho crcuscrevedo-se a determada área ou segudo um teráro aleatóro a escolha das udades a qurr. Ou seja, é atrbuído ao etrevstador um poto de partda e um poto de chegada o espaço geográfco o qual se va deserolar o quérto, e um crtéro sstemátco e 6 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

16 aleatóro relatvo ao percurso do etrevstador etre esses dos potos (qurr o tercero alojameto de ses em ses edfícos, alterado o lado da rua, por exemplo) DIMESÃO DA AMOSTRA Factores determates a dmesão da amostra Exstem ses factores que se podem cosderar determates a escolha da dmesão da amostra, omeadamete: Característcas da população, ou seja, a varâca da característca em estudo e o úmero de elemetos (a sua dmesão ); Dstrbução amostral do estmador a utlzar; Precsão e cofaça requerdas para os resultados, sedo ecessáro especfcar a dfereça máxma etre a estmatva e o parâmetro ou o ível de cofaça; Custo, pos recolher mas quértos pode ter um aumeto de custo muto elevado; Cosequêcas para os erros de ão amostragem O grade dlema que o vestgador efreta a realzação de um estudo por sodagem é se deve seleccoar uma amostra maor para reduzr o erro amostral, ou se deve cocetrar os recursos e esforços uma amostra de dmesão mas reduzda, para garatr um melhor cotrolo do trabalho dos etrevstadores, uma taxa de respostas mas alta, respostas mas exactas, melhor trabalho de processameto da formação, etc., ou seja, uma redução dos outros erros. Idealmete os esforços são cocetrados a redução smultâea dos erros relacoados com amostragem e ão relacoados com amostragem, apesar das restrções faceras e de tempo torarem este deal dfícl de cocretzar; As téccas estatístcas que serão utlzadas. ote-se que, para que se obteham resultados com um grau de exactdão acetável, algumas téccas estatístcas exgem uma amostra de dmesão maor do que outras. Determação da dmesão da amostra. Fxar os lmtes de erro acetáves;. Ecotrar uma equação que relacoe com a precsão e cofaça desejadas para os resultados; 3. Determar parâmetros descohecdos; 7 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

17 4. Estmar característcas para sub-domíos; 5. Estmar mas do que uma característca; 6. Avalar o ecotrado (custo, tempo, pessoal e materal ecessáro). O cálculo da dmesão da amostra em amostras aleatóras pode ser efectuado com base em fórmulas relatvamete complexas, as quas etra o úmero de elemetos da população (úmero de clusters, úmero de elemetos por cluster, úmero de estratos, úmero de elemetos por estrato, etc.), a varâca, o erro assocado e o valor retrado da dstrbução Gaussaa correspodete ao grau de cofaça mposto para a estmatva. De seguda apresetam-se estas fórmulas sumaradas a tabela 4 com base em FERRÃO (00). A tabela 3 apreseta a otação que será utlzada as fórmulas posterores. A tabela 4 apreseta uma sítese das fórmulas que se devem utlzar quado se preteder calcular o úmero de observações ecessáro para estmar uma méda, proporção ou total, com uma ampltude máxma de erro gual a B para cada tpo de amostra aleatóra. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 8

18 DESIGAÇÃO POPULAÇÃO AMOSTRA úmero de elemetos -ésma observação Méda Total Proporção (varáves dcotómcas) ESTRATIFICADA µ = = = = / = τ = = / = p = pˆ = = / = / / úmero de estratos L L úmero de elemetos úmero de elemetos o estrato j-ésma observação o estrato Méda do estrato Méda Total Proporção o estrato (varáves dcotómcas) Proporção = j = L L j µ = j / = j / = = L µ = µ = = L / L st / = τ = µ st = p = L = = j / pˆ = j / = = L p = p pˆ = pˆ = / L st / = st sgfca que se está a utlzar uma amostra estratfcada. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 9

19 POR CLUSTERS úmero de clusters M m úmero de elemetos o cluster úmero de elemetos Dmesão méda dos clusters j-ésma observação o cluster Méda por cluster Méda global Total Proporção (varáves dcotómcas) MULTI-ETAPAS = M = = = M = = / M = / m j M j µ. = j / M cl = = j= M m = j= j / m µ = j / cl = j / = j= M m m = j= = τ = j cl = j / p = = j= M = j= j m = j= = / pˆ cl = j / úmero de clusters M m úmero de elemetos o cluster úmero de elemetos por cluster úmero de elemetos j-ésma observação do cluster Méda o cluster Méda global Total Proporção o cluster (varáves dcotómcas) Proporção = M = m j j m m = j= = µ = = j / = M me j / = µ = µ = m = M = j= / m me j / = j= τ = j me = m = p = p = j / j= M j / j= p = p / pˆ me = = m = j= j me / m / m TABELA 3. OTAÇÃO UTILIZADA AS FÓRMULAS DA TABELA 4. FOTE: FERRÃO (00). sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 m 0

20 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

21 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

22 Determação de em amostras ão aleatóras as amostras ão aleatóras determa-se a dmesão da amostra que é possível custear ou etão adopta-se a dmesão já utlzada, com sucesso, em estudos aterores das mesmas característcas. Também é possível utlzar as expressões da tabela 4 para o caso das amostras aleatóras, ou seja, determar qual a dmesão que sera ecessára se a amostra fosse aleatóra, sedo que o valor ecotrado é meramete dcatvo. 3.- MÉTODOS DE RECOLHA DOS DADOS Os fudametos dos város métodos de recolha dados um quérto são pratcamete os mesmos. Cotudo, já a altura do plaeameto se deve decdr qual o método de recolha de formação que se rá utlzar, pos a costrução do questoáro depede muto do método escolhdo. ão exste um método óptmo de recolha de dados. Cada um tem as suas vrtudes e os seus defetos. Por exemplo, evar os quértos por correo tem custos relatvamete baxos, mas tem baxas taxas de resposta se ão houver um esforço de acompahameto. Os quértos por correo electróco podem ter custos ada mas baxos, mas ão se podem utlzar em uversos geércos porque apeas são aplcáves a pessoas com acesso ao correo electróco. As etrevstas pessoas são caras, mas permtem a utlzação de questoáros mas logos. ormalmete defem-se três métodos de recolha da formação: Etrevsta pessoal; Etrevsta telefóca; Questoáro por correo. A escolha do método a utlzar deve depeder dos segutes factores: Tpo de população, ou seja, o uverso; Represetatvdade da amostra; Tpo de questões; Custo e pessoal dspoível. Segudo GOODE (979), a adequação de um questoáro remetdo, ou seja, autoadmstrado, depederá das exgêcas do problema da pesqusa em relação: Ao tpo de formação ecessára; 3 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

23 Uma quatdade muto extesa de dados ão pode ser obtda com o questoáro. O questoáro é efcaz somete quado o qurdo é capaz ou quer expressar as suas reacções claramete. A dfereça etre um questoáro e uma etrevsta ão está a questão da fraqueza, mas a dmesão e profuddade, pos tato um bom questoáro como uma boa etrevsta pode obter respostas fracas sobre quase todos os assutos. Ao tpo de qurdo alcaçado; O questoáro auto-admstrado ão pode ser usado para uma amostra represetatva de toda a população porque, por exemplo, é ecessáro saber ler e escrever. À acessbldade dos qurdos; À partda pesa-se que o questoáro é mas barato e leva meos tempo que a etrevsta, mas em sempre é assm, pos, por exemplo, o tempo de espera para as respostas aos questoáros pode ser muto elevado; a questão do custo depede de quão dspersa está a amostra. As despesas ão devem ser calculadas a base do úmero de etrevstas ou questoáros a serem obtdos, mas a base da quatdade de formação útl a ser obtda. GOODE (979). À precsão da hpótese. Quato mas claramete focalzada é a hpótese, mas efcaz é o questoáro auto-admstrado. Aalsado os prós e cotras de cada método de recolha de dados pode-se escolher aquele que será mas vatajoso para a stuação partcular em estudo COCEPÇÃO DAS QUESTÕES Um dos camhos para o sucesso de um quérto resde a clusão de questões cocsas e de fácl compreesão. Por muto atractvo que seja o questoáro, ão servrá de muto se as questões forem pobres, pos o valor dos dados a obter será reduzdo. De seguda apresetam-se algus coselhos prátcos sobre a cocepção das questões de um questoáro de sucesso com base em HILL (000). Devem-se utlzar questões bem escrtas e testadas, tato quato possível. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 4

24 O vestgador deve pesar bem se quer formação do tpo geral ou específco. Pos ão é possível fazer ferêcas correctas sobre attudes, opões, satsfações ou gostos específcos a partr das respostas dadas às pergutas geras. É precso também aalsar cudadosamete o objectvo geral (o tpo de formação que se quer solctar factos, opões, attudes, preferêcas, valores, satsfações) de cada uma das pergutas que se está a serr o questoáro. Em relação às pergutas para solctar factos é precso ter especal ateção se se está a pedr factos sesíves demas, ou seja, formação que o qurdo ão está teressado em forecer; detalhes descohecdos pelos qurdos ou, detalhes que obrgam os respodetes a gastar muto tempo a recolha de formação para preecher o questoáro. Pode-se também colocar a questão se serão preferíves pergutas de resposta aberta ou pergutas fechadas. As pergutas abertas têm a vatagem de poderem dar mas formação e, mutas vezes formação mas rca e detalhada ou até esperada. o etato, também apresetam as segutes desvatages: Mutas vezes as respostas ecesstam de ser terpretadas ; É precso muto tempo para codfcar as respostas; ormalmete é precso utlzar pelo meos dos avaladores a terpretação e codfcação das respostas; As respostas são mas dfíces de aalsar estatstcamete; A aálse requer muto tempo. As pergutas fechadas têm a vatagem de ser fácl aplcar aálses estatístcas para aalsar as respostas, sedo mutas vezes possível aalsar os dados de maera sofstcada. Outro facto a ter em cota quado se formulam pergutas está relacoado com a extesão e clareza das pergutas. ote-se que a clareza está versamete relacoada com a extesão de uma perguta. Devem-se escrever pergutas curtas, com palavras e staxe smples e evtado, sempre que possível, o uso de termos téccos. PITO (986) defede que, dado o elevado úmero de quértos exgdo pela represetatvdade estatístca, as vatages das pergutas fechadas acabam por vgar sobre as possíves desvatages. Algumas das falhas mas comus a costrução das pergutas que se devem evtar são: pergutas múltplas (uma perguta que cotém duas ou mas pergutas); pergutas 5 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

25 que usam uma mstura de cojuções e dsjuções; pergutas ão-eutras (as pergutas para medr opões, attudes ou satsfações devem ter uma forma eutra, ou seja, ão devem ter uma forma que covde apeas a uma resposta postva ou egatva) e, pergutas defdas (perguta vaga, o respodete tem a resposabldade de defr o sgfcado da perguta podedo utlzar crtéros dferetes). Em relação ao úmero de respostas alteratvas a usar, quado o objectvo da perguta é solctar factos quattatvos e ão se cohece a provável gama (e dstrbução) dos valores, é útl usar uma das segutes opções: Escrever uma perguta aberta para a qual a resposta seja um valor exacto escrto pelo respodete. Caso seja coveete categorzar as respostas após a recolha dos dados, é fácl olhar para a gama de valores e sua dstrbução para decdr quatas categoras usar para classfcar as respostas. Quado o peddo de um valor exacto for sesível demas covém usar uma perguta fechada. É útl cosultar pessoalmete algus potecas respodetes para obter coselho prátco sobre a provável gama de valores, bem como sobre o úmero óptmo de respostas alteratvas (categoras) assocadas à perguta. Outra questão que mutas vezes se põe é se se deve utlzar um úmero par ou ímpar de respostas alteratvas. Perate um úmero ímpar de respostas alteratvas, mutos qurdos têm tedêca para dar a resposta de uma maera coservadora e repoderem o meo da escala, pesado que é mas seguro ão dar uma opão forte (em postva em egatva) mas provavelmete têm uma opão mas forte do que mostram. Portato, um úmero de respostas alteratvas ímpar pode ajudar à obteção de respostas erradas. As respostas são erradas porque ão são represetatvas das verdaderas opões (ou attudes ou satsfações) de uma grade parte dos qurdos. Esta tedêca está especalmete lgada a pergutas sesíves sobre attudes, opões ou satsfações, ou seja, pergutas que tratam de assutos potecalmete embaraçosos, ou pergutas em que o respodete pesa que pode estar a correr um rsco se respoder de forma clara portato prefere evtar o rsco por meo de uma resposta mas ou meos eutra. Por outro lado, um úmero par de respostas alteratvas, tal como já se dsse aterormete, é de evtar pos obrga todos os qurdos a dar uma opão (ou attude) deftvamete postva ou egatva. ão é possível dar uma opão eutra sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 6

26 mesmo o caso em que a opão do qurdo seja verdaderamete eutra. Portato, um úmero par de respostas alteratvas pode forçar a respostas erradas. ão há uma regra de ouro para decdr se é melhor utlzar um úmero par ou ímpar de respostas alteratvas. Cotudo, se o vestgador pesar que uma varável é sesível, pode ser útl utlzar um úmero par de respostas alteratvas. Se o questoáro for aómo e ão cotver pergutas sesíves geralmete é recomedado que se utlze um úmero ímpar de respostas alteratvas. Podem surgr problemas com escalas ordas quado: Há cofusão os tpos de resposta alteratva (alteratvas de frequêca e msturadas com alteratvas de quatdade); A gama de respostas alteratvas é demasado restrta; As respostas alteratvas ão têm descrções e é ecessáro terpretar os valores da escala, pos a terpretação ão é úca (ordem crescete ou decrescete); As respostas alteratvas são apeas parcalmete descrtas (por exemplo, com descrções só os extremos). Quado as pergutas para solctar opões ou attudes sobre assutos precsam de cohecmeto específco, é preferível escrever duas pergutas: uma prmera para vestgar sobre o cohecmeto do respodete e uma seguda (só para aqueles que têm cohecmeto adequado) para vestgar as suas opões ou attudes. ormalmete a prmera ou últma secção do questoáro referem-se às característcas socoecoómcas dos respodetes ao questoáro. O motvo pelo qual por vezes se coloca esta secção o fal deve-se ao facto de serem pergutas smples de respoder o que poderá motvar o respodete a termar o questoáro. É muto mportate recolher apeas as característcas estrtamete relevates à vestgação porque pergutas sobre característcas ão ecessáras e que ão vão ser cluídas as aálses dos dados, aumetam o cumprmeto do questoáro e, portato, aumetam o rsco de falta de cooperação dos respodetes. Para escolher as característcas relevates é precso cosderar os dos aspectos segutes: todas as hpóteses da vestgação e os detalhes dos casos requerdos para descrever a amostra e replcar a vestgação. As questões de um quérto devem estar ormalmete estruturadas e padrozadas. A estrutura pretede reduzr o evesameto. Por exemplo, as questões devem ser ordeadas sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 7

27 de tal forma que uma questão ão fluece a resposta às questões subsequetes. Os quértos são padrozados para assegurar a cofaça, a geeraldade e a valdade. É fudametal ter em mete que a formulação de pergutas ão pode perder de vsta as característcas da população a qurr. PITO (986) DESEHO DO QUESTIOÁRIO Um questoáro pouco atractvo pode levar a que as pessoas ão o preecham, por sso, este é também um tópco muto mportate. Ao se desehar um questoáro deve-se ter presete dos objectvos reduzr a ão resposta e mmzar o erro de medda. O questoáro deve ser costruído de modo a: Motvar os qurdos a preechê-lo; Permtr a correcta letura das questões; Istrur os qurdos a respoder a cada questão, com struções claras de sequêca o preechmeto do questoáro; Garatr a sua correcta devolução depos de preechdo. Os questoáros devem ter uma trodução que coteha os segutes aspectos: Um peddo de cooperação o preechmeto do questoáro; A razão da aplcação do questoáro; Uma apresetação curta da atureza geral do questoáro; O ome da sttução (faculdade, cetro de vestgação); Uma declaração formal da cofdecaldade das respostas; Uma declaração formal da atureza aóma do questoáro. Outra questão que se deve ter em cosderação é o layout do questoáro, omeadamete: A clareza e o tamaho do questoáro; As secções e as pergutas do questoáro; As struções. Por fm há que aalsar a aparêca estétca do questoáro e fazer uma verfcação fal do questoáro. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 8

28 3.5- PRÉ-TESTE DO QUESTIOÁRIO Um pré-teste ão é mas que uma revsão formal do questoáro e da metodologa de recolha de dados que lhe está assocada. O que por vezes se faz é aplcar o questoáro a uma sub amostra peddo colaboração para detfcar possíves problemas. Deste modo, deve-se, sempre que possível, realzar um estudo prelmar para verfcar a relevâca, clareza e compreesão das pergutas aplcadas aos respodetes. Por exemplo, quado se procede à tradução do questoáro para dversas líguas, deve-se fazer um estudo prelmar para testar a tradução do questoáro tedo em cosderação: o sgfcado pessoal e o sgfcado comum de uma palavra; o problema da polsséma (uma palavra que tem város sgfcados comus); o problema de versões dferetes de uma lígua (por exemplo: português de Portugal e do Brasl) e o problema da lguagem domátca e da lguagem coloqual. Uma técca que se poderá utlzar é a do traduz retraduz, ou seja traduzr e verfcar a tradução do questoáro voltado a traduzr para a lígua orgal e etão comparar o orgal com a retradução O PLAO DO QUESTIOÁRIO Segudo HILL (000) os passos a segur a costrução de um questoáro são:. Lstar todas as varáves da vestgação, cludo as característcas dos casos;. Especfcar o úmero de pergutas para medr cada uma das varáves, com especal ateção a quado se tem varáves latetes, ou seja, varáves que ão podem ser observadas em meddas drectamete, mas que podem ser defdas a partr de um cojuto de outras varáves (possíves de serem observadas ou meddas) que medem qualquer cosa em comum (omeadamete, a varável latete); 3. Escrever uma versão cal para cada perguta; 4. Pesar cudadosamete a atureza da prmera hpótese geral e as varáves e pergutas cas com ela assocadas. Idetfcar em seguda que tpo de hpótese se tem (hpótese que trata de dfereças etre grupos de casos ou hpótese que trata de relações etre varáves); 5. Cosoate o tpo de hpótese geral, decdr quas as téccas estatístcas adequadas para testar a hpótese e ter em ateção os pressupostos destas téccas; sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 9

29 6. Decdr, com base a formação ateror, o tpo de resposta desejável para cada perguta assocada com a hpótese geral (respostas qualtatvas descrtas por palavras pelo respodete; qualtatvas escolhdas pelo respodete a partr de um cojuto de respostas alteratvas forecdo pelo autor do questoáro ou, quattatvas escolhdas pelo respodete a partr de um cojuto de respostas alteratvas forecdo pelo autor do questoáro); 7. Com base a formação dos últmos 3 passos escrever a hpótese operacoal; 8. Cosderar as pergutas cas (e os tpos de respostas) assocadas com a prmera hpótese operacoal e, caso ecessáro, lmar arestas (polmeto) de forma a chegar às versões fas para corporar o questoáro; 9. Verfcar se as versões fas das pergutas e das respostas ada são adequadas para testar a hpótese operacoal; 0. Repetr os passos 3-9 para as outras hpóteses geras;. Escrever as struções assocadas com as pergutas para formar o respodete como deve respoder;. Plaear as secções do questoáro. Em suma, um questoáro para ser efcete a recolha de formação deve: mater a cooperação e motvação do respodete sedo para sso determate o comprmeto do questoáro e o tema em estudo; comucar com o respodete ou seja, utlzar palavras que ele coheça, ão fazer pergutas ambíguas e empregar cocetos abstractos ou vagos; ajudar o respodete a formular as suas respostas explcado sem duzr a resposta ou, utlzado auxílos vsuas para recordar stuações ou ada, as pergutas abertas, se a resposta ão atgr os objectvos pode-se estmular a dar mas formação através de frases como e mas alguma cosa?, e que outras razões? ; evtar evesametos através do modo como a questão é escrta; facltar o trabalho do etrevstador ou do respodete elaborado um questoáro bem orgazado, com as pergutas devdamete umeradas, com dcações, com espaço sufcete para as respostas, e com tamaho de fote adequado, boa mpressão, etc; facltar o processameto da formação codfcado prevamete as categoras de resposta das pergutas que a sso se adequam. Cosegur uma taxa de respostas acetável exge um acompahameto sstemátco do estudo, podedo ser adoptadas dversas prátcas. Pode-se, por exemplo, fazer acompahar o questoáro de uma carta de apresetação persoalzada, hoesta, teressate, 30 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

30 persuasva mas curta dado resposta a potecas questões que podem surgr ao qurdo como a atureza do estudo, porque fo o qurdo escolhdo, quem está a fazer o estudo, porque é mportate a colaboração do qurdo, o que se pretede que faça, que uso terá a formação forecda e se o respodete será ou ão matdo o aomato. Esta carta deve, preferecalmete, ser assada à mão por um resposável do estudo. Pode-se também clur com o questoáro um evelope com porte pago para devolução do questoáro respoddo. A oferta de pequeas recompesas, moetáras ou de outro tpo, pode gualmete ser uma estratéga a adoptar, embora se coloquem algumas ressalvas esta técca de dução de respostas. Exstem stuações em que o qurdo ão sabe de todo o que respoder, mas como está a ser alcado com uma recompesa se respoder, esforça-se por fazê-lo, expressado opões que ão traduzem o seu setmeto real. Uma táctca também utlzada cosste em cotactar o respodete ates de este receber o questoáro. A promessa de cofdecaldade pode também surtr efeto em algus respodetes, bem como o compromsso em comucar os resultados do estudo. Algus prcípos essecas para maxmzar o evolvmeto e valor de um quérto postal são: despertar a curosdade; trasmtr com clareza a mportâca do estudo; fazer setr ao respodete a sua mportâca o estudo; ser teressate; ser de fácl compreesão, resposta e devolução. As questões abertas devem ser evtadas, especalmete em questoáros por correo, pos elas tedem a causar alguma asedade ao qurdo o que pode resultar a rejeção de todo o questoáro. O deseho do questoáro flueca em muto a valdade da formação. A própra forma como a perguta é feta pode evesar a resposta. As pergutas devem ser expressas da forma mas eutral possível, ão devem ser ambíguas e devem ser escrtas uma lguagem que seja smples o bastate para ser etedda por respodetes de todos os íves de telgêca. Devem-se evtar pergutas vagas, ambíguas, com dupla egações, com fortes apelos à memóra e pergutas que dexem o qurdo respoder à sua maera. Mutas pessoas pesam que é fácl desehar um questoáro porque é comum o da a da fazer pergutas. Cotudo, a coversação as pergutas seguem-se de formas dferetes coforme as respostas que vão sedo dadas equato que os questoáros sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 3

31 teressa ter sempre as mesmas pergutas e ordem para cada membro da amostra, desvado apeas se as struções o permtrem. Desehar um questoáro de sucesso é uma arte que ão pode ser apredda sem prátca. ote-se que com maus dados só se podem obter maus resultados, por mas malabarsmos matemátcos que possam ser utlzados. 4- ETAPA : RECOLHA DOS DADOS Uma vez plaeado e desehado o quérto, pode-se começar a recolher os dados. De modo a ter sucesso esta etapa, devem-se recolher dados claros, ão evesados e actualzados de um modo efcete. 5- ETAPA 3: ACESSO AOS DADOS esta etapa pretede-se ler os dados obtdos pelo método de recolha para o software aalítco ode procederá à aálse. As fotes podem ser as mas varadas, depededo do método de recolha utlzado. 6- ETAPA 4: PREPARAÇÃO DOS DADOS O objectvo desta etapa é garatr que os dados estão protos para aálse. Para sto será ecessáro detfcar e corrgr erros. Ao se começar a usar um cojuto de dados evtavelmete ecotrar-se-ão problemas. Os dados podem ter elemetos cosstetes, completos ou errados. Segudo DAVIDSO (00), estma-se que 80% do tempo assocado ao processo de prospecção e descoberta de formação será gasto a ldar com esses problemas. uma vestgação por questoáro podem surgr dversos erros, sejam motvados pela amostragem ou ão. Os erros motvados pela amostragem podem ser de váras tpos: Varabldade amostral ou erro amostral que decorre da própra oção de amostra, pos uma amostra em sempre é represetatva da população; 3 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

32 Evesameto amostral resultate de um erro sstemátco que desva o poto cetral da dstrbução do estmador; represeta uma tedêca para deslocar esse poto para a dreta ou esquerda do verdadero valor do parâmetro. O evesameto amostral pode ser causado: Por se utlzar uma lstagem de elemetos da população para fazer a selecção da amostra base de sodagem completa ou mperfetamete defda, levado a cosderar dvíduos que ão deveram ser cosderados ou a omtr outros que deveram ser cosderados; Por uma completa ou correcta execução do processo de amostragem, frequetemete motvada pelas ão respostas ou mssg values; Por se utlzarem maus estmadores. Os erros ão motvados pela amostragem podem ser: Erros a recolha da formação (exemplo: em etrevstas pessoas): Por factores comportametas tato do etrevstador como do etrevstado, ou seja, a mpressão que o etrevstador e o etrevstado têm um do outro; Por característcas trísecas; Por factores pscológcos; Por característcas vsíves (dade, educação, sexo, ); Por attudes, percepções, expectatvas, motvações; Pela forma como se colocam as questões (por exemplo, se as questões ão forem ldas da forma como estão redgdas); Ao se prestar esclarecmetos, caso se duza a resposta do qurdo; o regsto das respostas, prcpalmete quado são pergutas abertas; Por uma resposta adequada ou exacta seja por capacdade ou por relutâca de respoder com exactdão; Por falsfcação, por exemplo, o caso de se forjar uma etrevsta, sem uca se ter tdo cotacto com o qurdo ). Erros o processameto da formação (erro de complação ou codfcação). Os dferetes tpos de erros ão são depedetes us dos outros, mas para motvos prátcos é razoável cosderar dferetes tpos de erros separadamete e procurar estratégas para reduz-los um por um, etão é de esperar que o total do erro do questoáro seja meor. 33 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

33 Como parte do processo de preparação dos dados pode-se fazer uma varedade de acções com a matéra-prma, como por exemplo omear de forma cosstete e ão ambígua. Estes procedmetos de rota ajudam a assegurar que os dados são de boa qualdade e tegrdade. Ates de se efectuar qualquer tpo de aálse é ecessáro examar os dados, de modo a detfcar outlers, mssg values e verfcar se os dados cumprem os pressupostos do método de aálse que se pretede utlzar. As represetações gráfcas (assuto desevolvdo o sub-capítulo 3.5) são extremamete útes esta etapa, pos permtem: Examar a forma da dstrbução: através, por exemplo, de um hstograma podese gahar uma perspectva da forma da dstrbução da varável; Examar as relações etre as varáves: através, por exemplo, de um gráfco de dspersão (ou de uma matrz de gráfcos de dspersão) pode-se examar as relações etre duas ou mas varáves; Idetfcar outlers: através, por exemplo, de um gráfco de bgodes. Um dos problemas dos dados a tratar esta etapa são os mssg values (dados em falta). Os dados em falta podem ser causados por factor extero ao qurdo (erro a trodução dos dados ou a recolha dos dados) ou etão, podem dever-se ao qurdo (recusa à resposta). Quado os mssg values se devem ao qurdo, o vestgador deve tetar ecotrar padrões que possam caracterzar o processo de dados em falta, ou seja, descobrr o grau de aleatoredade presete os mssg values. É ecessáro eteder o mpacto que os dados em falta podem ter a aálse e ecotrar alteratvas para resolver o problema. Ates de mplemetar uma solução para os dados em falta, o vestgador deve eteder o que está subjacete ao processo de dados em falta. LEVY (999) apota algus métodos para ldar com os dados em falta dspoíves em dversos packages estatístcos, omeadamete: Complete case aproach: método a utlzar apeas se houverem poucos dados em falta e se a amostra for sufcetemete grade para permtr a elmação de todos os dvíduos (casos) com mssg values; sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 34

34 Delete case(s) ad/or Varable(s): o vestgador determa a extesão dos dados em falta para cada dvíduo (caso) e varável e etão elma os dvíduos ou varáves com úmero excessvo de dados em falta. Métodos de trodução: (por exemplo: replace wth mea) estmar o mssg value baseado-se em valores de outras varáves ou de outros casos a amostra. Utlzar um destes métodos pode ser útl porque fca-se com os dados completos e com as relações que foram detfcadas os restates dados, mas pode ser pergoso porque se está a falsfcar os dados. É ecessáro aalsar o mpacto que essa falsfcação terá a aálse. A escolha certa depede de: dmesão da amostra completa; atureza da aálse estatístca que o vestgador pretede efectuar; varável com maor úmero de valores mssg essa aálse; dstrbução dos dvíduos (casos) com mssg values o cojuto de varáves a aálse. Outra questão de realce esta etapa é a detfcação de outlers. Outlers são observações com uma combação úca de característcas detfcada como dsttamete dferete das outras observações; são casos que podem dstorcer as relações por serem úcos uma ou mas das varáves em estudo. Podem ser beéfcos ou problemátcos, mas devem ser examados o cotexto da aálse e devem ser avalados pelo tpo de formação que forecem. Quado beéfcos, embora dferetes da maora da amostra, podem dar dcações das característcas da população que ão seram descobertas o curso ormal da aálse. Os outlers podem resultar de: Erros a etrada dos dados ou a codfcação (devem ser elmados a fase de lmpeza dos dados); Observação devda a um eveto extraordáro (este caso o vestgador deve decdr se esse eveto deve ser represetado ou elmado); Observações atípcas para as quas o vestgador ão tem explcação (se o vestgador achar que eles represetam um segmeto da população devem ser retdos); Observações ormas em cada varável dvdualmete, mas com uma combação úca de valores as dversas varáves, ou seja, outlers multvarados (devem ser retdos, a ão ser que haja formação sufcetemete evdete que descarte a observação de ser um membro váldo da população). 35 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

35 Os outlers podem ser detfcados de forma uvarada (por exemplo, através de um hstograma), bvarada (detfcado potos solados o gráfco de dspersão, por exemplo) ou, de forma multvarada (através, por exemplo, de uma dstâca de Mahalaobs). Outro passo mportate desta etapa de preparação dos dados é verfcar se os dados cumprem os pressupostos das téccas de aálse que se pretede utlzar. Algus dos pressupostos mas comus são a ormaldade, a homocedastcdade e a leardade. Vejase etão, para cada um destes pressupostos, as formas de detfcação. ormaldade: Pode-se detfcar grafcamete através de um hstograma ou, aplcado testes estatístcos como kurtose e swewess (ver sub-capítulo 3..). z skewess = skewess / (6/) / z kurtoss = kurtoss / (4/) / Se o valor z for superor ao valor crítco etão a dstrbução é ão gaussaa. Homocedastcdade (relacoada com a varâca dos desvos ão costate): Pode-se detfcar grafcamete através de um gráfco de dspersão dos resíduos, pos se houver correlação etão há homocedastcdade. Também se podem aplcar os testes estatístcos de Levee e de Box s M. (ver PIDYCK (99)) Leardade: Pode-se detfcar através de um gráfco de dspersão ou fazedo uma aálse de regressão. Como forma de resolução o caso de um dos pressuposto ão ser cumprdo, podemse aplcar trasformações aos dados (o sub-capítulo 3.4.., aquado da abordagem à aálse de regressão múltpla são dados algus exemplos de trasformações). sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 36

36 7- ETAPA 5: AÁLISE DOS DADOS O objectvo desta etapa é extrar formação útl dos dados recolhdos para suporte ao processo de tomada de decsão. Qualquer formação obtda tem um valor tríseco. A chave é extrar esse valor. Exstem úmeros procedmetos estatístcos para aálse de dados, depededo do que se deseja saber e do tpo de medda das varáves (dados). As téccas estatístcas podem ser classfcadas de váras maeras, por exemplo: Téccas paramétrcas e ão-paramétrcas; Téccas que tratam de dfereças etre amostras de casos, e téccas que tratam da relação etre varáves (para uma só amostra de casos); Téccas uvaradas, téccas bvaradas e téccas multvaradas. ote-se que uma técca pode ser, por exemplo, smultaeamete uma estatístca dutva e um método ão-paramétrco. este capítulo, cada técca será apresetada apeas o sub-capítulo correspodete à classfcação mas comum, podedo ser apresetada como exemplo em outro sub-capítulo ode também se equadra. Tal como já fo referdo, o tpo de técca escolhda depede muto da escala de medda das varáves. Deste modo, os dversos tpos de escalas exstetes são: Escalas ão métrcas Escala omal se se estver a falar de categoras cuja sequêca é arbtrára, pos os úmeros codfcam apeas omes, são rótulos (e.g., sexo, cor dos olhos). As metodologas que podem ser utlzadas o tratameto estatístco deste tpo de dados são aquelas que evolvem cotages de efectvos em cada categora (ou proporções). ão é lícto fazer operações artmétcas com dados omas. Escala ordal se exstr uma ordeação atural das categoras (e.g., classes etáras, habltações lteráras). o tratameto estatístco deste tpo de dados podem ser usadas metodologas destadas a aálse de ordes (raks), assm como metodologas para dados omas. Escalas métrcas Escala tervalar se o zero da escala for arbtráro, sto é, ão correspoder à aulação da característca em estudo (e.g., temperatura), pelo que as comparações sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 37

37 ordas e as operações de adção e subtracção fazem setdo, mas a dvsão é uma operação legítma. Escala de razões se o zero da escala correspoder de facto à aulação da característca em estudo (e.g., peso, velocdade), pelo que quer ordeações quer operações artmétcas, sejam elas de adção e subtracção, sejam elas de comparação através de quocetes, são legítmas. Segudo HILL (000), os dos tpos de escala mas frequetemete utlzados em questoáros são as escalas omas e ordas. o etato, para medr algumas característcas dos casos, também se usam escalas métrcas (escalas de tervalo e escalas de razões). Veja-se de seguda, segudo HILL (000), as téccas estatístcas mas adequadas para aalsar respostas dadas em cada um dos tpos de escala. Escala omal As escalas omas forecem dados a forma de frequêcas. Isto sgfca que o que se tem é o úmero de respostas em cada categora da escala. As aálses estatístcas adequadas são prcpalmete as téccas ão-paramétrcas. Escala ordal As pergutas que orgam respostas uma escala ordal podem ser de dos tpos. Sedo o tpo um cojuto de tes que o qurdo tem de avalar us em relação aos outros. Ou seja, o qurdo tem de dar uma ordeação aos tes. O tpo cosste em avalar um só tem em termos de uma varável (por exemplo, pergutas para avalar a satsfação). Para aalsar as respostas a uma perguta do tpo é comum utlzar-se uma aálse de varâca de Fredma (ver sub-capítulo 3...5). Em relação ao tpo, embora essas pergutas usem escalas ordas, quado a dstrbução das respostas é umodal e mas ou meos gaussaa, é vulgar tratar os valores umércos lgados com as respostas como tedo sdo obtdos através de uma escala métrca. Usam-se ormalmete métodos paramétrcos (por exemplo: teste t, AOVA, correlações do tpo Pearso e mesmo aálses multvaradas aálse factoral, aálse dscrmate, etc.) (ver sub-capítulos correspodetes aos métodos paramétrcos e à aálse multvarada). Ates de se utlzar um destes métodos é muto mportate verfcar se os dados estão mas ou meos de acordo com os pressupostos da respectva técca. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 38

38 Escala de tervalo É legítmo aplcar todos os métodos paramétrcos e ão-paramétrcos a varáves meddas este tpo de escala. Mas é preferível, sempre que os pressupostos o permtam, utlzar métodos paramétrcos porque são mas potetes. Escala de razões É possível utlzar todos os métodos paramétrcos mas, como sempre, a aplcação destes métodos é precso verfcar que os dados satsfazem razoavelmete bem os pressupostos dos métodos aplcados. 7.- ESTATÍSTICA DESCRITIVA versus ESTATÍSTICA IDUTIVA Uma estatístca descrtva descreve, de forma sumára, alguma característca de uma ou mas varáves forecdas por uma amostra de dados. As estatístcas dutvas permtem avalar o papel de factores lgados ao acaso quado se está a trar coclusões a partr de uma ou mas amostra de dados. Ates de se avaçar para a costrução de modelos explcatvos deve-se cohecer os dados, ou seja, realzar uma aálse descrtva que dê uma vsão sobre os dados. Os objectvos de uma aálse descrtva são: stetzar os dados, descrever as varáves de teresse. Há quem defa a aálse descrtva como a forma de cohecer o passado ou o presete. Para estes teórcos, ferr é cohecer o futuro. A aálse ferecal dos dados ajuda a prever futuros desevolvmetos. a estatístca descrtva ão se assume qualquer forma para a dstrbução aparete, apeas se descreve umérca e grafcamete uma colecção de dados. Quado se pretede ferr algo sobre a dstrbução da população subjacete aos dados, etra-se o domío da ferêca estatístca. Iferr é crar um modelo explcatvo (por exemplo um modelo de regressão) para um comportameto ou attude futura. O modelo mostrará quas as varáves mportates e atrburá a cada uma um ível de mportâca. A ferêca estatístca preocupa-se essecalmete com dos tpos de problemas: estmação de parâmetros populacoas e teste de hpóteses. A dfereça fudametal etre estatístca descrtva e ferêca estatístca resde o facto de esta últma haver avalações probablstas sobre a precsão das estmações ou sobre a fabldade das decsões tomadas. 39 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

39 7..- ESTATÍSTICA DESCRITIVA Como forma de apresetação das estatístcas descrtvas, é comum utlzarem-se represetações tabulares ou gráfcas, omeadamete: tabelas com frequêcas absolutas e relatvas ou relatvas acumuladas, hstogramas e polígoos de frequêcas ou polígoo de frequêcas acumuladas, gráfcos de barras, gráfcos crculares, etre outros. As represetações gráfcas serão abordadas em maor profuddade o sub-capítulo 3.5. Sedo: º total de valores observados F frequêca absoluta de um valor da varável. O úmero de vezes que esse valor fo observado. f frequêca relatva de um valor da varável. Dado pelo quocete F /. Estas estatístcas podem ser dvddas em: Meddas de tedêca cetral Méda (assume um valor que é cetral em relação aos dados que costtuem a amostra); Medaa (valor da varável estatístca preceddo por 50% das observações); Moda (valor mas frequete, ou seja, o que aparece mas vezes o cojuto dos valores observados). Meddas de ordem Quarts (Q k quartl da ordem k, é o valor da varável que é preceddo por k/4 das observações); Decs (D k decl da ordem k, é o valor da varável que é preceddo por k/0 das observações); Percets (P p percetl da ordem p, é o valor da varável que é preceddo por p% do total dos valores observados). Meddas de dspersão Ampltude do tervalo de varação (dfereça etre o valor máxmo e o valor mímo dos dados. ão é muto fável porque pode ser afectada por valores atípcos dos dados extremos); Ampltude do tervalo de varação ter-quarts (tervalo cujos extremos são o prmero e o tercero quarts); Desvo-padrão (raz quadrada da varâca. Valor absoluto de um erro típco dos dados em relação à méda amostral); 40 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

40 Varâca (descreve a dspersão de uma amostra ou população permte fazer uma ferêca acerca da varabldade de uma população de grades dmesões a partr de uma amostra aleatóra lmtada); Coefcete de varação (dca que percetagem da méda represeta o desvopadrão). Meddas de assmetra Skewess (dca se a curva que represeta os dados é assmétrca egatva, smétrca ou assmétrca postva). Meddas de achatameto Kurtose (dca se há uma maor ou meor cocetração dos dados em toro da méda). As fórmulas destas estatístcas podem ser ecotradas em qualquer lvro básco de estatístca, por exemplo, CABRAL (997) ou LARSO (98), etre outros ESTATÍSTICA IDUTIVA este sub-capítulo serão abordados apeas os tervalos de cofaça e os testes de hpóteses, pos outras téccas da estatístca dutva (como por exemplo os testes de hpóteses relatvos à aálse das tabelas de cotgêca) serão abordadas em capítulos posterores Itervalos de Cofaça uma grade varedade de problemas de ferêca o teresse ão é estmar um parâmetro, mas sm estabelecer um lmte feror ou superor, ou ambos, para o parâmetro que toma valores em IR; ou seja, costrur uma famíla de tervalos de cofaça de tal forma que uma elevada proporção destes possa coter o parâmetro. Este é o caso, se por exemplo, é o tempo de vda de um equpameto e se pretede ecotrar um lmte feror para o valor médo de, ou se mede a toxcdade de uma droga, o teresse é ecotrar um lmte superor para o valor médo. Os tervalos de cofaça são hoje roteramete usados a comucação socal e a dvulgação de resultados. Qualquer sodagem dca, para além das estmatvas potuas, uma fcha técca em que os tervalos de cofaça são dcados. Qualquer 4 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

41 relatóro de aálses clícas traz valores de referêca que mas ão são do que tervalos de cofaça respetates à população saudável. É óbvo que o deal é costrur tervalos de cofaça com elevada probabldade de coter o parâmetro, mas que teham smultaeamete ampltudes bastate pequeas. Apresetam-se de seguda as fórmulas para cálculos dos tervalos de cofaça mas comus. Itervalo de cofaça para o valor esperado Amostra de grade dmesão, população qualquer + S z S z / /, α α Amostra de pequea dmesão, população gaussaa + S t S t / ; / ;, α α Itervalo de cofaça da proporção bomal (amostras de grade dmesão) + 3 / 3 / ) (, ) ( Y Y z Y Y Y z Y α α Itervalo de cofaça para a varâca de uma população gaussaa / ; / ; ) (, ) ( α α χ χ S S Itervalo de cofaça para a razão etre varâcas de populações ormas / ;, / ;,, B A B A S S F S S F B A B A α α Itervalo de cofaça para a dfereça etre os valores esperados de duas populações Amostras depedetes de grades dmesões, populações quasquer Varâcas das duas populações são dferetes ( ) ( ) B B A A B A B B A A B A S S z S S z / /, α α Varâcas das duas populações são guas ( ) ( ) B A B A B A B A S z S z, / / α α 4 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

42 (este caso, a varâca comum das populações A e B, σ, pode ser estmada por ) ( ) ( + + = B A B B A A S S S ) Amostras depedetes de pequeas dmesões, populações ormas ( ) ( ) B B A A GL B A B B A A GL B A S S t S S t / ; / ;, α α (Graus de lberdade da t-studet calculados por: ) / ( ) / ( + + = B B B A A A B B A A S S S S GL. Se as estmatvas das varâcas ão dferrem muto GL será próxmo de A + B -) Itervalo de cofaça para a dfereça etre proporções bomas (amostras depedetes de grades dmesões) 3 3 / ) ( ) ( B B A A A A B B A A Y Y Y Y z Y Y B B + ± α Testes de Hpóteses Objectvo fudametal dos testes de hpóteses é verfcar se dados amostras (ou estmatvas obtdas a partr deles) são ou ão compatíves com determadas populações (ou com valores prevamete fxados dos correspodetes parâmetros populacoas). Um teste de hpóteses cosste em verfcar se exste algum motvo para ão cotuar a acetar como correcta a estmatva de um parâmetro (ou parâmetros) devdo a: Um mperatvo de qualdade; Uma teora que se pretede comprovar; Uma suspeta provocada por observações aleatóras; Outro qualquer motvo. Para efectuar um teste de hpóteses, há que defr as hpóteses em causa, as quas são desgadas por: H 0 : hpótese cal ou ula H : hpótese alteratva Sedo H 0 a hpótese acete até ao mometo, e se ão houver razões para rejetá-la, cotuará a ser acete. 43 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

43 De um modo geral, a hpótese alteratva exprme as covcções do vestgador, sto é, a hpótese de trabalho, equato a hpótese ula exprme o que ele pretede descartar com o seu estudo. A rejeção de H 0 ão mplca a acetação de H, o que acotece é que a rejeção de H 0 mplca a ão rejeção de H. Para rejetar ou ão H 0, há que defr crtéros, sto é, há que defr as regões de rejeção e ão rejeção da hpótese cal. O subcojuto do espaço amostral para o qual H 0 é rejetada chama-se regão de rejeção ou regão crítca (R). À regão complemetar chama-se regão de acetação. Pese-se agora o erro erete à decsão de rejetar ou ão rejetar a hpótese ula ou cal; para se compreeder melhor a orgem de tas erros, observe-se o segute quadro: Realdade Decsão H 0 verdadera H verdadera (H 0 falsa) ão rejetar H 0 Decsão correcta Decsão errada P(erro tpo II) = β Rejetar H 0 Decsão errada P(erro tpo I) = α Decsão correcta Como se compreede o erro tpo I é muto mportate, o setdo que merece mas ateção, mas preocupação que o erro tpo II. Defe-se ível de sgfcâca e smbolza-se por α, a probabldade de se rejetar H 0 sedo H 0 verdadera. O ível de sgfcâca correspode a um rsco do produtor ver o seu produto rejetado, apesar de estar bom. Defe-se ível de cofaça e smbolza-se por β a probabldade de ão se rejetar H 0 sedo H verdadera ou P {rejetar H 0 /H }. De gual modo, ao ível de cofaça assoca-se o termo rsco do cosumdor, pos correspode ao facto de um cosumdor ão rejetar o produto, estado este estragado. Em face do exposto, coclu-se que a regão R deverá ser uma regão tal que mmze os valores das probabldades de ocorrêcas dos erros tpo I e tpo II; tal ão é possível porque por vezes até varam em setdo cotráro. o etato, dada a mportâca do erro tpo I, rsco do produtor, é usual atrbur um valor reduzdo para α (0,0; 0,05 ou 0,0) escolhedo-se R que mmze o valor de β, probabldade do erro tpo II. os quadros segutes apresetam-se os crtéros de rejeção para os parâmetros de populações gaussaas, para um teste t para duas amostras depedetes e para um teste F. (As demostrações relatvas a estes crtéros de rejeção podem ser ecotradas, por exemplo, em CABRAL (997) ou LARSE (98)). 44 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

44 o últmo quadro apreseta-se ada um sumáro dos testes mas comus e em que crcustâcas devem ser utlzados. H 0 H Crtéro de Rejeção µ = µ 0 Μ = µ σ cohecdo σ x µ 0 + z α ( µ > µ 0 ) σ x µ 0 + zα ( µ < µ 0 ) σ descohecdo s x µ 0 + t ; α ( µ > µ 0 ) s x µ 0 + t ; α ( µ < µ 0 ) µ µ 0 µ > µ σ 0 x µ 0 + z α σ cohecdo σ µ µ 0 Μ < µ x µ 0 + zα 0 µ µ 0 µ > µ s 0 x µ 0 + t ; α σ descohecdo s µ µ 0 Μ < µ x µ 0 + t ; α 0 µ = µ 0 µ µ 0 µ > µ Y µ = µ Y µ < µ Y µ µ Y x µ o σ cohecdo z α / σ / x µ o σ descohecdo t ; α / s / xm y z α σ σ Y + m xm y zα σ e σ Y cohecdos σ σ Y + m xm y z α / σ σ Y + m sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 45

45 H 0 H Crtéro de Rejeção µ cohecdo ( ) = x ; 0 α χ σ µ ( σ > σ 0 ) ( ) = x ; 0 α χ σ µ ( σ < σ 0 ) σ = σ 0 σ = σ µ descohecdo ; 0 ) ( α χ σ s ( σ > σ 0 ) ; 0 ) ( α χ σ s ( σ < σ 0 ) σ σ 0 σ σ 0 σ > σ 0 σ < σ 0 µ cohecdo ( ) = x ; 0 α χ σ µ ( ) = x ; 0 α χ σ µ σ σ 0 σ σ 0 σ > σ 0 σ < σ 0 µ descohecdo ; 0 ) ( α χ σ s ; 0 ) ( α χ σ s µ cohecdo ( ) = x / ; 0 α χ σ µ ou ( ) = x / ; 0 α χ σ µ σ = σ 0 σ σ 0 µ descohecdo / ; 0 ) ( α χ σ s ou / ; 0 ) ( α χ σ s QUADRO. CRITÉRIOS DE REJEIÇÃO PARA OS PARÂMETROS DE POPULAÇÕES GAUSSIAAS. H 0 H Crtéro de Rejeção µ µ Y d µ µ Y > d α + + ; m P t m S d y x µ µ Y d µ µ Y < d ;α + + m P t m S d y x µ µ Y = d µ µ Y d / ; α + + m P t m S d y x ) ( ) ( + + = m s s m s Y P QUADRO. CRITÉRIOS DE REJEIÇÃO PARA UM TESTE T PARA DUAS AMOSTRAS IDEPEDETES. 46 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

46 H 0 H Crtéro de Rejeção σ σ Y σ > σ Y s s Y Fm, ; α σ σ Y σ < σ Y s s Y F m, ;α σ = σ Y σ σ Y s s Y F m, ; α / s ou F m, ; α / s Y QUADRO 3. CRITÉRIOS DE REJEIÇÃO PARA UM TESTE F. Dspersão Uma amostra População gaussaa Amostra de qualquer dmesão Teste do χ (varâca) Duas amostras depedetes Populações ormas Amostras de quasquer dmesões Teste F Uma amostra População qualquer Amostra de grade dmesão Populações ormas Amostra de pequea dmesão Teste Z Teste t Localzação Duas amostras Populações quasquer Amostras de grades dmesões Teste Z (valor esperado) depedetes Populações ormas Amostras de pequeas dmesões Teste t Duas amostras Populações quasquer Amostras de grades dmesões Teste Z emparelhadas Populações ormas Amostras de pequeas dmesões Teste t Localzação Uma amostra População dcotómca Amostra de grade dmesão Teste Z (proporção bomal) Duas amostras depedetes Populações dcotómcas Amostras de grades dmesões Teste Z QUADRO 4. TESTES MAIS COMUS ABORDADOS ESTE CAPÍTULO. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 47

47 Relação etre Testes de Hpóteses e Itervalos de Cofaça A relação fudametal que exste etre os testes de hpóteses e os tervalos de cofaça pode ser eucada os termos segutes: uma hpótese ula (H 0 : θ = θ 0 ) pode ser rejetada a um ível de sgfcâca α se, e só se, o tervalo de cofaça de θ a (-α)*00% ão clur o valor de θ 0. ote-se que esta codção mpõe que o tervalo de cofaça seja compatível com a atureza de H, ou seja, que para testes blateras se costruam tervalos de cofaça blateras e para testes ulateras (um setdo) se costruam tervalos de cofaça ulateras (o mesmo setdo). 7.- MÉTODOS PARAMÉTRICOS versus MÉTODOS ÃO-PARAMÉTRICOS Mutos métodos de ferêca estatístca clássca partem de uma sére de pressupostos quato à atureza da população parete, geralmete a gaussadade dos dados, razão pela qual são deomados métodos paramétrcos. Por exemplo, a aálse de varâca smples (AOVA) permte comparar smultaeamete k médas populacoas mas pressupõe a pror que as amostras são de populações gaussaas depedetes com varâcas guas (embora descohecdas). O que fazer quado uma das codções é volada? A partr da seguda metade do século assstu-se ao aparecmeto de um grade úmero de métodos estatístcos meos exgetes quato aos pressupostos de aplcação, sedo que a maora dos casos a úca exgêca feta é a cotudade da dstrbução da população parete. Os métodos em questão são chamados métodos ão-paramétrcos. A grade populardade dos métodos ão-paramétrcos advém fudametalmete de serem raras as ocasões em que há cohecmeto precso sobre a forma da dstrbução da população parete sob estudo e serem meos sesíves a observações díspares, pos utlzam a sua maora os raks e ão as magtudes das observações. As téccas paramétrcas são estatístcas que ldam com parâmetros (característcas de um Uverso, por exemplo, o valor médo de uma varável). As varáves têm de estar um escala tervalar ou de razões. Algus exemplos de téccas estatístcas do tpo paramétrco são: o teste t, a aálse de varâca (AOVA), a correlação (do tpo Pearso) e a regressão lear. (ver sub-capítulos 3.3., e ) sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 48

48 As téccas ão-paramétrcas ão ldam com parâmetros e ão assumem que os valores de uma varável têm uma dstrbução gaussaa. Estas estatístcas permtem aalsar varáves com valores uma escala ordal ou uma escala omal MÉTODOS ÃO-PARAMÉTRICOS Todo este sub-capítulo referete aos métodos ão-paramétrcos será desevolvdo com base em BRILHATE (004) Testes de Ajustameto Os testes de ajustameto aalsam a compatbldade de um cojuto de valores observados com a dstrbução gaussaa ou com qualquer outra dstrbução. É frequete dar-se o caso de se querer testar hpóteses sobre a forma da população e ão propramete sobre os parâmetros populacoas. Por exemplo, o teste t para uma amostra (ou para duas amostras depedetes ou ada para duas amostras emparelhadas) asseta o pressuposto de que as observações são gaussaas, razão pela qual se deve verfcar ates de o aplcar que de facto a população parete é gaussaa. Preferecalmete a dstrbução que se propõe em H 0 deve estar completamete especfcada, cludo todos os parâmetros. Se apeas for especfcada uma famíla de dstrbuções, deve estmar-se prmero os parâmetros descohecdos. Teste do Qu-Quadrado Usa-se a estatístca de teste: k ( O j E j ) = E j= j que, sob a valdade de (O,, O k ) ~ Multomal (; p,, p k ) tem dstrbução aproxmada do qu-quadrado com k- graus de lberdade (se exstrem s parâmetros descohecdos terá uma dstrbução aproxmada do qu-quadrado com k--s graus de lberdade). Rejeta-se a hpótese ula a um ível α*00% se o e. k ( j j ) ( obs) = χ k; α j= e j Seja (,, ) uma amostra aleatóra de uma população com fução de dstrbução F. 49 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

49 Defa-se: I = {x: a } I = {x: a < a } I k- = {x: a k- < a k- } I k = {x: > a k } Se Y j for o úmero de valores da amostra pertecetes a I j, j=,, k, etão (Y,, Y k ) ~ Multomal (; p, p k ) ode p j = P( I j ), j=,, k. Teste de Kolmogorov-Smrov (para uma amostra) Defa-se fução de dstrbução empírca da amostra (,, ) a fução real de #{ : x} varável real F * ( x) =. A fução de dstrbução empírca F * é uma estmatva da fução de dstrbução F. Supoha-se que (,, ) é uma amostra aleatóra proveete de uma população com fução de dstrbução cotíua F, descohecda, e que se descofa que F=F 0, estado F 0 completamete especfcada, sto é, pretede-se testar H 0 : F(x) = F 0 (x) para todo x cotra a alteratva H : F(x) F 0 (x) para algum x. * A estatístca de teste do teste de Kolmogorov-Smrov é D = sup F ( x) F ( ). O x 0 x crtéro de rejeção a um ível de sgfcâca α é D D,α, ode P (D D,α ) = α sob a valdade de H 0. Os valores deste teste ecotram-se tabelados (a tabela estatístca correspodete pode ser ecotrada em dversos lvros de estatístca). Teste de Lllefors É a versão dos teste de Kolmogorov-Smrov para o caso de se querer testar a hpótese de a dstrbução parete ser gaussaa com os parâmetros descohecdos. este caso tem-se que estmar os parâmetros pelo método de máxma verosmlhaça e * * cosderar como estatístca de teste D = sup F ( z) Φˆ ( z) ode Φ é a fução de dstrbução da gaussaa stadard. O crtéro de rejeção a um ível α é D * D *,α ode P(D * D *,α)=α. Os valores deste teste também se ecotram tabelados. 50 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 z

50 Comparação etre o teste do Qu-Quadrado e o teste de Kolmogorov-Smrov (K-S) O teste do qu-quadrado é específco de dados categorzados, equato o teste de K-S de amostras de populações cotíuas; O teste de K-S ão pode ser aplcado se houver parâmetros populacoas a estmar, ao cotráro do teste do qu-quadrado; O teste de K.S pode ser aplcado a pequeas amostras mas ão o teste do qu-quadrado; O teste do qu-quadrado pode ser aplcado a dados dscretos e o teste de K-S ão; O teste de K-S avala o ajustameto de cada uma das observações e o teste do ququadrado o ajustameto de classes ou categoras Testes de Aleatoredade A maora dos métodos estatístcos basea-se o pressuposto da aleatoredade da amostra ou exgem que as observações tal como são recolhdas sejam depedetes. Exstem város tpos de testes de aleatoredade mas será abordado aqu apeas o teste dos rus. Teste dos rus Dada uma sequêca de dos ou mas símbolos dsttos, defe-se ru à sequêca de um ou mas símbolos do mesmo tpo precedda e seguda de ehum símbolo ou de um símbolo dferete. A fução de probabldade de R, úmero total de rus para objectos dos quas m são do tpo e do tpo, é P ( R = r ) = m r / r / m m + ( r ) / ( r 3 ) / m para r =, 3,, = m+ m ( r 3 ) / ( r ) /, se r par, se r ímpar A regão crítca de ível α para um teste de aleatoredade blateral é R r ou R r (r e r são potos crítcos da tabela estatístca correspodete). m m(m ) Sob a hpótese de aleatoredade, µ R =+ e σ R = com = m+. ( ) sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 5

51 Quado m, 0 pode-se utlzar os resultados aterores relatvos ao valor médo e à varâca para se aproxmar a dstrbução gaussaa à dstrbução de R Testes de Smetra A smetra é uma propredade estatístca bastate mportate, pelo que se pode estar teressado em testar a hpótese H 0 : A amostra provém de uma população com dstrbução smétrca em toro da medaa. Se se cohecesse os parâmetros populacoas µ (valor médo) e M (medaa) da dstrbução, ão haveram problemas em classfcar a dstrbução com smétrca, assmétrca postva (dreta) ou assmétrca egatva (esquerda), pos Se µ > M, a dstrbução é assmétrca postva; Se µ < M, a dstrbução é assmétrca egatva; Se µ = M, a dstrbução é smétrca Teste de Smetra (Radles, Flger, Pollcello, Wolfe) A partr da amostra de dmesão (,, ) podem-se formar combações desses elemetos em teros. Cada tero (, j, k ) pode ser classfcado em: + j + k Tero dreto se > medaa{, j, k}; 3 + j + k Tero esquerdo se < medaa{, j, k}; 3 + j + k Tero ão dreto e ão esquerdo se = medaa{, j, k}. 3 Cosdere-se a estatístca T = # {teros dretos} - # {teros esquerdos}. Sejam B = # {teros dretos evolvedo } # {teros esquerdos evolvedo } e B jk = #{teros dretos evolvedo( j, k )} #{teros esquerdos evolvedo( j, k )}. A estatístca de teste é Z = T/σ T ode σ ( 3)( 4) 3 T = B + B jk ( )( ) 4 j< k ( )( ) ( 3)( 4)( 5) + T 6 ( )( ) Sob H 0 a estatístca Z tem dstrbução asstótca gaussaa stadard. O teste possu potêca razoável para > 0. 5 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

52 Tabelas de Cotgêca Uma tabela de cotgêca é uma tabela de frequêcas que represeta um cojuto de dados que foram classfcados smultaeamete por váras característcas. Cosdere-se classfcações exaustvas e cujas categoras são mutuamete exclusvas. Se a classfcação é feta segudo duas varáves (dga-se A e B) obtém-se uma tabela de cotgêca bdmesoal (r x c) e se ela for feta segudo mas de duas varáves obtém-se uma tabela de cotgêca multdmesoal. Idepedetemete do método de amostragem usado pretede-se, habtualmete, verfcar a exstêca de uma evetual relação etre as varáves qualtatvas A e B. Teste de depedêca em tabelas de cotgêca Em 900 Karl Pearso sugeru que se usasse a segute estatístca de teste: = r c ( Oj ej ) = j= e j ~ χ ( r)( c) A hpótese de depedêca será rejetada ao ível α se. χ( r)( c);α Têm havdo mutas sugestões o que respeta quão grade deve ser a dmesão da amostra para se obter uma boa aproxmação da qu-quadrado à dstrbução exacta de. Uma regra geeralzada cosste em ão a aplcar se exstrem mas de 0% de frequêcas esperadas ferores a 5, sedo que todas estas devem ser superores a. Para cotorar esta stuação, há quem prefra agrupar categoras adjacetes, mas tal procedmeto é frequetemete desecessáro e adequado. Quado se trata de uma tabela de cotgêca x a alteratva a é o teste exacto de Fsher que cosdera uma amostragem hpergeométrca (sem reposção). Teste de homogeedade de proporções A tabela de cotgêca possu a pror uma margem fxa, pos cosderam-se dos grupos (amostras) depedetes, e cada dvíduo é classfcado detro do seu grupo segudo a varável em estudo. A estatístca de teste a usar é a do qu-quadrado, rejetado-se H 0 a um ível α se. χ ( r)( c);α = r c ( Oj ej ) = j= e j ~ χ, ( r)( c) sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 53

53 Teste exacto de Fsher O teste exacto de Fsher permte aalsar dados em tabelas de cotgêca bdmesoas, x, quado exstem frequêcas esperadas ferores a 5. Cosdere-se etão a tabela de cotgêca x A\B B B A a B a+b A c D c+d a+c b+d Prova-se que sob a hpótese de a tabela ateror ter marges fxas, a probabldade exacta de se observar um partcular cojuto de frequêcas é dado pela dstrbução hpergeométrca. Represetado por P a a probabldade de se observar a tabela ateror, a + c b + d a b ( a + b)!( c + d)!( a + c)!( b + d)! tem-se P a = =.! a! b! c! d! a + b A fm de facltar o cálculo das probabldades das dversas tabelas, pode-se usar uma das fórmulas de recorrêca P ad = ( b + )( c + ) ( b + )( c + ) P. ad a Pa ou a+ = Pa Teste de Mcemar O teste de Mcemar é útl quado se pretede testar mudaças sgfcatvas ates e depos de uma determada ocorrêca ou stuação evolvedo duas amostras correlacoadas. Está-se perate uma tabela de cotgêca x do tpo Depos Ates a b + c d Em que agora o uverso de teresse é costtuído pelos b+c dvíduos que mudaram de opão. Sob a valdade de H 0 é de esperar que (b+c)/ dvíduos mudem de opão. Pelo que se pode usar a estatístca do teste do qu-quadrado sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 54

54 = ( Oj E ) b + c b = b + c b + c c + b + c ( b c) = c = E b + ~ χ Se se corporar um factor de correcção (de Yates) a estatístca ateror, vem ( b c cor = b + c ) Se (b+c)/ for feror a 5, ão se pode usar a estatístca do qu-quadrado, devedo-se usar o teste exacto dado por ~ Bomal(b+c,/) podedo-se etão determar o p-value (probabldade de sgfcâca) assocado ao teste. Teste Q de Cochra O teste Q de Cochra geeralza o teste de Mcemar o setdo em que permte testar a hpótese de três ou mas cojutos emparelhados (correlacoados) de frequêcas ou proporções dferrem sgfcatvamete etre eles. A estatístca do teste Q de Cochra é Q k k k k( k ) ( G j j G ) ( k ) k G j= = = j j = = k L L k L L = = = = G j. Que tem dstrbução aproxmada do qu-quadrado com k- graus de lberdade e em que: G j = º total de sucessos a j-ésma colua; G = méda dos G j s; L = º de sucessos a -ésma lha Testes de Localzação Teste da Medaa Pretede-se testar uma hpótese do tpo H 0 : θ x = θ y = θ. O processo cosste em: calcular a medaa (M) da amostra combada e preecher a segute tabela: Amostra Amostra Y total M < M total e fazer um teste de homogeedade de proporções. 55 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

55 Teste de Ma-Whtey-Wlcoxo Ma-Whtey e Wlcoxo desevolveram separadamete dos testes equvaletes para o problema da localzação para duas amostras depedetes. O teste de Ma- Whtey-Wlcoxo permte testar a hpótese de duas amostras depedetes provrem de populações com a mesma localzação (medaa). O teste pressupõe à partda que a forma das duas populações é gual. A versão do teste que aqu abordada deve-se a Wlcoxo. Cosdere-se duas amostras depedetes A e B com m e observações, com m. O procedmeto a segur é:. Combar as duas amostras e regstar as observações em ordem ascedete de magtude;. Começado da esquerda, atrbur ordem à observação míma, ordem à seguda observação míma, etc., e ordem = m + à observação máxma; 3. Obter a soma das ordes, T, das observações da meor amostra. Sob a hpótese de detdade dstrbucoal a estatístca T de Ma-Whtey( +) Wlcoxo tem valor médo e varâca dados respectvamete por: µ T = e m( + ) σ T = em que = m +. o caso de haver observações empatadas a varâca de T sofre uma alteração (correcção), passado a ser: m( + ) m σ = ( ) r K T =, ode: r é o úmero de cojutos com observações empatadas; K = (τ ) τ (τ + ); τ é o úmero de observações empatadas o -ésmo cojuto de empate. Algus valores deste teste ecotram-se tabelados, mas o caso de o valor ão pertecer à tabela, pode-se utlzar uma aproxmação pela dstrbução ormal (ou gaussaa). A maora dos packages estatístcos calcula a estatístca U de Ma-Whtey e ão a estatístca T que se deve a Wlcoxo (as estatístca U e T são equvaletes). sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 56

56 , sey j > Seja U j =, =,..., m; j =,...,. 0, seyj < A estatístca proposta por Ma-Whtey é: U = m U j = j= que dá o úmero de Y j que excedem. Sob a valdade de detdade dstrbucoal, m m( + ) µ U = e σ U = = σ T o caso de exstrem observações empatadas U j, sey j > = /, sey j < 0, sey j < ( +) As estatístcas T e U estão relacoadas da forma U = T., =,... m; j =,.... Teste de ordes robusto para o problema de Behres-Fsher Este teste, ao cotráro do teste de Ma-Whtey, ão exge que as populações teham a mesma forma dstrbucoal, em varâcas guas. Sejam P o úmero de observações da amostra Y ferores a, =,, m e Q o úmero de observações da amostra ferores a Y j, j=,,, com m. Sejam ada: P = m m P = ; Q = Q = m ; V = ( P P) ; V = ( Q j Q ) e, = j= Û = Q j j= = V + V m P + PQ. Sob H 0 a estatístca Û tem dstrbução asstótca guassaa stadard (algus valores deste teste também se ecotram tabelados). o caso de haver empates etre as observações cosdera-se P =.º de Y s ferores a + ½{.º de Y s guas a } e Q j =.º de s ferores a Y j + ½{.º de s guas a Y j }. Teste das ordes afectadas de sal de Wlcoxo Sejam (, Y ),, (,Y ) pares de observações e seja Z = Y, =,,,. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 57

57 Admta-se que as dfereças Z, Z,, Z são mutuamete depedetes e que cada Z provém de uma população cotíua (ão ecessaramete a mesma) e smétrca em toro de uma medaa comum θ. O parâmetro θ é chamado o efeto tratameto. A estatístca de Wlcoxo, W, obtém-se do segute modo:. Atrbur ordes aos valores absolutos de Z, Z, =,,, ;. Afectar à ordem da -ésma dfereça absoluta o sal de Z e deotá-la por R ; 3. Calcular a soma das ordes afectadas de sal W = R + R + + R. Dada uma amostra de dmesão de uma dstrbução cotíua e smétrca em toro de zero, se W deotar a soma das ordes afectadas de sas, etão µ W = 0 e ( + )( + ) σ W =. 6 o caso de haver dfereças empatadas, há que proceder a uma correcção a r ( + )( + ) varâca, omeadamete, σ W = K, 6 em que: r é o úmero de cojutos com observações empatadas; K = (τ ) τ (τ + ); τ é o úmero de observações empatadas o -ésmo cojuto de empate. ote-se que exste uma tabela estatístca para algus valores deste teste. = Teste dos Sas O teste dos sas é um teste alteratvo ao teste de Wlcoxo mas meos exgete, pos ão requer que as dfereças Z proveham de populações cotíuas smétrcas, apeas cotíuas em toro de uma medaa comum θ. Para testar H 0 : θ = 0, cosdere-se S o úmero de dfereças + (postvas), ou etão o úmero de dfereças (egatvas). Etão sob H 0, S ~ Bomal (, ½). Teste de Kruskal-Walls (AOVA em ordes) O teste de Kruskal-Walls geeralza o teste de Ma-Whtey pos permte testar a hpótese de k amostras depedetes provrem de populações dêtcas, sto é, com a mesma localzação (medaa). O procedmeto é o segute: sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 58

58 . Combar as k amostras de dmesões,,, k e regstar as observações em ordem ascedete de magtude;. Começado da esquerda, atrbur ordem à observação míma, ordem à seguda observação míma,, e ordem = k à observação máxma; 3. Obter R, a soma das ordes das observações da amostra, =,, k. A estatístca de Kruskal-Walls toma o aspecto: = k R H 3( + ) ( + ) =. Se k amostras de dmesões,,, k forem extraídas ao acaso de populações dêtcas, e se os valores de forem grades, etão a estatístca H de Kruskal-Walls tem dstrbução aproxmada do qu-quadrado com k- graus de lberdade. ote-se que quado todos os s são maores ou guas a 3 e k >, a aproxmação ateror é cosderada boa. O tratameto a dar a observações empatadas é o mesmo do teste de Ma-Whtey, mas há que proceder a uma correcção da estatístca H, omeadamete: H * = H r = 3 K, ode: r é o úmero de cojutos com observações empatadas; K = (τ ) τ (τ + ); τ é o úmero de observações empatadas o -ésmo cojuto de empate. Porém, só faz setdo usar o factor de correcção para a estatístca de Kruskal-Walls quado há um elevado úmero de observações empatadas (30% de observações empatadas). Teste de Fredma O teste de Fredma testa a hpótese de k amostras emparelhadas provrem da mesma população ou de populações com a mesma localzação (medaa). A estatístca de Fredma é dada por: F r = k( k + ) k j= R j 3( k + ). Ode é o úmero de sujetos, k o úmero de codções ou tratametos e R j a soma dos raks da j-ésma colua. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 59

59 A dstrbução amostral da estatístca de Fredma ecotra-se tabelada para algus valores de e k. Para valores de e k elevados, a dstrbução é bem aproxmada pela dstrbução do qu-quadrado com k- graus de lberdade. O tratameto de observações empatadas o teste de Fredma é dêtco ao dos testes aterores. este caso há que corporar um factor de correcção a estatístca, omeadamete F ode: ( k ) S r = k( k ) g = j= t 3. j, k S = j= R j k ( k + ) 4 ; g é o úmero de cojutos de observações empatadas o -ésmo grupo (cludo os de dmesão ) e t.j é o tamaho do j-ésmo cojuto de empates o -ésmo grupo Testes de escala e outros problemas de duas amostras Teste de Segal-Tukey Este teste só se pode aplcar a testes ulateras. As medaas têm que ser guas, cotudo, se forem cohecdas mas dferetes podese cetrar uma delas de modo a se torarem guas. Sejam (,, m ) e (Y,, Y ) duas amostras aleatóras depedetes proveetes de populações com localzação θ x = θ y = θ e escalas η x e η y (ídce de dspersão da escala). O teste de Segel-Tukey permte testar a hpótese H 0 : η x = η y. A estatístca de teste é a do teste de Ma-Whtey, sedo que a atrbução das ordes é feta das caudas para o teror. Teste de Moses Permte cosderar testes blateras e com medaas dferetes. O teste de Moses permte testar a hpótese H 0 : η x = η y em stuações blateras e mesmo quado as medaas das populações ão são guas. Para aplcar o teste é ecessáro prmero dvdr cada amostra em subcojutos de gual dmesão. Cada subcojuto deve coter pelo meos duas observações e se a dvsão 60 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

60 for tal que fque de fora algumas observações, estas devem ser descartadas da aálse. A dmesão dos subcojutos deve ser escolhda de forma a mmzar o úmero de observações a descartar. É mportate que a dvsão de cada amostra em subcojutos seja aleatóra. Para cada subcojuto calcula-se a soma dos quadrados dos desvos em relação à méda que dá a dspersão do subcojuto. Sob a hpótese de homogeedade de escala, os ídces de dspersão podem ser cosderados proveetes de populações dêtcas pelo que se pode usar a estatístca do teste de Ma-Whtey. Teste de Kolmogorov-Smrov para duas amostras Sejam (,, m ) e (Y,, Y ) duas amostras aleatóras depedetes. Supodo que se pretede testar H 0 : F x (x) = F y (x) para todo o x. O teste de Kolmogorov-Smrov para duas amostras permte detectar dfereças a localzação, a escala ou a forma das dstrbuções, sedo por sso meos específco que os testes de localzação ou escala aterores. A estatístca do teste de Kolmogorov-Smrov é: D m, = sup x F * m(x) F * (x) e o crtéro de rejeção a um ível α é md m, c α. A dstrbução amostral desta estatístca ecotra-se tabelada. Como se pode verfcar, o teste ateror avala a cocordâca etre as duas dstrbuções empírcas Testes de Assocação Coefcete de correlação ordal de Spearma O coefcete de correlação ordal de Spearma é uma medda de cocordâca ordal e basea-se em d emparelhadas, sedo dado pela expressão, a soma dos quadrados das dfereças das ordes = d s ( ) = r 6. O coefcete de correlação ordal de Spearma verfca as segutes propredades: r S toma valores etre - e (pode ão assumr o valor zero); r S = quado há cocordâca total as ordeações, sto é, quado d = 0 ; sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 6

61 r S = - quado há dscordâca total as ordeações, o que ocorre quado d atge o seu valor máxmo. o caso de e Y serem depedetes, o coefcete de correlação ordal de Spearma, r S, tem E(r S ) = 0 e Var(r S ) = /(-),. ota: exstem tabelas que forecem a dstrbução exacta de r S para valores pequeos de, usualmete. Para amostras de dmesão superor recorre-se à aproxmação pela dstrbução gaussaa. Coefcete τ (tau) de Kedall O coefcete τ de Kedall pode ser usado como medda de correlação para o mesmo tpo de dados para o qual o coefcete de correlação ordal de Spearma, r S, é usado. A dstrbução amostral de τ sob a hpótese ula de depedêca também é cohecda pelo que pode ser usada para testar a sgfcâca do coefcete. ormalmete recorre-se à aproxmação pela gaussaa. O grau de cocordâca etre os dos cojutos de ordeações é o quocete da soma obtda e a maor soma possível (ou o úmero total de pares), sto é, τ =.º de cocordâcas -.º de dscordâcas.º total de pares ( ) De um modo geral o úmero total de pares é gual a =, pelo que S τ = ode S represeta a soma total dos scores. ( ) o caso de e Y serem depedetes, o coefcete tau de Kedall tem E ( τ ) = 0 e ( + 5) Var( τ ) =,. 9( ) Quado exstem duas ou mas observações empatadas quer para a varável quer para a varável Y aplca-se o método usual de atrbução de raks. este caso há quer proceder à segute correcção τ = ( ) τ S x ( ) τ y r = x, ode: τ t ( t ), x = com r x o úmero de observações empatadas para a varável e t o úmero de observações o -ésmo cojuto de empate; τ y = r y = t ( t ), sedo r y o úmero de cojutos de sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 6

62 observações empatadas para a varável Y e t o úmero de observações empatadas o - ésmo cojuto de empate. A relação etre o coefcete tau de Kedall e o coefcete de correlação ordal de Spearma é dada por: - 3 τ - r S. Coefcete de Cramér O coefcete de Cramér é um de etre mutos coefcetes de assocação para dos cojutos de atrbutos e é essecalmete útl quado se dspõe apeas de formação categorzada. Para calcular o coefcete de Cramér etre os scores de duas varáves A e B com categoras A,...,A r e B,...,B c dspõe-se a formação uma tabela de cotgêca rxc. O coefcete de Cramér é dado por C = ( L ), ode é a estatístca do teste do qu-quadrado e L = m{r, c}. Este coefcete vara etre 0 e. A sgfcâca de C é avalada em fução da estatístca de teste do qu-quadrado. Coefcete de correlação parcal de Kedall Permte avalar a depedêca parcal etre e Y matedo Z costate. A hpótese a testar é do tpo H 0 : τ 0. Y. Z = O coefcete de correlação parcal de Kedall é dado por: τ Y. Z τ Y τ Z. τ YZ =. ( τ )( τ ) Z YZ Sob a hpótese de depedêca parcal E( τ. ) = 0 e Var τ Y Z ( Y. Z ( + 5) ) = 9( ) o quadro segute apreseta-se, segudo CABRAL (997), uma sítese dos testes ão-paramétrcos mas comus e as codções em que são utlzados. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 63

63 Ajustameto Localzação População qualquer Frequêcas observadas População cotíua cohecda Uma amostra Observações quattatvas População gaussaa (parâmetros estmados) Observações quattatvas Populações quasquer Duas amostras Frequêcas observadas depedetes População cotíua Observações quattatvas População cotíua qualquer Frequêca de observações acma ou Uma amostra abaxo de η 0 População cotíua e smétrca Observações quattatvas Duas amostras Populações cotíuas com forma gual depedetes Observações quattatvas População cotíua Duas amostras Dfereça etre as observações e η 0 emparelhadas População cotíua e smétrca Dfereça etre as observações e η 0 População qualquer Observações uma escala qualquer Aleatoredade Uma amostra População qualquer Assocação Observações uma escala pelo meos ordal Populações cotíuas Observações uma escala pelo meos Duas amostras ordal Populações quasquer Frequêcas observadas Teste do Qu-Quadrado Teste de Kolmogorov- Smrov Teste de Lllefors Teste do Qu-Quadrado Teste de Kolmogorov- Smrov Teste dos sas Teste de Wlcoxo Teste de Ma- Whtey-Wlcoxo Teste dos sas Teste de Wlcoxo Teste das sequêcas Teste das sequêcas ascedetes e descedetes Teste da correlação ordal de Spearma Teste do Qu-Quadrado QUADRO 5. SÍTESE DE DIVERSOS TESTES ÃO-PARAMÉTRICOS. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 64

64 7.3- MÉTODOS QUE AALISAM DIFEREÇAS versus MÉTODOS QUE AALISAM RELAÇÕES MÉTODOS QUE AALISAM DIFEREÇAS Detro das téccas que avalam dfereças etre amostras, podem-se utlzar téccas paramétrcas para dfereças etre: duas amostras depedetes; três (ou mas) amostras depedetes; duas ou mas amostras depedetes; utlzado duas ou mas varáves depedetes; duas amostras depedetes. Também se podem utlzar téccas ãoparamétrcas para k amostras depedetes e, para k amostras depedetes. Vejam-se etão, de seguda os tpos de testes a utlzar em cada um dos casos acma referdos. Téccas Paramétrcas Dfereça etre duas amostras depedetes Exemplo: Teste t. (ver sub-capítulo ) O teste t para duas amostras depedetes é um teste paramétrco que testa a hpótese ula de que, o uverso, a dfereça etre os dos valores médos da varável depedete é gual a zero, ou seja, que as duas amostras são amostras do mesmo Uverso e, portato, têm valores médos guas ao valor do parâmetro µ. Dfereça etre 3 (ou mas) amostras depedetes Exemplo: Aálse de varâca uvarada (AOVA). (ver sub-capítulo 3.4..) A aálse de varâca uvarada dz se há dfereças sgfcatvas etre os valores médos da varável depedete de etre pelo meos duas das amostras (ou talvez mas), mas ão dz que amostras é que dferem etre s, sedo para sso ecessáro aplcar um teste post-hoc. Dfereças etre duas ou mas amostras depedetes, utlzado duas ou mas varáves depedetes Exemplo: Aálse de varâca factoral. (ver sub-capítulo ) Dfereças etre duas amostras depedetes Exemplo: Teste t para duas amostras depedetes (emparelhadas). sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 65

65 Téccas ão-paramétrcas (escala ordal) (ver sub-capítulo 3..) Dfereças etre duas amostras depedetes Exemplo: Teste da medaa, teste U de Ma-Whtey, teste de Kolmogorov- Smrov para duas amostras, teste de Moses para reacções extremas. Dfereças etre k amostras depedetes Exemplo: Extesão do teste da medaa, teste de Kruskal-Walls. Dfereças etre duas amostras depedetes Exemplo: Teste dos sas, teste de Wlcoxo. Dfereças etre k amostras depedetes Exemplo: Teste de Fredma MÉTODOS QUE AALISAM RELAÇÕES Para aalsar relações exste, hoje em da, quase uma fdade de coefcetes dferetes. Ver-se-á aqu apeas algus deles. Um coefcete de correlação é uma estatístca descrtva que dca a atureza da relação etre os valores de duas varáves. Os valores vêm de um só grupo de casos mas forecem duas amostras. O coefcete de determação (quadrado do coefcete de correlação de Pearso) é um dos mas utlzados. Este coefcete dca a proporção de varâca dos valores de uma varável partlhada ou explcada pela varâca dos valores da outra varável. Dá uma dcação da mportâca da correlação, mas é claro que ão vale a pea calculá-lo quado o coefcete de correlação ão é sgfcatvo segudo um teste dutvo. Correlações Paramétrcas O tpo de correlação a usar depede da atureza das varáves, cotudo todos os tpos requerem que pelo meos uma das varáves seja métrca. Coefcete de correlação de Pearso: É o mas vulgar. É aplcável quado as duas varáves são meddas por uma escala de tervalo ou de razões (varáves métrcas), e a relação etre as varáves é lear (ou, pelo meos, ão claramete ão-lear). Também é possível aplcá-lo aos valores meddos por uma escala de avalação se a relação parecer lear. Exstem outros pressupostos lgados com o coefcete de Pearso (dstrbução bvarada gaussaa e homogeedade de varâcas) mas esses são de meos mportâca. 66 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

66 Coefcete de correlação B-seral: aplca-se quado uma das varáves é métrca mas os seus valores estão artfcalmete dcotomzados de modo a dar apeas duas categoras (varáves dummy). Coefcete de correlação Pot b-seral: usado quado uma das varáves é omal com apeas duas categoras. Coefcete de correlação Tetrachorc: utlzado quado as duas varáves são métrcas mas foram ambas dcotomzadas artfcalmete de modo a que cada uma teha apeas duas categoras. Coefcete de correlação Eta: pode ser aplcado quado uma das varáves é métrca mas a outra está medda uma escala omal com três ou mas categoras. Correlações e Assocações ão-paramétrcas Os coefcetes de assocação medem a relação etre duas varáves omas, equato que os coefcetes de correlação medem a relação etre duas varáves ordas. COEFICIETES DE ASSOCIAÇÃO Coefcete Ph: utlza-se quado cada uma das varáves só tem dos valores, ou seja quado os dados são frequêcas que resultam de um cruzameto do tpo x Coefcete de Cramér: é usado quado uma varável (ou as duas varáves) tem mas do que dos valores, ou seja, quado os dados são frequêcas que resultam de um cruzameto do tpo r x k. (ver sub-capítulo 3...7) Coefcete de cotgêca C: pode ser aplcado a qualquer cruzameto do tpo r x k. Mas o seu valor máxmo é sempre feror a ; por ada, o valor máxmo depede do úmero de categoras das varáves. Esta lmtação faz com que seja preferível calcular o coefcete de Cramér. Estes coefcetes baseam-se a estatístca do qu-quadrado. O teste do qu-quadrado testa a hpótese ula que as duas varáves ão estão relacoadas uma com a outra. Um valor sgfcatvo para o qu-quadrado dca que as duas varáves ão são depedetes, mas ão dca o grau de relacoameto etre elas. Para se ecotrar o grau de relacoameto é precso calcular um coefcete de assocação. COEFICIETES DE CORRELAÇÃO: por exemplo, coefcete rho de Spearma e coefcete tau-b de Kedall. (ver sub-capítulo 3...7). sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 67

67 7.4- TÉCICAS UIVARIADAS, BIVARIADAS E MULTIVARIADAS As téccas da estatístca dutva que tratam de dfereças etre amostras e que utlzam apeas uma varável, são téccas uvaradas. As téccas bvaradas, por sua vez, tratam de relações etre duas varáves. As téccas de correlação e as téccas lgadas com os coefcetes de assocação são téccas bvaradas. A regressão lear smples também é uma técca bvarada. As téccas multvaradas aalsam smultaeamete relações etre três ou mas varáves. Outros autores cosderam que a desgação u, b e multvarada apeas se deve aplcar às varáves depedetes, pelo que, este setdo a regressão múltpla sera uma técca uvarada e apeas téccas como a aálse factoral seram multvaradas. ão se dedcou um sub-capítulo exclusvamete às téccas uvaradas ou bvaradas, por estas já terem sdo abordadas em capítulos aterores ou etão surgrem como trodução à técca multvarada que a geeralza TÉCICAS MULTIVARIADAS De acordo com COELHO (005), os métodos multvarados podem ser dvddos em dos grades grupos: os métodos descrtvos que procuram explorar relações ou terdepedêca e os métodos explcatvos que se destam a determar depedêca. Os métodos descrtvos preocupam-se com a forma como as váras varáves/atrbutos estão relacoados, ão estabelecedo o etato qualquer tpo de relações de causaldade. O seu prcpal objectvo é assm o de descrever e reduzr os dados recolhdos, através da exploração de relações de terdepedêca. Os métodos explcatvos preocupam-se com o estabelecmeto de relações de causaldade, sto é, de como uma ou mas varáves (explcatvas) podem explcar o ível de uma ou mas varáves (de resposta). Esta explcação parte da especfcação de um modelo baseado um cojuto de hpóteses em que está baseado. São exemplos de métodos descrtvos de aálse multvarada a aálse em compoetes prcpas, a aálse factoral, a aálse de clusters e a aálse de correspodêcas, etre outros. Como exemplo de métodos explcatvos tem-se a regressão lear e logístca, a aálse cojuta e os modelos de equações estruturas, etre outros. Segudo ADERSO (998), exstem ses passos fudametas a costrução de modelos multvarados, a saber: 68 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

68 . Defr o problema em estudo, objectvos e técca multvarada a ser utlzada;. Desevolver o plao de aálse; 3. Avalar os pressupostos subjacetes à técca escolhda; 4. Estmar o modelo multvarado e aceder aos resultados; 5. Iterpretar a sesbldade aos parâmetros (pesos, loadgs, utldades, ); 6. Valdar o modelo. O esquema segute mostra o tpo de técca multvarada adequada a cada tpo de stuação e pode ser muto útl aquado da escolha da técca a utlzar. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 69

69 FIGURA 3. ESQUEMA DE DIVERSAS TÉCICAS MULTIVARIADAS. ADAPTADO DE ADERSO (998). sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 70

70 Regressão múltpla O objectvo prcpal da regressão múltpla é prever valores de uma varável depedete a partr de uma combação poderada de duas ou mas varáves depedetes. A técca permte também o cálculo de um coefcete de correlação múltpla (coefcete de correlação de Pearso) etre a varável depedete e o cojuto de varáves depedetes. A regressão múltpla requer uma varável depedete métrca e varáves depedetes métrcas (embora seja possível utlzar algumas varáves ãométrcas como varáves depedetes, que se desgam por varáves mudas ou dummes ). A técca pressupõe que exste leardade a relação etre as varáves e que o erro (dfereça etre os valores da varável depedete e os valores prevstos dessa varável) tem uma dstrbução gaussaa e apreseta homogeedade de varâca, pressupõe ada a ão exstêca de multcoleardade. Desevolver-se-á prmero a regressão lear smples (técca bvarada) para depos se geeralzar os resultados para a regressão lear múltpla. Regressão Lear Smples A regressão é um método estatístco que permte estabelecer relações etre varáves procurado estmar (ou prever) uma delas, a varável resposta (ou depedete), quado se supõe cohecdas outras varáves dtas explcatvas (ou depedetes). Pode-se ajustar aos dados o modelo lear Y = α + β + ε. Em que α e β são costates descohecdas e ε exprme o erro (ou desvo, ou resíduo ou ruído) de característcas emetemete mprevsíves e, portato aleatóras. A qualdade do ajustameto lear será tato melhor quato meor for a magtude dos erros ou desvos, e essa magtude está relacoada com o coefcete de correlação ρ. Cov(, Y ) ρ = com - ρ σ σ Y Se ρ = 0, as duas varáves são learmete depedetes, sto é, o cohecmeto de é rrelevate para prever Y (ou vce-versa). Se ρ = ±, exste uma assocação lear perfeta etre e Y, de modo que é possível prever com exactdão o valor de Y se o valor de for cohecdo. A terpretação que se dá quado 0 < ρ < é que a varável cotém alguma formação sobre Y, de modo que é possível fazer prevsões para Y. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 7

71 O coefcete de correlação pode ser estmado a partr das observações. este caso S Y pelo coefcete de correlação de Pearso: r = S S Sobre o resíduo aleatóro ε é habtual supor três hpóteses:. O seu valor médo é ulo, sto é, E(ε) = 0;. Os resíduos ão estão correlacoados e a sua varâca ão depede de, ou seja, σ ε = σ costate; 3. O resíduo segue uma dstrbução gaussaa. O método dos mímos quadrados permte estmar α e β sem que seja ecessára alguma referêca à dstrbução dos resíduos. O objectvo do método dos mímos quadrados é ajustar uma recta de equação y ˆ = a + bx aos dados, ode αˆ = a e βˆ = b, mmzado a soma dos quadrados dos erros (ou desvos) defda por: SE = [ y ( a + bx )] =. Assm sedo, as estmatvas dos mímos quadrados dos parâmetros do modelo obtêm-se resolvedo o sstema SE = 0 a SE = 0 b = = [ y ( a + bx )] [ y ( a + bx )] = 0 x = 0 As equações aterores são cohecdas por equações ormas e a solução do sstema é a = y bx x y xy = b = x x = Uma estatístca usada para medr a qualdade do ajustameto lear aos dados é o coefcete de determação que mas ão é que o quadrado do coefcete de correlação de Pearso. Este coefcete dá a proporção da varabldade total que é explcada pelo modelo de regressão, e quato mas próxmo estver do valor melhor será a qualdade do ajustameto. Vejam-se agora os dversos tervalos de cofaça para os parâmetros do modelo e os tervalos de predção. 7 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 Y

72 Itervalo de Cofaça a ( γ)*00% para α / ; / ; ) ( ˆ, ) ( ˆ S S t S S t γ γ α α Itervalo de Cofaça a ( γ)*00% para β + ˆ, ˆ / ; / ; S S t S S t γ γ β β Itervalo de Predção a ( γ)*00% para E(Y 0 ) ( ) ( ) / ; 0 0 / ; 0 ) ( ˆ, ) ( ˆ S S t Y S S t Y γ γ Itervalo de Predção a ( γ)*00% para o (ovo valor) Y 0 ( ) ( ) / ; 0 0 / ; 0 ) ( ˆ, ) ( ˆ S S t Y S S t Y γ γ Após efectuar uma regressão há que valdar o modelo fazedo uma aálse dos resíduos, prcpalmete o que respeta à depedêca e gaussadade dos resíduos. Pode-se, por exemplo, fazer um gráfco dos resíduos da regressão lear (gráfco de dspersão) e se estes apresetarem um comportameto aleatóro em toro de zero, etão esse é um dcador de ausêca de correlação etre os resíduos. Para um problema de regressão é usual desevolver testes de hpóteses sobre:. Os parâmetros do modelo (α e β);. A capacdade explcatva do modelo. H 0 : β = β 0 Crtéro de rejeção: / ; 0 / ˆ γ β β t S S H 0 : α = α 0 Crtéro de rejeção: / ; 0 ) ( ˆ γ α α + t S S Capacdade explcatva do modelo ( ) ( ) ( ) [ ] ( ) ( ) = = = = + = + = Y Y Y Y Y Y Y Y Y Y ˆ ˆ ˆ ˆ 73 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

73 Represetado por: Varabldade total: ST = ( Y Y ) = Varabldade ão explcada pela regressão: SE = ( ˆ ) = Y Y Varabldade explcada pela regressão: SR = ( Yˆ Y ) Vem que: ST = SE + SR e r = SR/ST o que permte a terpretação do coefcete de determação como a fracção da varabldade total explcada pelo modelo de regressão. SR Prova-se que: F = ~ F, com crtéro de rejeção: F F,-;-γ SE /( ) É usual dspor a formação relatva a uma regressão lear uma tabela AOVA; Fote de Soma de Graus de Méda de varação quadrados lberdade quadrados Valor de F Regressão SR MR = SR Resdual SE ME = SE/(-) F = MR/ME Total ST o quadro abaxo apresetam-se algus tpos de relações (ão leares) que são learzáves através de trasformações adequadas. Relação orgal Trasformações de varáves e parâmetros Modelo lear trasformado Y = α+ β/ Z = / Y = α + βz Y = α β W = ly α' = lα W = α + βz Z = l Y = αβ W = ly α' = lα W = α + β β = lβ Y = αe β W = ly α' = lα W = α + β Y = e α+β W = ly W = α + β Y = e α+β/ W = ly Z = / W = α + βz = sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 74

74 Face à exstêca de város modelos leares trasformados com uma varável explcatva, a escolha do melhor modelo reca sobre o que apresetar maor coefcete de determação. Regressão Lear Múltpla A geeralzação do modelo de regressão lear smples Y = α + β + ε ao modelo de regressão lear múltplo Y = β 0 +β +β + +β p p +ε é medata se se escrever o modelo a forma matrcal. Cosdere-se o modelo de regressão lear smples α = β 0 e β= β, ou seja, Y = β 0 +β +ε, ou ada, Y = β 0 +β +ε, =,,. Sejam as matrzes Y Y Y = M Y, = M Etão Y = β+ε. M ε β0 = ε, β =, ε β M ε As equações ormas escrevem-se da forma T Y = T b ode b = ˆ b0 β = b Resolvedo as equações ormas em ordem a b vem b=( T ) - T Y pelo que Y ˆ = b. A soma dos quadrados dos resíduos toma o aspecto ε T ε = Y T Y - β T T Y. A matrz das covarâcas dos estmadores dos parâmetros do modelo é: Σ = Cov( βˆ ) = σ ( T ) -. Fote de varação Quato ao quadro AOVA a sua forma matrcal tem-se Soma de quadrados Graus de lberdade Méda de quadrados Regressão b T T Y T YY T / MSR = (b T T Y T YY T /)/ Valor de F Erro Y T Y b T T Y MSE = (Y T Y b T T Y)/(-) F = MSR/MSE Total Y T Y T YY T / Todos os resultados aterores são váldos para o modelo de regressão lear múltplo Y = β 0 +β +β + +β p p +ε, =,,. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 75

75 Cosderado agora = M M M L L L L p p M p β0 β, β = M β p O quadro AOVA correspodete à hpótese H 0 : β = β = = β p = 0, sto é, que ão exste regressão lear, é Fote de varação Soma de quadrados Graus de lberdade Méda de quadrados Regressão b T T Y T YY T / p MSR = (b T T Y T YY T /)/p Valor de F Erro Y T Y b T T Y p MSE = (Y T Y b T T Y)/(-p-) F=MSR/MSE Total Y T Y T YY T / ode F ~ F p,-p- sob a valdade de H 0. H 0 é rejetada ao ível γ se F F p,-p-;-γ Regressão logístca A regressão logístca é uma forma especalzada de regressão que é formulada para prever e explcar uma varável bára qualtatva. O objectvo prcpal desta técca é perceber o que dfereca dos grupos de casos, ou seja, o que dfereca os dos íves de uma varável depedete dcotómca, com base um cojuto de varáves depedetes (geralmete quattatvas). É possível usar esta técca para classfcar os casos com base o cojuto de varáves depedetes e, para calcular a probabldade de cada caso pertecer a cada um dos grupos. Também é possível utlzar esta técca para stuações em que a varável depedete tem mas do que duas categoras mas, esse caso, o método é ormalmete desgado por regressão logístca multomal. A regressão logístca é equvalete a uma aálse dscrmate com dos grupos. Cotudo, em relação à aálse dscrmate tem a vatagem de ão exgr pressupostos tão rígdos; ser meos afectada quado os pressupostos báscos (omeadamete a gaussaadade das varáves) ão são cumprdos e, de poder corporar varáves qualtatvas através de varáves dummy. Vejam-se de seguda, de acordo com CARROLL (003), algumas outras vatages e desvatages deste método. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 76

76 Vatages: É fácl estmar usado métodos de máxma verosmlhaça; Detecta certos feómeos ão leares; Detecta os feómeos de forma global; É uma técca mplemetada em mutos software s; Os coefcetes das combações leares dão um resultado relatvamete explícto; Rápda de calcular e modelar. Desvatages: As varáves explcatvas têm que ser depedetes (exstêca de multcoleardade); ão se aplca aturalmete a varáves explcatvas quattatvas; tem-se que passar para varáves qualtatvas; É sesível aos dvíduos fora da orma (outlers); ão trata os dvíduos com dados em falta; Sesível a flutuações aleatóras das varáves explcatvas; ão se aplca a populações homogéeas Aálse dscrmate O objectvo desta técca é semelhate ao da regressão logístca (compreeder dfereças etre grupos e prever a que classe um ovo elemeto com determadas característcas va pertecer), com a dfereça de poder ldar com dos ou mas grupos de casos. Tem pressupostos mas rígdos do que a regressão logístca, por exemplo, as varáves depedetes devem ser métrcas, os dados em cada grupo devem apresetar dstrbução gaussaa multvarada e pressupõe que as matrzes de varâca-covarâca sejam guas para os dferetes grupos de casos. Testa a hpótese de as médas de grupo de um cojuto de varáves depedetes para dos ou mas grupos serem guas. Esta méda de grupo é chamada de cetróde. Os crtéros mas comus para testar a sgfcâca estatístca se se utlzar o método Stepwse são a dstâca de Mahalaobs e o crtéro V de Rao s. Exstem ada outros crtéros como: Λ de Wlks, Hotellg s trace, Plla s. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 77

77 A escolha da fução dscrmate é feta de modo a maxmzar a varâca tergrupos relatvamete à varâca tra-grupo. Para testar a valdade das fuções dscrmates classfca-se o cojuto de casos orgas e comparam-se os agrupametos cosegudos com os grupos pré-defdos e, assm, estma-se a percetagem de casos correctamete classfcados a partr das varáves utlzadas. Frequetemete recorre-se à rotação dos exos das fuções dscrmates, pos os valores dos coefcetes depos da rotação tederão a aproxmar-se de zero ou de um, melhorado a terpretação das fuções dscrmates e das dfereças etre os grupos; também, a rotação dos exos matém o poder dscrmatóro total do modelo, matém a posção relatva dos grupos e, o poder dscrmatóro de cada fução torar-se-á, em geral, melhor dstrbuído pelas váras varáves. Para dos grupos uma só fução dscrmate é sufcete, mas para p grupos poderá ser ecessáro mas do que uma combação lear para assegurar uma boa separação etre grupos, de modo que será ecessáro determar o úmero de fuções dscrmates. Para sso, pode-se utlzar, por exemplo, o teste Λ de Wlks. Quado se tem mas varáves do que o ecessáro, utlzam-se métodos Stepwse, ou seja, seleccoam-se as varáves que mas cotrbuem para a dstção etre grupos, e em seguda vão-se cludo e/ou retrado varáves as fuções dscrmates, uma a uma, de acordo com um crtéro que pode ser defdo pelo própro aalsta. O crtéro de selecção é uma medda dscrmatóra, por exemplo: estatístca Λ de Wlks, estatístca V de Rao, quadrado da dstâca de Mahalaobs para os grupos mas dêtcos, estatístca F, varâca resdual. Veja-se agora a metodologa de um método de estmação de Stepwse. Os passos a segur, segudo ADERSO (998), são:. Seleccoar uma varável depedete cal (a que tver a maor correlação com a varável depedete);. A percetagem de varação explcada é estatstcamete sgfcatva? (se ão): ão é possível efectuar prevsão com a regressão múltpla (se sm): passar ao passo 3 3. Exstem outras varáves depedetes dspoíves? (se ão): avalar a equação de prevsão fal (se sm): seleccoar outra varável depedete 78 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

78 A varâca é explcada, por todas as varáves, é sgfcatva? (testar através de testes F parcas para cada varável o modelo de regressão) (se ão): elmar as varáves ão sgfcatvas e retorar ao passo 3 (se sm): retorar ao passo 3 Em suma, a aálse dscrmate é um método estatístco para classfcar dvíduos ou objectos de modo exaustvo em grupos mutuamete exclusvos, com base um cojuto de varáves depedetes. Para sso, são determadas combações leares dessas varáves que dscrmam etre grupos defdos a pror, de tal modo que seja mmzada a probabldade de erro de correcta classfcação a posteror Árvores dscrmates (de decsão) É uma técca exploratóra para descobrr estruturas os dados. Uma sére de regras classfcatóras dervam dos dados por um procedmeto cohecdo como partção recursva e o resultado é uma árvore classfcatóra que é a reuão de mutas dessas regras. A técca da árvore de decsão cosste em classfcar para detectar os crtéros permaetes de repartção dos dvíduos de uma população em classes predefdas. Etapas da costrução de uma árvore dscrmate: Defções Repartr os dvíduos de uma população em classes; Escolher a varável que melhor separa os dvíduos da classe depede do tpo de árvore; Escolher o crtéro de separação depede do tpo de árvore. Repartr os dvíduos pelos ós; Podar (parar o crescmeto da árvore mas cedo (pré-poda) ou costrur uma árvore completa e podar depos (pós-poda)). Segudo CARROLL (003), esta técca apreseta as segutes vatages e desvatages. Vatages: Os resultados são expressos a forma de codções explíctas; São pouco perturbadas pela preseça de outlers; São pouco sesíves a flutuações das varáves ão dscrmates; Algumas geram judcosamete dados em falta; 79 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

79 Algumas permtem estudar um cojuto de varáves de qualquer tpo; Algumas permtem tratar um úmero muto grade de varáves explcatvas. Desvatages: Leva algum tempo de cálculo; Detecta os feómeos de forma local; A defção dos ós o ível + depede extremamete dos ós do ível ; ão dá uma classfcação estável ao se efectuarem flutuações aleatóras os dados mas dscrmates; ecessta de um úmero grade de dvíduos por ó (0 a 30); A represetação gráfca dá regões rectagulares, o que ão correspode forçosamete à dstrbução dos dvíduos; Os valores dos scores obtdos ão são uformemete dstrbuídos. Uma árvore de decsão utlza uma estratéga de dvdr-para-coqustar, ou seja, um problema complexo é decomposto em sub-problemas mas smples e, recursvamete a mesma estratéga é aplcada a cada sub-problema. O método adoptado por estes algortmos cosste a dvsão recursva do cojuto de observações em subgrupos flhos costrudo uma árvore da raz para as folhas. Em cada passo, o algortmo determa uma regra de classfcação, seleccoado uma varável e um poto de corte os valores dessa varável que: Maxmze uma medda de etropa dos ós flhos relatvamete ao ó pa (C4.5 e ID3); Mmze uma medda de mpureza (CART); Maxmze a dstção estatístca dos flhos relatvamete à varável depedete (CHAID e QUEST). De seguda abordam-se algus dos tpos de árvores mas comus (CART, CHAID, QUEST, C4.5 e C5.0). CART (classfcato ad regresso tree) adaptada ao estudo de todo o tpo de varáves. Este método utlza meddas como ídce de G para medr a dversdade o ó para varáves depedetes omas. De forma smples, este ídce cotablza a proporção de observações em cada classe da varável depedete um ó relatvamete ao total, sto é, ao ó raz. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 80

80 O ídce de G toma o seu valor mímo quado um ó correspodete a uma partção da varável depedete, ou seja, quado apeas exstem observações pertecetes a uma classe. A dfereça etre o ídce G para o ó pa e a soma dos valores para o ó flho (poderada pela proporção de casos em cada flho) é apresetada a árvore como mprovemet. A varável escolhda é aquela que garate um maor valor de mprovemet. CHAID (ch-square automato teracto detecto) reservada ao estudo de varáves dscretas e de categoras. Utlza teste Qu-Quadrado de Pearso uma tabela de cotgêca etre as categoras da varável depedete e as categoras das varáves depedetes (as varáves cotuas são prevamete dscretzadas em classes). a verdade, faz-se um cojuto de testes agregado as classes da varável explcatva até só restarem duas, de modo a descobrr o melhor úmero de classes. Este processo repete-se para a totaldade das varáves explcatvas e a melhor varável explcatva com o melhor úmero de classes, sto é, a melhor probabldade de sgfcâca (p value) ajustada pelo método Boferro, é escolhdo. QUEST Utlza gualmete testes de Qu-Quadrado de Pearso para tabelas de cotgêca, tal como CHAID. o etato utlza um maor cojuto de testes estatístcos para garatr a depedêca etre o processo de selecção da varável explcatva e o poto de dvsão das classes da mesma varável. Usa, por exemplo, a estatístca F da AOVA e a estatístca F de Levee para varâcas dferetes a selecção de varáves métrcas. C4.5 e C5.0 (de J.R. Qula) adaptada ao estudo de todas as varáves. Utlza como crtéro de separação a etropa. A C5.0 derva da CART. Este tpo de árvore ão é bára, separa a população em mas do que duas sub-populações Aálse de varâca multvarada Esta é uma técca de aálse de varâca que utlza duas ou mas varáves depedetes métrcas e duas ou mas varáves depedetes omas ou ordas. A 8 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

81 aálse de varâca uvarada (AOVA) testa a hpótese ula de que os valores médos da varável depedete em cada uma das amostras são guas. Como se tem duas ou mas varáves depedetes, tem-se para cada amostra, um vector de valores médos das varáves depedetes, logo, a MAOVA testa a hpótese ula de que os valores médos dos vectores das amostras são guas. A MAOVA pressupõe que os dados em cada grupo têm dstrbução gaussaa multvarada e ada que as matrzes de varâca-covarâca das varáves depedetes sejam guas em todos os grupos (amostras). A aálse de varâca smples é classfcada como técca uvarada ão por causa do úmero de varáves depedetes, mas sm pelo úmero de varáves depedetes. O procedmeto uvarado clu o teste t para stuações de dos grupos e a AOVA para stuações com três ou mas grupos defdos por duas ou mas varáves depedetes. O teste t dá a sgfcâca estatístca etre duas médas amostras depedetes. Utlza a estatístca t = (µ µ ) / SEµ µ, ode µ = méda do grupo ; µ = méda do grupo ; SEµ µ = erro padrão das dfereças etre as médas dos grupos. Se o valor de t for sufcetemete grade etão a dfereça deve-se ão à varabldade amostral, mas a uma verdadera dfereça. Se t > t + ;α etão rejeta-se a hpótese ula de que ão há dfereça etre os grupos. ( e são as dmesões das amostras) A AOVA utlza o teste F (abordado a regressão lear smples) com k- e -k graus de lberdade para um dado ível α (ode = + + k e k o úmero de grupos). A lógca de uma AOVA, tal como o ome reflecte (Aálse de Varâca) mplca a comparação de duas estmatvas depedetes da varâca para a varável depedete, uma que reflecte a varabldade ter-grupos e outra a varabldade tra-grupos. A estatístca F é precsamete o quocete etre essas duas varâcas. AOVA H 0 : µ = µ = = µ k H 0 MAOVA µ µ µ k µ µ = = = µ k = µ p µ p µ pk sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 8

82 A extesão drecta do teste t, para dos grupos, é uma forma especalzada da MAOVA chamada Hotellg s T ; para k grupos é a MAOVA que, por sua vez é uma extesão do Hotellg s T. Em cojuto com a MAOVA pode-se utlzar a MACOVA (aálse multvarada de covarâca) para remover o efeto de quasquer varáves depedetes quattatvas fora de cotrolo as varáves depedetes Aálse em compoetes prcpas (ACP) O objectvo desta técca é a redução da dmesoaldade de grades matrzes de dados; trasformar os valores de um cojuto de p varáves (métrcas) em valores de k compoetes, com uma perda míma de formação. As compoetes são combações leares das varáves, e o úmero de compoetes ão pode ser maor que o úmero de varáves. Isso quer dzer que k p. As compoetes podem ser cosderadas como ovas varáves, e cada caso tem um valor para cada uma das compoetes. A técca pode ser utlzada para reduzr o cojuto de dados cal porque mutas vezes, 3, ou 4 compoetes podem represetar quase toda a formação de um grade cojuto de varáves (por exemplo, 0 ou mas varáves). A ACP permte aalsar grades cojutos de dados evolvedo um elevado úmero de varáves, sem exgr quasquer pressupostos complcados. O objectvo geométrco é detfcar um cojuto de exos ortogoas tas que, as coordeadas das observações dão os valores das ovas varáves e, cada ova varável é uma combação lear das varáves orgas. A ACP pode-se assm cosderar uma técca de aálse exploratóra de dados que pode ser útl para a melhor compreesão das relações exstetes etre as varáves em estudo. A ACP é útl a redução da dmesoaldade, pos trabalhar com dmesões meores faclta a vsualzação dos dados e a detfcação de padrões de teresse; Para detfcar padrões de assocação etre as varáves, pos é dfícl somete por specção de uma matrz de grade correlação detfcar as varáves que estão jutas devdo a um elevado grau de covarâca mútua; esta tarefa é sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 83

83 smplfcada olhado para a relação etre as varáves orgas e as compoetes prcpas (c.p. s); Para testar a ormaldade, porque se as c.p. s ão forem ormalmete dstrbuídas, etão as varáves orgas também ão o serão; a procura de outlers, uma vez que um hstograma de cada uma das c.p. s permte detfcar dvíduos a que correspodem valores demasado elevados ou demasado baxos; a aálse de regressão para ultrapassar o problema da multcoleardade, pos as c.p. s são ão correlacoadas (determam-se as prmeras c.p. s relatvamete ao cojuto das varáves depedetes, aplcado-se depos a regressão às compoetes seleccoadas); Para detectar grupos ou efectuar a classfcação dos objectos, porque se as duas prmeras c.p. s explcarem uma boa parte da varabldade total, pode-se represetar os scores dos dvíduos o plao defdo por estas duas c.p. s e tetar vsualzar agrupametos dos potos obtdos. Se houver ecessdade de utlzar mas do que duas c.p. s usam-se os scores dos dvíduos para as c.p. s mas mportates em vez dos valores cas das varáves, e costroem-se os grupos a partr deles utlzado um dos métodos de aálse classfcatóra. Um cojuto de dados de p varáves pode ser represetado grafcamete um espaço p-dmesoal em relação aos p exos ou p ovos exos. O prmero ovo exo resulta uma ova varável tal que esta ova varável explca o máxmo da varâca total. Depos dsso, o segudo exo, ortogoal ao prmero, é detfcado tal que a correspodete ova varável explca o máxmo da varâca que ão fo explcada pela prmera ova varável. O procedmeto repete-se até que todos os p ovos exos teham sdo detfcados tal que as ovas varáves explcam sucessvas varâcas máxmas e as varáves sejam ão correlacoadas. As c.p. s devem reflectr, tato quato possível, as característcas dos dados, que eram expressas pela dferecação que as varáves orgas permtam estabelecer; sto é, devem explcar uma grade parte da varação assocada às varáves cas. A varâca de uma c.p. é uma medda da quatdade de formação explcada por essa c.p.. A redução de dmesoaldade atge-se cosderado apeas algumas das c.p. s (as de maor varâca). sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 84

84 Em vez de se aalsar um elevado úmero de varáves (as orgas) com uma estrutura ter-relacoal complexa (pos dzem respeto ao mesmo dvíduo), aalsam-se apeas algumas varáves ão correlacoadas. Poder-se-á prossegur a aálse aplcado porvetura outras téccas estatístcas para varáves ão correlacoadas. Os loadgs das c.p. s (correlações etre as varáves cas e as c.p. s) podem ajudar a terpretação destas; são útes para dzer quato da varâca de cada varável orgal é explcada pelas c.p. s. O pesqusador deve decdr quatas compoetes quer reter para futuras aálses, pesado a smplcdade (um meor úmero de dmesões é mas fácl de trabalhar) e a tereza (um úmero grade de dmesões capta mas formação dspoível). Dado que as c.p. s se podem ordear por ordem decrescete da sua varâca e que quato maor for a varâca, mas represetatva dos dados orgas será a correspodete c.p, devem-se reter as prmeras c.p. s. Há váras regras para determar o úmero de c.p. s a reter para futuras aálses: Reter tatas c.p. s quatas as ecessáras para que a percetagem de varâca por elas explcada seja superor a um dado valor α fxado a pror; Reter apeas as c.p. s às quas correspodem valores própros superores à méda; Reter apeas as c.p. s às quas correspodem valores própros superores a (crtéro de Kaser); Utlzar um gráfco (Scree-Plot) ode se represetam os potos de abcssa j e ordeada gual à percetagem de varâca explcada pela j-ésma c.p., ou seja, os potos de coordeadas (j, λ j / p j= λ j ), ode se dstguem as c.p. s que cotrbuem muto das que cotrbuem pouco devem-se reter as r que mas cotrbuem, destacado-se de forma acetuada das restates. De etre estes crtéros, o de Kaser e o scree-plot são os mas vulgarmete utlzados. A prátca demostrou já que estes crtéros coduzem ambos a soluções credíves se se verfcar pelo meos uma das segutes codções: úmero de varáves feror a 30 ou úmero de casos (dvíduos) superor a 50. Segudo algus autores, quado o úmero de varáves é superor a 30 (sobretudo se é superor a 50), deve-se utlzar o scree-plot em detrmeto do crtéro de Kaser. Tal como a aálse dscrmate, de modo a facltar a terpretação, também se procede à rotação dos exos. 85 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

85 Vejam-se etão algus dos tpos de rotação mas cohecdos. Varmax: rotação ortogoal (exos matêm o seu âgulo de 90º). Objectvo: maxmzar a varâca dos quadrados dos poderadores dos factores as varâcas matedo, todava, costate a varâca comum de cada varável. Mmza o úmero de varáves que têm um loadg elevado para cada factor. Smplfca a terpretação dos factores. É a mas vulgarmete utlzada. Quartmax: rotação ortogoal. Objectvo: maxmzar a varâca dos poderadores dos factores os factores matedo, todava, costate a varâca comum de cada varável. Mmza o úmero de factores ecessáros para explcar cada varável. Smplfca a terpretação das varáves observadas. Tede a produzr soluções com mas varáves bem correlacoadas com um factor do que a varmax. Equamax: combação do método varmax que smplfca os factores e do método quartmax que smplfca as varáves. Mmza o úmero de varáves que têm um loadg elevado um factor e o úmero de factores ecessáros para explcar a varável. Drect Oblm: rotação oblíqua (ão ortogoal, exos ão matêm o âgulo de 90º). Promax: rotação oblíqua que permte que os factores sejam correlacoados. É útl para cojutos de dados grades porque pode ser calculada mas rapdamete do que uma rotação drect oblm Aálse factoral O objectvo da aálse factoral é aalsar a estrutura das correlações etre um grade úmero de varáves defdo um cojuto de dmesões comus subjacetes (factores). as correlações de um cojuto de factores. Estes factores são ovas varáves defdas por combações leares das varáves em aálse as quas, em teora, vão explcar como é que as varáves cas estão correlacoadas. Grade parte do valor de cada uma das correlações etre as varáves pode ser explcado em termos das fluêcas dos factores. O úmero de factores é meor (ormalmete muto meor) do que o úmero de varáves. Em rgor, a aálse factoral requer varáves métrcas porque aalsa correlações de sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 86

86 Pearso, mas, em cêcas socas, é muto utlzada para aalsar correlações etre varáves meddas por meo de escalas de avalação. O vestgador pode detfcar as dmesões da estrutura e etão determar o quato cada varável é explcada por cada dmesão. Depos de sto estar feto pode-se alcaçar as grades utldades da aálse factoral, que são: resumr e reduzr os dados. Resumr porque as dmesões quado terpretadas e eteddas descrevem os dados um úmero muto mas pequeo de cocetos do que as varáves orgas. Reduzr porque se calculam os scores para cada dmesão subjacete e substtuem-se as varáves orgas. Exstem dversos crtéros para decdr o úmero de factores a extrar, tas como: valores própros superores a ; a pror por cohecmeto do vestgador; percetagem de varâca (percetagem cumulatva do total de varâca explcada pelos factores sucessvos: cêcas aturas (95%), cêcas socas (60%)); scree plot. A terpretação dos factores é feta através dos loadgs dos factores, que são um meo de terpretar o papel que cada varável tem a defção de cada factor, ou seja, são a correlação de cada varável e factor. Idcam o grau de correspodêca etre a varável e o factor (loadgs elevados toram a varável represetatva do factor). Tal como as téccas vstas aterormete, a rotação smplfca a estrutura dos factores e tora mas fácl saber se um factor é sgfcatvo ou ão. De modo a verfcar se é adequada utlzação uma aálse factoral, é comum o cálculo do ídce KMO (Kaser-Meyer-Olk). Segudo COELHO (005), se este ídce for feror a 0,5 etão é acetável a utlzação de uma aálse factoral, se for superor a 0,8 a adequação é boa. Prmero há que ver se a aálse é cofrmatóra ou exploratóra. Se for cofrmatóra utlza-se um modelo de equações estruturas (sub-capítulo ). Se for exploratóra aplca-se a aálse factoral (por varáves ou por dvíduos). a aálse factoral exploratóra ão exste qualquer dea préva sobre a estrutura dos dados, sto é, sobre o úmero de factores comus, sobre se os factores são ortogoas ou oblíquos, sobre o úmero de dcadores de cada factor e, sobre os dcadores que represetam cada factor. a aálse factoral cofrmatóra, pelo cotráro, exste já alguma dea ou teora sobre a estrutura dos dados: sobre o úmero de factores, se são ortogoas ou ão, sobre o úmero de dcadores de cada factor, sobre os dcadores que represetam cada factor, etc. 87 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

87 A aálse factoral pode parecer muto semelhate à aálse em compoetes prcpas, cotudo apresetam algumas dfereças fudametas os seus objectvos. Ambas as téccas podem ser usadas como métodos de redução de dados, mas a aálse factoral ão fo desehada para sso. O objectvo da ACP é a redução do úmero de varáves para que cada compoete explque o máxmo da varâca dos dados (ão há modelo estatístco, apeas uma trasformação geométrca). O objectvo da aálse factoral exploratóra é a detfcação dos factores subjacetes aos dados que explcam a estrutura de correlações dos dados (há modelo estatístco). Também, as compoetes são observáves, equato que os factores ão (são varáves latetes) Aálse de clusters Esta técca tem como objectvo prcpal o agrupameto de casos com base um cojuto de varáves. Por outras palavras, a técca teta formar grupos de casos (chamados clusters). O úmero de clusters (k) ão pode ser maor do que o úmero de varáves (p), e ormalmete k é muto meor do que p. Os casos detro de um cluster são semelhates etre s em termos dos seus valores um cojuto de varáves, e são mas semelhates do que com qualquer um dos casos pertecete a outro cluster. A dfculdade cal é que ão exste uma úca va de defção de grupos, sto é, um úco crtéro de partção e/ou agrupameto dos dvíduos ou casos com base uma úca medda de (ds)semelhaça. As prcpas etapas de uma aálse de clusters são:. A selecção de dvíduos ou de uma amostra de dvíduos a serem agrupados;. A defção de um cojuto de varáves a partr das quas será obtda a formação ecessára ao agrupameto dos dvíduos; 3. A defção de uma medda de semelhaça ou dssemelhaça etre cada dos dvíduos; 4. A escolha de um crtéro de agregação ou desagregação dos dvíduos, sto é, a defção de um algortmo de partção/classfcação; 5. A valdação dos resultados ecotrados. De seguda apresetam-se os dferetes métodos de aálse de clusters. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 88

88 Téccas de optmzação: crtéro de agrupameto. A sua optmzação dca qual deverá ser o grupo ode cada caso será cluído, pressupodo que todos os casos pertecem a um úmero k predetermado de grupos; Apresetam duas desvatages, omeadamete: ão exste ehuma garata de que o algortmo foreça um óptmo global e ão apeas um óptmo local e, requer uma quatdade cosderável de tempo de computação, uma vez que o modo mas lógco de o fazer sera cosderar todas as possíves partções [k =, 3, 4, ] e escolher a melhor de todas elas; a sua aplcabldade só ser tora possível com a defção, a pror, do úmero de grupos preteddo. Téccas de desdade: os grupos são formados através da procura de regões que coteham uma cocetração relatvamete desa de casos. Téccas herárqucas: podem-se subdvdr em téccas aglomeratvas (parte-se de grupos de apeas um dvíduo cada, que vão sedo agrupados sucessvamete até se ecotrar apeas um grupo que clurá a totaldade dos dvíduos) e, dvsvas (parte-se de um grupo que clu todos os dvíduos em estudo e por um processo sstemátco de dvsões sucessvas obtém-se grupos de um elemeto cada; são muto pesados em termos de capacdade formátca); ambas partem de uma matrz de semelhaças ou dssemelhaças (dstâcas) etre os casos; coduzem a uma herarqua de partções P, P,, P do cojuto de objectos em,,, grupos. Os métodos dzem-se herárqucos porque, para cada par de partções, P e P +, cada grupo da partção P + está cluído um grupo da partção P. Téccas ão herárqucas: os métodos ão-herárqucos baseam-se a obteção de um úmero predefdo de clusters, k, que coterão todos os casos observados. Procura-se ecotrar os k clusters que melhor solucoam o problema segudo a mmzação ou maxmzação de uma medda de heterogeedade ou homogeedade. Podem-se referr três dferetes procedmetos, omeadamete: Lmar sequecal (sequetal threshold): começa por seleccoar uma semete para um cluster e clur todos os objectos detro de uma dstâca pré especfcada. Depos uma seguda semete é seleccoada e todos os objectos detro de uma dstâca pré especfcada são seleccoados e o processo cotua. Quado um objecto é agrupado com uma semete, ão é mas cosderado as semetes segutes. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 89

89 Lmar paralelo (parallel threshold): seleccoa dversas semetes smultaeamete o íco e dstrbu os objectos detro da dstâca lmar pela semete mas próxma. Com o deserolar do processo, as dstâcas podem ser ajustadas para clur mas ou meos objectos os clusters. Optmzação: semelhate aos outros, mas permte a redstrbução dos objectos. Se durate o processo, um objecto se tora mas próxmo de outro cluster do que daquele em que está desgado o presete mometo, etão o procedmeto de optmzação muda o objecto para o cluster mas semelhate. Outras téccas: cluem aquelas em que se permte que haja sobreposção de grupos (fuzzy clusters) e todas as restates que ão foram cluídas as aterormete defdas. Os métodos fuzzy assocam a cada objecto um vector cujas compoetes represetam o grau de lgação do objecto a cada um dos grupos fuzzy. Em cosequêca, cada grupo fca detfcado por um vector de coefcetes que represetam o grau de perteça de cada um dos objectos a esse mesmo grupo Os prcpas crtéros de comparação etre classes são: Sgle lkage ou crtéro do vzho mas próxmo Semelhaça etre dos grupos é a semelhaça máxma etre quasquer dos casos pertecetes a esses grupos. Qualquer grupo é defdo como o cojuto de casos em que qualquer elemeto é mas semelhate a pelo meos um outro elemeto do mesmo grupo do que a qualquer elemeto de outro grupo. A dstâca etre os dos grupos é a meor das dstâcas etre os elemetos dos dos grupos. Complete lkage ou crtéro do vzho mas afastado Procedmeto verso ao ateror; a dstâca etre dos grupos é a dstâca etre os seus elemetos mas afastados ou meos semelhates. Crtéro da méda dos grupos A dstâca etre dos grupos é a méda das dstâcas etre todos os pares de dvíduos costtuídos por elemetos dos dos grupos. Crtéro do cetróde A dstâca etre dos grupos é defda como a dstâca etre os seus cetródes, potos defdos pelas médas das varáves caracterzadoras dos dvíduos de cada grupo, sto é, calcula a dstâca etre dos grupos como a dfereça etre as suas médas, para todas as varáves. Apreseta a desvatagem de que se os dos grupos forem muto sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 90

90 dferetes em termos de dmesão, o cetróde do ovo agrupameto estará mas próxmo daquele que for maor e as característcas do grupo meor tederão a perder-se. Crtéro de Ward Basea-se a perda de formação resultate do agrupameto dos dvíduos. É medda através da soma dos quadrados dos desvos das observações dvduas relatvamete às médas dos grupos em que são classfcadas. Os passos para calcular o crtéro de Ward são: º calcular as médas das varáves para cada grupo; º calcular o quadrado da dstâca Eucldeaa etre essas médas e os valores das varáves para cada dvíduo; 3º somar as dstâcas para todos os dvíduos; 4º mmzar a varâca detro dos grupos (soma dos quadrados dos erros ESS) Uma ferrameta muto utlzada em Aálse de Clusters é o dedrograma. O dedrograma é uma árvore de agrupameto que possblta vsualzação, ao logo do processo de agrupameto, de quas os grupos que se vão subdvddo e do correspodete úmero de dvíduos. Dá uma dea do úmero de classes exstetes efectvamete a população Aálse loglear Esta técca é uma técca ão-paramétrca que aalsa as relações etre duas ou mas varáves omas. É possível cosderar as varáves sem as dstgur etre varáves depedetes e varáves depedetes. Mas também é possível desgar uma varável (ou mas) como varável depedete e cosderar as outras varáves como varáves depedetes Aálse de correspodêcas A aálse de correspodêcas fo desevolvda por estatístcos fraceses e é uma técca de terdepedêca que permte a utlzação de dados qualtatvos e relações ão leares. É um método adaptado a tabelas de cotgêca (r x p) que permte estudar as evetuas relações exstetes etre duas varáves omas; é uma técca para expor as lhas e coluas de uma matrz de dados como potos um espaço vectoral de baxa dmesão. 9 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

91 A utldade de uma técca como a aálse de correspodêcas é que o gaho em terpretação excede muto a perda de formação. A aálse de correspodêcas derva de cojuto dos scores multdmesoas com uma terpretação geométrca bem defda e tecoal. É uma técca mas geométrca do que estatístca. De seguda apreseta-se o algortmo da aálse de correspodêcas.. Selecção do espaço de meor dmesão (seja R p admte-se que há meos propredades do que dvíduos);. Trasformação da matrz de partda cálculo dos perfs dos dvíduos em R p : f j / f j = K(,j) / K(j) 3. Cálculo da matrz de érca V (p x p) de termo geral v jj : v jj = = f ((f j /( f j f )) - f j )(f j /( f j f ) - f j ) ou da matrz smétrca equvalete T de termo geral t jj : t jj = = ((f j f j )/(f (f j f j ))) 4. Dagoalzação da matrz de érca T e obteção dos seus valores própros λ α e vectores própros u α. 5. Aálse do hstograma dos valores própros e escolha da dmesão do espaço cuja érca acumulada explque uma percetagem sgfcatva da érca cal (em geral ou 3 exos). 6. Projecção dos dvíduos os exos de érca retdos: f α = p j= (f j / (f f j ) u αj ) 7. Projecção das propredades os exos de érca retdos: f jα = (/ λ α ) = (f j / f ) f α 8. Cálculo evetual da projecção de elemetos em suplemetar. 9. Recosttução evetual da matrz de partda e cofrmação da aproxmação escolhda (úmero de valores própros retdos). 0. Cálculo das cotrbuções absolutas e relatvas.. Iterpretação com base em valores própros, projecção dos dvíduos e propredades os exos factoras, cotrbuções absolutas e relatvas, etc. Para mas formações sobre esta técca recomeda-se LEBART (995) ou COELHO (005). sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 9

92 Aálse cojuta Esta é uma técca de depedêcas emergete que trouxe sofstcação à avalação de objectos, como por exemplo, ovos produtos, servços ou deas. É uma técca usada especfcamete para eteder como é que os qurdos desevolvem preferêcas por produtos e servços. É baseada a premssa smples de que os cosumdores avalam o valor de um produto/servço/dea (real ou hpotétco) combado cojutos separados de valor dados por cada atrbuto. A Utldade, que é a base coceptual para medr o valor uma aálse cojuta, é um julgameto subjectvo de preferêca úca para cada dvíduo. Assume-se que a Utldade é baseada o valor colocado em cada um dos íves dos atrbutos e expressa uma relação que reflecte a forma como a Utldade é formulada para qualquer combação de atrbutos. Para que esta técca seja bem sucedda, o vestgador deve ser capaz de descrever o produto ou servço em termos tato dos seus atrbutos como de todos os valores relevates para cada atrbuto. Usa-se o termo factor para descrever um atrbuto específco ou outra característca do produto/servço. Os possíves valores para cada factor são chamados íves. Descreve-se um produto ou servço em termos do seu ível o cojuto de factores caracterzadores. É a úca etre todas as téccas multvaradas a qual o vestgador prmero costró um cojuto de produtos ou servços reas ou hpotétcos combado íves seleccoados de cada atrbuto. Essas combações são etão apresetadas aos qurdos que, por sua vez, dão apeas a sua avalação global. O qurdo deve escolher etre um cojuto de produtos. Os qurdos ão precsam dzer mas ada, como por exemplo quão mportate fo um determado atrbuto para eles ou como o produto desempeha determado atrbuto; apeas têm que dcar a sua preferêca. Como o vestgador costruu os hpotétcos produtos ou servços de uma forma específca, a fluêca de cada atrbuto e do valor de cada atrbuto o julgameto de Utldade do qurdo podem ser determados através da resposta global do qurdo Correlação caóca É uma extesão da aálse de regressão múltpla. O objectvo é correlacoar smultaeamete dversas varáves depedetes quattatvas e dversas varáves depedetes quattatvas. 93 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

93 Faclta o estudo das ter-relações etre cojutos de dversas varáves depedetes e dversas varáves depedetes. Equato a regressão múltpla prevê uma úca varável depedete através de um cojuto de varáves depedetes, a correlação caóca smultaeamete prevê váras varáves depedetes através de váras varáves depedetes. Segudo ADERSO (998) apreseta as segutes desvatages: Reflecte a varâca partlhada pelas combações leares de cojutos de varáves, ão a varâca extraída das varáves; Os pesos caócos estão sujetos a grade stabldade; Os pesos caócos são dervados para maxmzar a correlação etre as combações leares, ão a varâca extraída. A terpretação pode ser dfícl (ão exstem métodos de ajuda à terpretação como a rotação); É dfícl detfcar relações sgfcatvas etre os cojutos de varáves depedetes e depedetes porque ada ão foram desevolvdos estatístcas precsas para terpretar a aálse caóca (utlzado-se, até ao mometo, meddas adequadas como os loadgs ou os cross-loadgs) Escaloameto multdmesoal O objectvo desta técca é trasformar as opões do cosumdor sobre semelhaças ou preferêcas em dstâcas represetadas um espaço cartesao. Quato mas próxmos estverem dos potos, mas semelhates são as opões dos cosumdores sobre os dos objectos. O mapa perceptual mostra as posções relatvas etre os objectos, mas são ecessáras outras aálses para descrever ou aceder a quas atrbutos determam a posção de cada objecto. O vestgador tem, à partda, que tomar dversas decsões, tas como: qual será a base de avalação (preferêcas ou semelhaças); se quer uma aálse de agregação (poucos mapas perceptuas) ou desagregação (um mapa para cada sujeto); se os atrbutos serão especfcados pelo vestgador (métodos composcoas) ou apeas meddas de preferêca globas (métodos de decomposção), etre outros. As téccas e procedmetos do método estão bastate desevolvdos em ADERSO (998). 94 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

94 Um caso partcular do escaloameto multdmesoal, com muta utldade, é a aálse de correspodêcas que fo desevolvda o sub-capítulo Modelos de equações estruturas Os modelos de equações estruturas permtem separar as relações para cada varável depedete de um cojuto de varáves depedetes. É utlzada para uma sére de regressões múltplas separadas estmadas smultaeamete. É caracterzada por duas compoetes báscas: o modelo estrutural (relacoa as varáves depedetes com as depedetes) e o modelo de medda (permte que o vestgador use dversas varáves dcadores para uma úca varável depedete ou depedete varáves latetes). As téccas de modelos de equações estruturas são dsttas por duas razões: permtem estmar relações de depedêca múltplas e terrelacoadas e, permtem represetar cocetos ão observáves essas relações, ou seja, corporar varáves que ão são meddas drectamete (varáves latetes). Varáves observáves são característcas das udades estatístcas que são passíves de medção ou observação drecta como, por exemplo, a ota um exame, as vedas de uma empresa, etc. Varáves latetes ou ão observáves são cocetos que ão são passíves de medda drecta e só drectamete podem ser meddos através do recurso a varáves observáves como, por exemplo, a telgêca, a magem de uma empresa, a attude de um cosumdor, etc. São utlzados em modelos cofrmatóros, ou seja, o vestgador especfca um modelo e usa os modelos de equações estruturas para aceder à sua sgfcâca estatístca. Mesmo que o modelo teha um ajustameto acetável, o vestgador ão prova o modelo, apeas cofrma que é um etre outros possíves modelos, pos város modelos dferetes podem ter a mesma qualdade de ajustameto. O vestgador pode etão utlzar uma estratéga de modelos compettvos, ou seja, comparar outros modelos dferetes e ecotrar o melhor. Para mas formações sobre os modelos de equações estruturas, cosultar, por exemplo, COELHO (005). sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 95

95 Téccas emergetes A aálse de dados, especalmete a aálse multvarada, é uma área em grade desevolvmeto e, os últmos aos, a par com o desevolvmeto tecológco, têm surgdo mutas téccas. este sub-capítulo serão levemete abordadas téccas como: Data Warehouse, Data Mg, Redes euroas e Reamostragem. Data Warehouse Procura combar todas as fotes de dados e formação relevate de uma orgazação em apeas uma base de dados com uma estrutura favorável ao processo de tomada de decsão em todos os íves da orgazação. Data Mg É uma ova perspectva da aálse de dados mas voltada para o modo exploratóro do que o cofrmatóro. Dado o vasto cojuto de dados dspoíves (proveetes de bases de dados e data warehouses), a perspectva do vestgador tora-se mas dreccoada para as característcas dos dados e ão tato para a geeralzação para outras stuações. O vestgador segue uma estratéga de descoberta através da examação dos dados para todos os tpos de relações. Redes euroas É uma ferrameta poderosa de exploração, descoberta e de prevsão baseado-se a quatfcação e replcação de padrões complexos dos dados. ão é de fácl terpretação devdo às relações complexas que são tegradas vsvelmete pela metodologa. O vestgador deve utlzar estas téccas para explorar e prever, mas ão tato para explcar. São algortmos computacoas de redes de elemetos smples (como os euróos do cérebro humao) fortemete coectados. Reamostragem Téccas especalmete útes para a valdação de um modelo. As mas cohecdas são: Jackkfe e Bootstrap. Jackkfe (v-fold ou leave-oe-out o caso de os grupos terem cardal ) Fo troduzdo por McCarthy em 966 como uma técca para a estmação da varâca, mas fo orgalmete desevolvdo por Queoulle em 956 para a redução do vés de um estmador. O processo é o segute: retra-se uma observação, coduz-se a aálse com as restates observações (dga-se v-) e etão usa-se o vector a para calcular o valor de Y 96 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

96 para a observação partcular que se retrou para teste. Repete-se o processo v vezes, coduzdo uma aálse dferete para cada subcojuto de v- observações. Pode-se etão comparar a varâca dos valores de Jackkfe com a varâca de quado se fez a aálse usado todas as observações. Bootstrap Fo troduzdo por Efro em 98 como uma metodologa ão-paramétrca geral para dversos problemas estatístcos (vés, varâca e erros comus de medção). Desde etão a técca fo aplcada a mutas áreas usado smulação computacoal para uma varedade de varâcas ão comus e problemas de aproxmação de tervalos de cofaça quado a trabalhar com observações depedetes. Só recetemete fo aplcada para estmação de varâca de estmadores ão leares em quértos complexos. a ausêca de uma amostra de teste, pode-se obter um cojuto ovo de observações por reamostragem dos dados. Se se assumr que os dados da amostra são represetatvos da população em questão, etão tomado amostras (com reposção, o que sgfca que algumas amostras vão aparecer mas do que uma vez e algumas ehuma vez) estas devem reproduzr a varabldade troduzda pela amostragem da população como um todo. Forma-se uma combação lear dos dados bootstrapped usado o vector a do cojuto de dados cal. Pode-se etão comparar a varâca desta combação com a varâca da prmera compoete da amostra bootstrapped. Se a comparação for próxma por exemplo, se o ráco for próxmo de coclu-se que a varação é comum à população em estudo. Se o ráco for pequeo, etão coclu-se que ão se pode geeralzar a descoberta para fora da amostra REPRESETAÇÕES GRÁFICAS A represetação gráfca de resultados tem como prcpal objectvo a vsualzação de característcas da varável em estudo a amostra, ou seja de estatístcas amostras, de forma smples e de fácl aqusção metal. Se bem que a represetação gráfca seja um auxlar poderoso para a lustração das varáves a amostra em estudo (desde que elaborados correctamete), a sua terpretação exacta é dfcultada pela ecessdade de terpolação de valores para os exos (e por sso sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 97

97 sujeto a erros de medção), daí que, para aálses mas cudadas, tora-se ecessáro a apresetação das estatístcas calculadas a partr da amostra. o etato, ão há ferrameta estatístca que seja tão poderosa como um gráfco bem escolhdo. Os gráfcos têm mutas vatages em relação às apresetações tabulares de dados umércos por crarem teresse e atraírem a ateção das pessoas. A aálse gráfca é um meo para descobrr o esperado. A represetação gráfca é decsva para a aálse de dados. É a lha da frete de ataque, revelado estruturas trcadas os dados que ão podem ser absorvdas de qualquer outra forma. Os strumetos e téccas de represetação de dados ajudam a crar mages de duas ou três dmesões de dados que podem assm ser terpretados mas faclmete de modo a se gahar cohecmeto e compreesão sobre eles. Com a represetação dos dados, podese detfcar e compreeder a formação que teressa e os padrões o cojuto de dados ajudado assm a tomada de decsão e a prevsão de ovas oportudades de egóco. Os padrões observados a prospecção e descoberta de formação podem até ão elucdar muto o feómeo sob vestgação; cotudo, descobrr aomalas e defcêcas os dados pode ser realmete valoso. A represetação gráfca é uma chave para a descobrr ovos padrões e tedêcas e para comucar estas descobertas a quem rá tomar as decsões. As represetações gráfcas de dados evam mesages poderosas às pessoas. O uso de mages tem um mpacto muto mas vívdo dos que um cojuto de úmeros, tal como dz o dtado, uma magem vale mas do que ml palavras. Quado se escolhe a represetação gráfca adequada para o cojuto de dados devese ter em cosderação a legbldade do tpo de gráfco escolhdo e o públco-alvo. ão há um úco método de represetação de dados multvarados que seja uma solução uversal. Algus são melhores para mostrar clusters ou outlers, equato outros podem mostrar dos ou três tpos de correlação. Algus suportam cojutos de dados maores equato que outros são melhores para cojutos mas pequeos. Isto mplca que os pacotes de aálse estatístca coteham um arseal de dferetes tpos de represetações. O prmero passo para escolher a represetação adequada é descobrr quas as que estão em codções de respoder à questão, e o segudo passo é determar que represetação específca se aplca melhor à stuação em partcular. Há mutas téccas que 98 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

98 fazem a mesma fução usado dferetes processos e cada uma tem os seus potos fortes e fracos. A escolha depede do que está sob vestgação e de como os resultados serão usados. A melhor represetação deve respoder postvamete às segutes questões: Os resultados têm boa exactdão? Os resultados são terpretáves; os especalstas da área, os aalstas de dados e os decsores podem etedê-los? A represetação forece resultados rapdamete? É fácl mplemetar os resultados uma stuação real? A represetação suporta os dados que estão dspoíves para explorar? De seguda aborda-se muto suctamete as represetações gráfcas mas comus. Estas represetações ecotram-se dspoíves a maora dos packages estatístcos. Hstogramas: Gráfcos utlzados para determadas fuções estatístcas específcas; permtem categorzar uma varável quattatva e obter um gráfco de coluas com o aspecto da dstrbução da varável, ou seja, é uma represetação gráfca de uma úca varável que represeta a frequêca das ocorrêcas (valores dos dados) detro de categoras dos dados; permtem descobrr desequlíbros os dados Gráfcos de Pareto: São semelhates aos hstogramas mas utlzam varáves omas as abcssas que são ordeadas segudo o valor das frequêcas; ormalmete cotém um gráfco de lhas combado apresetado o polígoo de frequêcas cumulatvas. Gráfcos de caule e folhas: São uma varate do hstograma; apreseta a mesma magem que o hstograma mas também provê uma eumeração dos reas valores dos dados. Gráfcos de dspersão: Represetam pelo meos uma varável quattatva as ordeadas e outra as abcssas. São útes para lustrar a relação casuístca ou de mera assocação. Permtem descobrr clusters, outlers, tedêcas e correlações. Podem-se adcoar lhas de regressão de y em x para dcar se exste uma relação ão lear e detfcar possíves outlers. Matrz de gráfcos de dspersão: Para um cojuto de dados multvarados com mas do que duas varáves. É útl para examar relações etre todos os pares de varáves. Cosste uma grelha quadrada smétrca de gráfcos de dspersão bvarados. Pode-se torar demasado cofuso se o úmero de varáves for elevado. 99 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

99 Gráfcos de barras e de coluas: Permtem comparações etre grupos. Utlzados para costrur hstogramas, pctogramas e prâmdes etáras. Gráfcos de lhas e de potos: São útes para aalsar, procurar e mostrar tedêcas temporas e padrões de séres croológcas. Gráfcos de cotrolo: Gráfco de lhas com lmtes de cotrolo; permtem verfcar rapdamete se uma varável crítca para um processo se ecotra detro de determados parâmetros de seguraça ou qualdade. Gráfco de áreas: Represetam váras varáves quattatvas justapostas. Gráfco de superfíce: Represetam varáves quattatvas em três exos; são muto utlzados para costrur cartogramas. Gráfco de bolhas: Semelhate ao gráfco de dspersão mas utlza mas uma varável cotíua para a dmesão da bolha. Gráfcos crculares e em ael: Permtem resumr um cojuto de varáves; vsualzar fracções sobre um total; represetar a formação em termos percetuas de varáves omas. Gráfcos de radar ou tea: Permtem utlzar um úmero elevado de varáves cotíuas assocado um exo radal a cada uma; permtem ver smetra ou uformdade de dmesões de dados cotíuos, pos pode-se ver quato os dados flutuam observado se a espral é suave ou tem pcos. São útes para procurar e avalar tedêcas sazoas ou outras tedêcas o cojuto de dados como um todo. Gráfcos de extremos e quarts: Permtem resumr um cojuto de estatístca relatvo a váras varáves quattatvas ou ordas ou uma varável cruzada com outra ão quattatva. Barras de erro: São semelhates ao gráfco de extremos e quarts mas utlzam estatístcas como médas e desvos padrão em vez da medaa e dstâca terquatílca. São útes para eteder formação da estatístca descrtva e para aalsar meddas de tedêca cetral (tas como medaa, e moda) ou também varâca. As represetações dcadas a segur são bastate recetes e ovadoras. Exemplos destas represetações podem ser ecotrados, por exemplo em ADERSO (998) e DAVIDSO (00). Glyph s: A posção do rao detfca a varável que represeta e o seu comprmeto dca a categora da varável que fo atrbuída ao dvíduo. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 00

100 Estrelas: Semelhates aos glyph s, mas os raos são marcados a partr do cetro do círculo e as suas extremdades uem-se de modo a formar polígoos. Faces de Cheroff: Cada dvíduo é represetado por uma face e dferetes valores da varável produzem dferetes tamahos ou formas das característcas da face. Perfs: Um perfl pode represetar cada dvíduo ou um grupo de dvíduos (perfs de médas) ou ada cada varável (udo-se tatos potos quatos os dvíduos). Mapas: Permtem explorar relações geográfcas o cojuto de dados. Árvores: Permtem explorar relações etre íves herárqucos. A fgura segute apreseta uma sítese dos dversos tpos de gráfcos aqu apresetados classfcados segudo o tpo e úmero de varáves que represetam. Tpologa de gráfcos Varáves quattatvas Varáves qualtatvas Varáves quattatvas e qualtatvas var. var. > var. var. v. quat. / v. qualt. ordal Hstograma Pareto Caule e folhas Extremos e quarts Barras de erro Dspersão Bolhas Superfíce Radar Crcular Ael Lhas Potos Áreas Cotrolo v. quat./ v. qualt. Barras Coluas Extremos e quarts Barras de erro Outros Mapas Grafos Estrelas Perfs Faces de Cheroff Esta é uma área em fraco desevolvmeto, esperado-se: cada vez mas tpos de represetações; a mudaça de represetações estátcas para dâmcas e teractvas e, a capacdade de represetar cada vez mas dados e cada vez mas complexos. 8- ETAPA 6: PRODUÇÃO DO RELATÓRIO Uma vez aalsados os dados, é ecessáro apresetar os resultados. Deve-se etão resumr os resultados da aálse dos dados de modo a que os decsores os compreedam e os usem como base de acção. É mportate que a forma de apresetação realce a formação mportate. Os relatóros devem ser claros, fáces de eteder, stétcos, bem orgazados e correctos. 0 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

101 Ao produzr o relatóro é sempre ecessáro ter em ateção para quem é que o relatóro se drge. Geralmete, o relatóro drge-se ao decsor, que por orma será uma pessoa bastate ocupada e sem grade teresse pelos pormeores téccos da vestgação, mas sm pelos resultados prátcos. Assm, é comum a utlzação de um sumáro executvo escrto em lguagem smples e ão técca mas com os prcpas resultados detfcados o estudo e mesmo sugestões de acções ou decsões a tomar. o etato, este sumáro deve ser sempre acompahado de um relatóro técco completo, forecedo ao letor dos íves de formação que deverá utlzar em fução das ecessdades e do seu grau de cohecmeto das téccas utlzadas. 9- ETAPA 7: DIVULGAÇÃO DOS RESULTADOS Ao se dvulgar os resultados, coloca-se o relatóro as mãos de pessoas que os utlzarão para marcar a dfereça e aumetar o retoro do vestmeto feto. O objectvo do processo de quérto é assegurar melhores decsões. ão se devem realzar quértos se ão se va produzr resultados ou actuar com base eles. Um software de apresetação dos resultados deve permtr que quem os recebe possa teragr com os quadros e os gráfcos produzdos; deve permtr que cada receptor do relatóro teha a possbldade de vsualzar os resultados pelo âgulo que preteder. Ou seja, cada decsor pode crar uma vsão partcular dos resultados para melhor fudametar a sua decsão. O grau de teracção com os resultados depederá do tpo de audêca (decsores, empregados, cletes, ). sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 0

102 0- COCLUSÃO Como coclusão apreseta-se este capítulo um resumo de cada uma das etapas de uma pesqusa por quérto dscutdas os capítulos aterores. Em relação à etapa (Plaeameto e deseho do quérto) os passos a segur deverão ser: defr objectvos e hpóteses a testar; determar o orçameto, caledáro e recursos; defr a população; determar objectvamete a dmesão aproprada da amostra e a técca amostral a utlzar; escolher o método de recolha de dados; elaborar o questoáro de forma adequada e, testar o questoáro. a etapa (Recolha dos dados) é ecessáro, se possível, elmar a etrada maual dos dados escolhedo métodos automátcos; tetar obter dados ão evesados; tetar maxmzar a taxa de resposta e, evtar que o processo de recolha de dados leve demasado tempo. a etapa 3 (Acesso a dados) deve-se ter em ateção os segutes aspectos: evtar a dupla etrada de dados utlzado software de recolha e de aálse compatível e, utlzar as defções dos dados fetas o deseho do questoáro o caso de se utlzar métodos automátcos de recolha de dados. Em relação à preparação e gestão dos dados (Etapa 4), os aspectos fudametas são: a obteção de dados lmpos para aálse utlzado regras de valdação a costrução do questoáro; a detecção e correcção de possíves erros e, se ecessáro a cração de ovos dados a partr dos orgas através de operações de trasformação para executar determadas aálses. A fase de preparação dos dados é fudametal, pos o prcpal objectvo de uma vestgação por quérto é o apoo à decsão e, segudo JURA (998) as decsões uca podem ser melhores do que os dados em que se baseam. a quta etapa (Aálse dos dados) os objectvos são: produzr estatístcas descrtvas para obter uma fotografa dos dados; retrar o máxmo possível de cohecmeto dos dados e, costrur modelos de suporte à decsão. É ecessáro saber escolher, de etre os mutos métodos exstetes, o método de aálse de dados mas adequado a cada stuação. Algumas cosderações a ter em cota para escolher a técca estatístca adequada são: cosderar cudadosamete a hpótese geral (decdr etre uma aálse de dfereças etre amostras ou uma aálse de relação etre varáves); cosderar a atureza das varáves; cosderar a escala de medda da varável depedete (decdr etre téccas 03 sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006

103 paramétrcas e ão-paramétrcas; se a técca for uma técca para aalsar a relação etre varáves é precso cosderar a escala de medda de todas as varáves a aálse); examar os dados, ou seja, verfcar se os dados recolhdos cumprem os pressupostos da técca estatístca que se quer aplcar (caso ão verfquem os pressupostos há duas alteratvas: abadoar a técca escolhda e escolher uma outra para a qual os dados cumpram os pressupostos; trasformar os dados de forma a cumprrem os pressupostos da técca escolhda). a etapa 6 (Produção do relatóro) é ecessáro persoalzar os quadros e gráfcos para melhor evdecar os resultados e, produzr um relatóro smples e de fácl terpretação. a sétma e últma etapa, referete à dvulgação dos resultados, deve-se ter em ateção os segutes aspectos: dstrbur os resultados rapdamete; permtr aos decsores a teracção com os quadros de resultados e, cotrolar a seguraça de acesso e a cofdecaldade determado o que cada pessoa pode ver e até ode. Uma vestgação por quérto, para ser efcaz, ecessta que todas as etapas sejam bem executadas. Uma falha em qualquer uma das etapas, (seja a elaboração do questoáro, a preparação dos dados, a aálse dos resultados, ) pode pôr em causa a valdade de toda a vestgação. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 04

104 BIBLIOGRAFIA AMARAL, I., FERREIRA, M.A. (00). Probabldades e Estatístca Formuláro, 5ª Edção. Lsboa: Edções Sílabo. ADERSO, R.E., BLACK, W.C., HAIR, J.F.Jr., TATHAM, R.L. (998). Multvarate Data Aalyss. ew Jersey, USA: Pretce Hall. ADRADE, R., CALAPEZ, T., MELO, P., REIS, E. (997). Estatístca Aplcada. Lsboa: Edções Sílabo. BACELAR, S. M. (999). Amostragem as Cêcas Socas Relatóro de aula teórco-prátca. Porto, Portugal: Faculdade de Ecooma, Uversdade do Porto. BIR, R. J., HARRIS P., WOLF A. (000). The Iteratoal Hadbook of Market research Techques (pp ), ª Edção. Lodres: Koga Page. BRILHATE, F. (00). Apotametos da Dscpla de Probabldades e Estatístca I. Pota Delgada: Departameto de Matemátca da Uversdade dos Açores. BRILHATE, F. (004). Apotametos da Dscpla de Modelos Estatístcos I. Pota Delgada: Departameto de Matemátca da Uversdade dos Açores. CABRAL, J.A.S., GUIMARÃES, R.C. (997). Estatístca. Lsboa: McGraw Hll. CARDOSO, M. M. (000). Segmetação: Uma Aplcação o Tursmo. Lsboa: IST. CARROLL, J.D., GREE, P.E., LATTI, J. (003). Aalysg Multvarate Data. Pacfc Grove, USA: Duxbury. COELHO, P.S., VILARES, M.J. (005). A Satsfação e Lealdade do Clete Metodologas de avalação, gestão e aálse. Lsboa: Escolar Edtora. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 05

105 DAVIDSO, I., SOUKUP, T. (00). Vsual Data Mg: Techques ad tools for data vsualzato ad mg. Davers, USA: Joh Wley & Sos. DU, G., EVERITT, B.S. (00). Appled Multvarate Data Aalyss. Lodo, UK: Edward Arold. EVERITT, B.S., LADAU, S., LEESE, M. (00). Cluster Aalyss. Lodo, UK: Edward Arold. FERRÃO, F., REIS, E., VICETE, P. (00). Sodages A amostragem como factor decsvo de qualdade, ª Edção. Lsboa: Edções Sílabo. FIDELL, L.S., TABACHICK, B.G. (00). Usg Multvarate Statstc. Bosto, USA: Ally&Baco. GOODE, W., HATT, P. (979). Métodos em Pesqusa Socal (pp. 7-35), 7ª Edção. São Paulo, Brasl: Compaha Edtora acoal. HAD, D., MAILA, H., SMYTH, P. (s/d). Prcples of Data Mg. Lodo, UK: MIT Press. HILL, A., HILL M. M. (000). Ivestgação por Questoáro. Lsboa: Edções Sílabo. HOLLOWAY, J. C. (004). Marketg for Toursm (pp ), 4ª Edção. Iglaterra: Pearso Educato. JOHSO, R.A., WICHER, D.W. (00). Appled Multvarate Statstcal Aalyss. Upper Saddle Rver, USA: Pretce Hall. JURA, M.J., GODFREF, A.B. (998). Jura s Qualty Hadbook. ew York, USA: McGraw Hll. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 06

106 KACKIGA, S. (99). Multvarate Statstcal Aalyss, ª Edção. ew York, USA: Radus Press. LARSO, H. J. (98). Itroducto to Probablty Theory ad Statstcal Iferece. ew York, USA: Joh Wley & Sos. LEBART, L., MORIEAU, A., PIRO, M. (995). Statstque Exploratore Mutmesoelle. Pars, Fraça: Duod. LEHTOEM, R., PAHKIEM, E. (004). Practcal Methods for Desg ad Aalyss of Complex Surveys. Iglaterra: Joh Wleyd Sos Ltd. LEVY, P.S., LEMESHOW, S. (999). Samplg of Populatos: methods ad applcatos. ew York, USA: Joh Wley & Sos. MAROCO, J. (003). Aálse Estatístca com utlzação do SPSS. Lsboa: Edções Sílabo. MELLO, F. G. (993). Probabldades e Estatístcas: Cocetos e Métodos Fudametas, Volume II. Lsboa: Escolar Edtora. MURTEIRA, B. J. F. (990). Probabldades e Estatístca, Volume II. Lsboa: McGraw-Hll. PIDYCK, R.S., RUBIFELD, D.L. (99). Ecoometrc Models ad Ecoomc Forecasts, 3ª Edção. ew York, USA: McGraw-Hll. PITO, J.M., SILVA, A. S. (986). Metodologa das Cêcas Socas (pp ), 8ªedção. Porto, Portugal: Edções Afrotameto. REIS, E. (00). Estatístca Multvarada Aplcada. Lsboa: Edções Sílabo. sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 07

107 ROCHA, J. C. (990). Tabelas de Cotgêca. Pota Delgada: Departameto de Matemátca da Uversdade dos Açores. RODRÍGUEZ, P. G., BURGUETE, J. L. V., ESTEBA, R. A., VALIÑO, P. C. (004). Estrategas de gestó medoambetal: Barreras y beefcos e el tursmo rural de Castlla y Leó Em: (Eds.) Gerr a Compettvdade Regoal um Mudo Globalzado, Joradas Luso-Espaholas de Gestão Cetífca, 4ª ed., Uv. dos Açores. O Como e o Porquê da Pesqusa por Iquérto. DEPARTAMETO DE MATEMÁTICA Secção de Estatístca e Ivestgação Operacoal sa Ávla do Couto Alves Cabral Cabral, sa A.C.A. (006) Ivestgação por Iquérto Moografas da SEIO. Depto. Matemátca da Uv. dos Açores: Pota Delgada, (ID ) O trabalho apresetado é da exclusva resposabldade da alua que o assa. O Departameto de Matemátca e a Uversdade dos Açores ão se resposablzam por evetuas erros exstetes o mesmo. Os textos podem ser descarregados lvremete, mpressos e utlzados para eso ou estudo dos temas a que se referem. o etato, ão podem ser copados ou cluídos outros trabalhos académcos ou de qualquer outra atureza, sem o cosetmeto do autor e a devda referêca completa. Para autorzação de cópa parcal ou tegral, utlze o edereço de correo electróco: seo@otes.uac.pt sa Ávla do Couto Alves Cabral Lcecatura em Matemátca Aplcada, U.A., Ao Lectvo 005/006 08

Teoria da Amostragem

Teoria da Amostragem Teora da Amostragem I- oções fudametas sobre amostragem. Amostragem é todo o processo de recolha de uma parte, geralmete pequea, dos elemetos que costtuem um dado couto. Da aálse dessa parte pretede obter-se

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental. É o grau de assocação etre duas ou mas varáves. Pode ser: Prof. Lorí Val, Dr. val@pucrs.br http://www.pucrs.br/famat/val www.pucrs.br/famat/val/ correlacoal ou expermetal. Numa relação expermetal os valores

Leia mais

é por meio dele que se conhece se os produtos estão dentro dos padrões exigidos

é por meio dele que se conhece se os produtos estão dentro dos padrões exigidos INTRODUÇÃO O controle de qualdade nas empresas se faz muto mportante, pos é por meo dele que se conhece se os produtos estão dentro dos padrões exgdos pelo mercado ou não, e com a abertura e a globalzação

Leia mais

AVALIAÇÃO DO VALOR DE IMÓVEIS POR ANALISE DE REGRESSÃO: UM ESTUDO DE CASO PARA A CIDADE DE JUIZ DE FORA. Túlio Alves Matta

AVALIAÇÃO DO VALOR DE IMÓVEIS POR ANALISE DE REGRESSÃO: UM ESTUDO DE CASO PARA A CIDADE DE JUIZ DE FORA. Túlio Alves Matta AVALIAÇÃO DO VALOR DE IMÓVEIS POR ANALISE DE REGRESSÃO: UM ESTUDO DE CASO PARA A CIDADE DE JUIZ DE FORA Túlo Alves Matta MONOGRAFIA SUBMETIDA À COORDENAÇÃO DE CURSO DE ENGENHARIA DE PRODUÇÃO DA UNIVERSIDADE

Leia mais

CAPÍTULO 8 - Noções de técnicas de amostragem

CAPÍTULO 8 - Noções de técnicas de amostragem INF 6 Estatística I JIRibeiro Júior CAPÍTULO 8 - Noções de técicas de amostragem Itrodução A Estatística costitui-se uma excelete ferrameta quado existem problemas de variabilidade a produção É uma ciêcia

Leia mais

Gráfico de controle de regressão aplicado na monitoração de processos

Gráfico de controle de regressão aplicado na monitoração de processos Jacob, Souza & Perera Gráfco de controle de regressão aplcado na montoração de processos LUCIANE FLORES JACOBI, MSC. Professora do Departamento de Estatístca UFSM. E-mal: lfjacob@ccne.ufsm.br ADRIANO MENDONÇA

Leia mais

MÉTODOS ESTATÍSTICOS E DELINEAMENTO EXPERIMENTAL TESTES NÃO PARAMÉTRICOS. Armando Mateus Ferreira

MÉTODOS ESTATÍSTICOS E DELINEAMENTO EXPERIMENTAL TESTES NÃO PARAMÉTRICOS. Armando Mateus Ferreira MÉTODOS ESTATÍSTICOS E DELIEAMETO EXPERIMETAL TESTES ÃO PARAMÉTRICOS Armando Mateus Ferrera Índce Introdução... Testes de Aleatoredade... 3. Teste das sequêncas (runs)... 3 3 Testes de localzação... 7

Leia mais

Faculdade de Ciências da Universidade de Lisboa Departamento de Matemática A Colocação por mínimos quadrados e a sua aplicação à Geodesia Física

Faculdade de Ciências da Universidade de Lisboa Departamento de Matemática A Colocação por mínimos quadrados e a sua aplicação à Geodesia Física Faculdade de Ciêcias da Uiversidade de Lisboa Departameto de Matemática A Colocação por míimos quadrados e a sua aplicação à Geodesia Física João Catalão Lisboa, Colocação por míimos quadrados Ídice. Itrodução....

Leia mais

Amostragem por Grupos

Amostragem por Grupos Aostrage or Gruos a aostrage or gruos as udades estatístcas são agruadas, de acordo co algu crtéro. É abtual desgar cada gruo de eleetos dsjutos or udade rára, sedo os eleetos ue coõe cada udade rára desgados

Leia mais

Manual sobre o Valor do Dinheiro no Tempo

Manual sobre o Valor do Dinheiro no Tempo Maual sobre o Valor do Diheiro o Tempo...Dai de graça o que de graça recebeste... A oção de que um dólar hoje é preferível a um dólar em algum mometo o futuro é bastate ituitiva para a maioria das pessoas

Leia mais

SATURAÇÃO EM PESQUISA QUALITATIVA: ESTIMATIVA EMPÍRICA DE DIMENSIONAMENTO

SATURAÇÃO EM PESQUISA QUALITATIVA: ESTIMATIVA EMPÍRICA DE DIMENSIONAMENTO Af-Revista Completa cores:layout // : PM Page HERMANO ROBERTO THIRY-CHERQUES SATURAÇÃO EM PESQUISA QUALITATIVA: ESTIMATIVA EMPÍRICA DE DIMENSIONAMENTO SATURATION IN QUALITATIVE RESEARCH: EMPIRICAL SIZING

Leia mais

AS RELAÇÕES COMERCIAIS DO BRASIL COM OS DEMAIS BRICs

AS RELAÇÕES COMERCIAIS DO BRASIL COM OS DEMAIS BRICs LC/BRS/R.221 Feverero de 2010 Orgnal: português CEPAL COMISSÃO ECONÔMICA PARA A AMÉRICA LATINA E O CARIBE Escrtóro no Brasl AS RELAÇÕES COMERCIAIS DO BRASIL COM OS DEMAIS BRICs Documento elaborado no âmbto

Leia mais

Análise de circuitos: um enfoque de sistemas segunda edição ISBN 978-85-87978-17-2. Copyright 2010 Karl Heinz Kienitz Todos os direitos reservados.

Análise de circuitos: um enfoque de sistemas segunda edição ISBN 978-85-87978-17-2. Copyright 2010 Karl Heinz Kienitz Todos os direitos reservados. Análse de crcutos: um enfoque de sstemas segunda edção ISBN 97885879787 Copyrght Karl Henz Kentz Todos os dretos reserados. Capa: Yuka Osako Análse de crcutos: um enfoque de sstemas segunda edção, por

Leia mais

Cap. 3. A errar também se aprende

Cap. 3. A errar também se aprende Cap. 3. A errar também se aprende O erro cometido pelo aluno constitui um fenómeno familiar ao professor. Está presente no quotidiano da sala de aula e surge através de produções orais ou escritas dos

Leia mais

Como Elaborar um Plano de Negócios: O SEU GUIA PARA UM PROJECTO DE SUCESSO

Como Elaborar um Plano de Negócios: O SEU GUIA PARA UM PROJECTO DE SUCESSO Como Elaborar um Plano de Negócios: O SEU GUIA PARA UM PROJECTO DE SUCESSO Como Elaborar um Plano de Negócios Ao pensar em procurar um parceiro de Capital de Risco, um empreendedor necessita de estruturar

Leia mais

EQUILÍBRIO DE COMPLEXAÇÃO

EQUILÍBRIO DE COMPLEXAÇÃO EQUILÍBRIO DE COMPLEXAÇÃO De acordo com a Teoria de Lewis, ácidos são espécies receptoras de pares de elétros e bases são espécies doadoras de pares de elétros. De acordo com as reações e abaixo, ota-se

Leia mais

SECRETARIA DE ESTADO DO MEIO AMBIENTE DEPARTAMENTO DE PROJETOS DA PAISAGEM PROJETO DE RECUPERAÇÃO DE MATAS CILIARES

SECRETARIA DE ESTADO DO MEIO AMBIENTE DEPARTAMENTO DE PROJETOS DA PAISAGEM PROJETO DE RECUPERAÇÃO DE MATAS CILIARES SECRETARIA DE ESTADO DO MEIO AMBIENTE DEPARTAMENTO DE PROJETOS DA PAISAGEM PROJETO DE RECUPERAÇÃO DE MATAS CILIARES Currso:: Gesttão de Prrojjettos APOSTIILA maio, 2006 Introdução Conseguir terminar o

Leia mais

mgh = 1 2 mv2 + 1 2 Iω2 (1)

mgh = 1 2 mv2 + 1 2 Iω2 (1) a Supoha que um ioiô parte do repouso e desce até uma altura (deslocameto vertical) h, medida desde o poto de ode o ioiô foi solto. Ecotrar a sua velocidade fial de traslação e rotação, e sua aceleração

Leia mais

MANUAL DE NORMATIZAÇÃO DE TRABALHOS ACADÊMICOS DA FAMESC

MANUAL DE NORMATIZAÇÃO DE TRABALHOS ACADÊMICOS DA FAMESC 1 MANUAL DE NORMATIZAÇÃO DE TRABALHOS ACADÊMICOS DA FAMESC Quissamã RJ 2012 2 FACULDADE METROPOLITANA SÃO CARLOS MANUAL DE NORMATIZAÇÃO DE TRABALHOS ACADÊMICOS DA FAMESC Manual para utilização dos trabalhos

Leia mais

ELABORAÇÃO DE UM PROJETO DE PESQUISA

ELABORAÇÃO DE UM PROJETO DE PESQUISA ELABORAÇÃO DE UM PROJETO DE PESQUISA INTRODUÇÃO: A elaboração de trabalhos acadêmicos é uma habilidade pontual na formação de qualquer profissional que empreende pesquisas e constrói conhecimentos no decorrer

Leia mais

OFICINA ESTATÍSTICA PARA TODOS

OFICINA ESTATÍSTICA PARA TODOS OFICINA ESTATÍSTICA PARA TODOS Lisbeth K. Cordani lisbeth@maua.br 1 Apresentação Aproveitamos este espaço que a ABE está criando para colocar um material que temos usado com professores de ensino básico

Leia mais

METODOLOGIA CIENTÍFICA: um manual para a realização de pesquisas em administração

METODOLOGIA CIENTÍFICA: um manual para a realização de pesquisas em administração UNIVERSIDADE FEDERAL DE GOIÁS CAMPUS CATALÃO CURSO DE ADMINISTRAÇÃO METODOLOGIA CIENTÍFICA: um manual para a realização de pesquisas em administração Prof. Maxwell Ferreira de Oliveira CATALÃO-GO 2011

Leia mais

Directrizes para a Elaboração de Relatórios de Sustentabilidade 2000-2006 GRI. Version 3.0

Directrizes para a Elaboração de Relatórios de Sustentabilidade 2000-2006 GRI. Version 3.0 G Directrizes para a Elaboração de elatórios de Sustentabilidade 2000-2006 GI Version 3.0 DES G3: Directrizes para a Elaboração de elatórios de Sustentabilidade Índice Prefácio O Desenvolvimento Sustentável

Leia mais

Capítulo 1: a gestão e a sua evolução!

Capítulo 1: a gestão e a sua evolução! Capítulo 1: a gestão e a sua evolução Introdução à gestão Contabilidade e administração Conceito de gestão: é o processo de se conseguir obter resultados (bens ou serviços) com o esforço de outros. Pressupõem

Leia mais

COMO ESCREVER UM ENSAIO FILOSÓFICO 1. Artur Polónio CENTRO PARA O ENSINO DA FILOSOFIA SOCIEDADE PORTUGUESA DE FILOSOFIA

COMO ESCREVER UM ENSAIO FILOSÓFICO 1. Artur Polónio CENTRO PARA O ENSINO DA FILOSOFIA SOCIEDADE PORTUGUESA DE FILOSOFIA 1 Artur Polónio Índice 1. O que é um ensaio filosófico? 2. O que se espera que um estudante mostre ao escrever um ensaio? 3. Como escolher o título do ensaio? 4. Como se prepara um ensaio? 5. Como se deve

Leia mais

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO MARANHÃO. DEPARTAMENTO DE CIÊNCIAS HUMANAS E SOCIAIS

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO MARANHÃO. DEPARTAMENTO DE CIÊNCIAS HUMANAS E SOCIAIS 1 INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO MARANHÃO. DEPARTAMENTO DE CIÊNCIAS HUMANAS E SOCIAIS CURSOS DE ENGENHARIA INDUSTRIAL ELÉTRICA E MECANICA ADMINISTRAÇÃO GESTÃO DA QUALIDADE Carlos

Leia mais

Capítulo 10: Monitorização e Avaliação (M&A) GUIA

Capítulo 10: Monitorização e Avaliação (M&A) GUIA Capítulo 10: Monitorização e Avaliação (M&A) GUIA Foto de capa: Susan Thubi, oficial de saúde na clínica de Nazareth Holy Family em Limuru, no Quénia, verifica o registo dos pacientes que visitaram o centro

Leia mais

DIRECTRIZES DA IFLA/UNESCO PARA BIBLIOTECAS ESCOLARES

DIRECTRIZES DA IFLA/UNESCO PARA BIBLIOTECAS ESCOLARES DIRECTRIZES DA IFLA/UNESCO PARA BIBLIOTECAS ESCOLARES Título original: The IFLA/Unesco School Libraries Guidelines http://www.ifla.org/vii/s11/pubs/school-guidelines.htm Tradução em Língua Portuguesa (Portugal)

Leia mais

[4] 2) Discuta o artigo desta semana de forma detalhada o suficiente para que o leitor de seu resumo tenha um bom entendimento do artigo.

[4] 2) Discuta o artigo desta semana de forma detalhada o suficiente para que o leitor de seu resumo tenha um bom entendimento do artigo. [1,0] 1) Discuta diferentes estratégias para a seleção do melhor modelo de regressão linear múltipla. Dentre as estratégias para a seleção de modelos é recomendado seguir os seguintes passos: especificar

Leia mais

A Descoberta da Escrita

A Descoberta da Escrita A Descoberta da Escrita Textos de Apoio para Educadores de Infância Lourdes Mata A Descoberta da Escrita Textos de Apoio para Educadores de Infância Lourdes Mata Direcção-Geral de Inovação e de Desenvolvimento

Leia mais