Uma proposta para análise de dados com correlação espacial e temporal

Tamanho: px
Começar a partir da página:

Download "Uma proposta para análise de dados com correlação espacial e temporal"

Transcrição

1 Unversdade Federal de São Carlos Centro de Cêncas Eatas e de Tecnologa Programa de Pós-Gradação em Estatístca Uma proposta para análse de dados com correlação espacal e temporal Fláva Mara de Toledo Pedroso Orentadora: Mara Cecíla Mendes Barreto Co-Orentadora: Mara Sílva de Asss Mora Dssertação apresentada ao Departamento de Pós-Gradação em Estatístca da Unversdade Federal de São Carlos - UFSCar, como parte dos reqstos para obtenção do títlo de Mestre em Estatístca. UFSCar - São Carlos Novembro/7

2 Fcha catalográfca elaborada pelo DePT da Bbloteca Comntára da UFSCar P37pa Pedroso, Fláva Mara de Toledo. Uma proposta para análse de dados com correlação espacal e temporal / Fláva Mara de Toledo Pedroso. -- São Carlos : UFSCar, 7. 8 f. Dssertação (Mestrado) -- Unversdade Federal de São Carlos, 7.. Correlação.. Modelos lneares generalzados. 3. Eqações de estmação generalzadas. 4. Geoestatístca. 5. Stepwse. 6. R (Lngagem de programação de comptador). I. Títlo. CDD: ( a )

3 Dedcatóra Aos mes pas, Moacyr Pedroso (n memoram) e Vera Lúca de Toledo Pedroso, aos mes rmãos, Gstavo José de Toledo Pedroso Leandro José de Toledo Pedroso aos mes avós, Cassano Perera P. de Toledo (n memoram) e Hermína C. de Toledo (n memoram), Mara de Olvera Pedroso (n memoram) à Nna Fontes de verdadero amor, carnho, ncentvo, dedcação e eemplos de vda. Estímlos em mnha vda.

4 Agradecmentos Às qerdas professoras Mara Cecíla Mendes Barreto e Mara Sílva de Asss Mora pela orentação, amzade, confança e ncentvo qe tão generosamente me ofereceram ao longo dos estdos. Ao professor Francsco Charavallot Neto qe não apenas fornece os dados tlzados neste trabalho, como anda mportantes nformações e esclarecmentos sobre as característcas do Aedes Aegypt. Aos professores Lael Almeda de Olvera e Palo Mlton Barbosa Landm pelas sgestões e pelo apoo. Aos professores do DEs, em especal Vera Lúca Damasceno Tomazzela, Jorge Achar e José Galvão Lete, pelos ensnamentos qe deles receb. Aos qerdos amgos do mestrado: Adrano Kammra Szk, Danela Parrera, Camla Lma, Glacy Paroln, Domedes Pael, Olympo Teera Neto, Ls Ernesto Beno e Sabrna Caetano, pela convvênca, pela troca de conhecmentos, e pelo grande apoo e ncentvo nestes anos. À qerda fnconára do DEs Dona Lza Mara da Slva pelo carnho, apoo, amzade e dedcação a todos os alnos e professores do departamento, m eemplo de vda. Às qerdas tas Clede de Toledo Gomes, Mara Aparecda Pedroso Myahara, Mara Cecíla Pedroso, Mara José Pedroso Mayr, Amethsta Pedroso, Ana Grabrela Pedroso, Vera Pedroso Hll, Vera Brto Pedroso, Dora M. R. Pedroso e aos qerdos tos Alencar Pedroso e José Joaqm Pedroso pelo grande ncentvo e apoo. Aos prmos, em especal Sandra, Cassano, Annha e Étore, Márco e Vrgína, Gla, Rodrgo, Prscla, Fabana, Gabrelnha, Marozto, Tago, Rck, Gordon e Bárbara pela grande amzade, carnho, apoo e por se fazerem presentes nos momentos dfíces. À Vergína Hláro de Olvera e Rosana Aparecda de Olvera Madera pela amzade, carnho e dedcação ao longo da vda. Ao Palo Henrqe de Avelno Rodrges pela pacênca nas horas em qe estve dstante, pelo apoo, carnho e dedcação. À edcadora e grande amga Vâna Cerqera Lete pelo grande ncentvo e carnho.

5 Às amgas Iracy Chod Galvann, Danela Galvann, Glads F. A. Pangall, Sôna A. Borges Ignáco, Mere R. Barnese, Fabana Romano Bressan, Salete Lhamas, Renata Ventra e Iara Borges Leal pela amzade, carnho, apoo e por se fazerem presentes tanto nos momentos felzes como nos momentos dfíces. Aos amgos da Fndação Sdelma D. Lete de Soza, Danel Fernando Chrstann e Llam Nanc Carlos pela amzade, convvênca e apoo. Ao qerdo amgo Dmas Fernando B. de Olvera pelo grande apoo e ncentvo. Ao qerdo professor Dr. Hlton Aparecdo Garca pela carta de recomendação, pela confança e o grande apoo. À Dra. Clesa Camlo Atqe e ao Dr. Abdala Atqe pela amzade e o carnho dedcados a mm e mnha famíla. À professora Mara Hermína Marqes Lete pela amzade, ncentvo e confança dspensados tanto no níco da mnha carrera qanto no decorrer da mnha vda profssonal. Aos grandes amgos e professores da FATEC Rafael Garca M. Flho (n memoram), Sérgo Lkne e Arams M. C. de Mendonça. Aos qerdos professores qe me proporconaram crescmento pessoal e profssonal Ana Mara Cardoso Ventra, Ademr José Ventra, Mara Isabel Dáro Olbon, Dolores Pntor de Arrda, Mara Elza Mlan Sarks, Mara Aparecda Morjo, Sérgo Lz Bertoncello, Ismael Antono Slva, Szana Abrnhosa, Yvette Elza P. Grzzo, Mara de Lordes M. de Almeda Prado, Tereznha B. Bffo e Ta Arlete Ortgoza. À qerda professora Ana Helena Neber de Olvera pelo grande apoo. Ao professor Evandro Antono Bertolc pelo ncentvo, apoo e confança.

6 Resmo É mto comm, em dversas áreas, o estdo da ocorrênca de m fenômeno ao longo do tempo. Neste caso, se tlzarmos a teora de Modelos Lneares Generalzados para analsarmos o objeto de nteresse, teremos como conseqüênca nferêncas ncorretas dos parâmetros regressores e estmadores nefcentes, ma vez qe a prncpal característca desta teora é consderar as varáves aleatóras como sendo respostas ndependentes. Qando a varável resposta é observada ao longo do tempo, pode haver ma correlação entre as observações e sso deve ser levado em consderação na estmação dos parâmetros. Para ncorporarmos esta dependênca temporal podemos tlzar a teora das Eqações de Estmação Generalzadas, proposta por Lang & Zeger, 986, como ma etensão dos Modelos Lneares Generalzados para comptar a correlação estente entre as observações. Além da correlação temporal, pode haver, anda, ma correlação espacal e, neste caso, podemos tlzar a teora da Geoestatístca para estmarmos o alcance de correlação das amostras ao longo de ma regão de estdo, bem como para dentfcarmos se há ma dreção prvlegada de varabldade do fenômeno analsado, dados mportantes não revelados qando tlzamos as teoras da estatístca clássca. Nesta dssertação aplcamos as metodologas acma ctadas para tentar eplcar a presença e o comportamento de fêmeas Aedes (Stegomya) aegypt captradas por armadlhas adltcdas na cdade de Mrassol/SP, com o objetvo de colaborar na bsca de métodos mas precsos para contenção da dssemnação da denge.

7 Abstract In several research areas, the stdy of the occrrence of a phenomenon over a perod of tme s very common. In ths case, f we se the theory of Generalzed Lnear Models to analyze the sbject of nterest, we ll have, as a conseqence, ncorrect nferences concernng regresson parameters and neffcent estmators, snce consderng the random varables as ndependent responses, s the man characterstc of ths theory. When the varable response s observed over tme, there can be a correlaton between the observatons and that mst be taken nto consderaton on the estmaton of the parameters. To ncorporate ths temporal dependence, we can se the theory of Generalzed Estmatng Eqatons, proposed by Lang & Zeger, 986, as an etenson of the Generalzed Lnear Models, to compte the correlaton between the observatons. Besdes the temporal correlaton, there can even be a space correlaton and, n ths case, we can se the theory of Geostatstc to estmate the reach of the correlaton of samples over a stdy regon, as well as to dentfy whether there s a prvleged drecton of varablty of the stded phenomenon, mportant data not revealed when we tlze the theores of classc statstc. In ths dssertaton, we appled the methodologes mentoned above to try to eplan the presence and the behavor of the female Aedes (Stegomya) aegypt captred by adltced traps n the cty of Mrassol/SP, wth the goal of helpng on the search of more precse methods to contan the dssemnaton of denge.

8 Smáro - INTRODUÇÃO - REVISÃO DE LITERATURA 4. Modelos de Regressão 4.. Modelos Lneares Generalzados 4.. Eqações de Estmação Generalzadas 6..3 Seleção de Modelos..4 Geoestatístca MATERIAL E MÉTODOS 4 3. Materal 4 O Banco de Dados 4 3. Metodologa Aplcação dos Modelos Lneares Generalzados na modelagem do número de fêmeas Aedes aegypt captradas em armadlhas adltcdas, modelos: Mosqtrap_A MLG e Mosqtrap_A4 - MLG Aplcação das Eqações de Estmação Generalzadas na modelagem do número de fêmeas Aedes aegypt captradas em armadlhas adltcdas, modelo: Mosqtrap_A EEG Aplcação da Geoestatístca para dentfcar a estrtra de dependênca espacal do número de fêmeas Aedes aegypt captradas em armadlhas adltcdas Aplcação dos Modelos Lneares Generalzados na modelagem dos alcances de maor e menor espalhamento do número de fêmeas Aedes aegypt captradas em armadlhas adltcdas na área de amostragem A, modelos: Alcance_A MLG e Alcance_A - MLG 49 4 RESULTADOS E DISCUSSÃO 5 4. Resltados dos modelos elaborados para estdar a varável resposta Y, o número de fêmeas Aedes captradas em armadlhas adltcdas áreas A e A Ajste do modelo Mosqtrap_A - MLG Ajste do modelo Mosqtrap_A - EEG Ajste do modelo Mosqtrap_A4 - MLG Ajste dos modelos va abordagem de Geoestatístca 6 4. Resltados dos modelos elaborados para estdar as varáves respostas X e Z, os alcances de maor e menor espalhamento do número fêmeas Aedes captradas em armadlhas adltcdas área A Ajste do modelo Alcance_A - MLG Ajste do modelo Alcance_A - MLG Prncpas Conclsões 95 5 PROPOSTAS FUTURAS 6 - REFERÊNCIAS Apêndce A 3 Apêndce B 4 Apêndce C 6

9 - INTRODUÇÃO A década de 7 evdenco m grande avanço comptaconal qe favorece a tlzação de processos teratvos na estmação dos parâmetros em modelos qe apresentavam essa egênca, tornando possível, assm, o srgmento na lteratra de modelos de regressão mas elaborados. Segndo DEMÉTRIO (), em 97, Nelder & Wedderbrn propseram a teora de Modelos Lneares Generalzados - MLG, na qal, dentre otras característcas, destacamos qe a varável resposta tem ma dstrbção pertencente à famíla eponencal e a amostra é composta por observações ndependentes. Entretanto, esta sposção de ndependênca pode não ser verfcada em determnadas stações, como no caso de pesqsas qe envolvem o estdo de dados correlaconados, provenentes de meddas repetdas (dados longtdnas) o de agrpamentos. Esta correlação deve ser ncorporada por métodos aproprados de análse de dados. Se a pesqsa em estdo poss dados correlaconados e se eles forem tratados como ndependentes, teremos como conseqüênca: nferêncas ncorretas dos parâmetros da regressão devdo a erros padrões sbestmados; estmadores nefcentes, o seja, haverá m maor erro qadrátco médo nos estmadores dos parâmetros da regressão. Neste sentdo, conforme eplctado por JOHNSTON et al. (996), fo proposto o so das Eqações de Estmação Generalzadas - EEG - (Lang & Zeger, 986), m método de estmação dos parâmetros do modelo da regressão para acomodar a sposção de dados correlaconados. Em mtas stações, além de ma dependênca temporal, a varável de nteresse pode apresentar ma nterdependênca espacal. Com o objetvo de analsar a varação da varável resposta em relação às coordenadas de localzação da amostra e, anda, predzer o valor da varável dependente em locas não amostrados, Matheron em 963, como apresentado em LANDIM (3), formlo a teora de Geoestatístca qe, através de ma fnção chamada semvarograma, nos permte conhecer o comportamento desta varação no espaço a partr da estmatva do alcance de dependênca entre amostras vznhas e da dentfcação da dreção de maor espalhamento do fenômeno em estdo, podendo gerar m modelo com maor poder predtvo. Neste estdo apresentaremos ma análse estatístca e ses fndamentos teórcos de m conjnto de dados provenentes do projeto de pesqsa Estdo da relação entre ndcadores entomológcos para Aedes (Stegomya) aegypt obtdos de armadlhas adltcdas, de ovposção e de coleta de adltos, em área da regão noroeste do estado de São Palo

10 (CHIARAVALLOTI-NETO et al. (4), Facldade de Medcna de São José do Ro Preto), cjo objetvo geral fo avalar as relações entre os ndcadores entomológcos obtdos através de armadlhas adltcdas, de ovposção e de coletas de adltos e os ndcadores clmátcos em ma área da regão noroeste do estado de São Palo. Mas especfcamente, nesta dssertação trabalhamos com os dados da armadlha adltcda Mosqtrap, desenvolvda por EIRAS (), cja tlzação fo proposta com o objetvo de se estdar o estado fsológco do mosqto Aedes, bem como a pardade das fêmeas, dados fndamentas para caracterzação bológca dos vetores da denge, já qe propcam conhecmentos sobre sa capacdade de nfectar-se e transmtr o vírs (BARATA et al. ()). Além dsso, dentfcando ma determnada qantdade de nsetos captrados nestas armadlhas no ntra e perdomcílo das resdêncas amostradas, podemos prever ma possível epdema de denge e, anda, relaconar a presença do Aedes com varáves meteorológcas. Nosso objetvo é, então, pesqsar modelos qe eprmam a relação estente entre o número de Aedes captradas com as varáves meteorológcas e modelos qe eplqem o comportamento espacal deste fenômeno com a fnaldade de colaborar na bsca de métodos mas precsos para contenção da dssemnação da denge. Incalmente, para eplcar a relação estente entre o número de fêmeas Aedes captradas pelas armadlhas adltcdas e os ndcadores clmátcos, samos Modelos Lneares Generalzados (MLG) e, posterormente, por este conjnto de dados possr ma dependênca temporal, apresentamos como proposta de modelagem o so da teora de Eqações de Estmação Generalzadas (EEG), ambas teoras da estatístca clássca. Além da dependênca temporal, há evdêncas da estênca de ma correlação espacal e, neste sentdo, tlzamos a teora da Geoestatístca para estdar a varação deste fenômeno no espaço, o melhor, estdar sa estrtra de dependênca espacal para qe attdes de controle mas efcentes possam ser efetadas. Nos modelos baseados em MLG e EEG, para dentfcarmos as possíves varáves meteorológcas qe eercem nflênca na captra dos mosqtos pela armadlha, tlzamos a metodologa de seleção de covaráves stepwse va crtéro valor p o nível descrtvo do teste. Em MLG, ao consderar a qadra como bloco, não encontramos na lteratra m programa/fnção dsponível qando m conjnto de varáves predtoras fazem parte do modelo mnmal no procedmento de seleção de varáves. Com relação ao ajste de modelos va EEG, não encontramos programas em qe a metodologa de seleção de varáves já estvesse mplementada. Neste conteto, desenvolvemos fnções específcas em R para atomatzar o procedmento de seleção de varáves stepwse va crtéro valor p a partr de m modelo

11 3 mnmal, com covaráves fas o não, tanto para MLG como EEG. Desta forma, no Capítlo apresentamos ma revsão da lteratra dos Modelos Lneares Generalzados, Eqações de Estmação Generalzadas e Geoestatístca. No Capítlo 3 descrevemos o materal e métodos tlzados, eplctando os parâmetros das fnções stepwse desenvolvdas em R. O Capítlo 4 relata os resltados e prncpas conclsões e, no Capítlo 5, apresentamos ma proposta da contnação deste trabalho.

12 4 - REVISÃO DE LITERATURA. Modelos de Regressão Um modelo de regressão é ma eqação matemátca do tpo Y = X + qe descreve m fenômeno de nteresse, avalado em termos de ma varável, o vetor, aleatóra Y, de dmensão n, em fnção p de varáves não estocástcas conhecdas (covaráves), X, de dmensão n p, e de m efeto aleatóro,, de dmensão n, não dentfcado, ncorporado ao modelo para epressar erros de meddas, efetos de varáves não nclídas o, anda, varabldade natral nerente ao fenômeno estdado. Vale salentar qe esta eqação é lnear nos parâmetros desconhecdos. O prncpal objetvo dos modelos de regressão é estmar o efeto das covaráves (o varáves ndependentes o predtoras o, anda, eplcatvas) X = (X, X,..., X p ) sobre ma varável resposta (o varável dependente) Y de nteresse epermental, dscreta o contína, o melhor, descrever o relaconamento de Y com X, para, assm, prevermos valores ftros de Y o avalarmos o efeto destas varáves eplcatvas sobre a resposta o, anda, descrevermos a estrtra dos dados. Desta forma, tlzando modelos de regressão mas geras, temos qe o valor esperado de Y é ma fnção das covaráves X = (X, X,..., X p ), o seja, E[Y/X] = f(x). Este relaconamento pode ser epresso por ma eqação lnear o ma fnção não lnear. Em modelos de regressão, se consderarmos as respostas ndependentes e com dstrbção pertencente à famíla eponencal, ma das alternatvas é tlzarmos a teora dos Modelos Lneares Generalzados. Se há dependênca entre as observações, dados correlaconados provenentes de meddas repetdas (dados longtdnas) o de agrpamentos, samos as Eqações de Estmação Generalzadas. Qando levamos em consderação a nterdependênca espacal entre eventos, devemos tlzar a teora de Modelos de Regressão Espacal, como por eemplo a Geoestatístca qe ncorpora na modelagem a dependênca espacal dos dados... Modelos Lneares Generalzados Drante mto tempo, os modelos normas lneares foram tlzados para descrever a maora dos fenômenos aleatóros. Mesmo qando o fenômeno sob estdo não apresentava ma resposta para a qal fosse razoável a sposção de normaldade, tentava-se algm tpo de transformação no sentdo de alcançar a normaldade procrada. Com o avanço comptaconal ocorrdo a partr de 97, qe permt a mplementação de processos teratvos para a estmação dos parâmetros do modelo, dversas teoras foram propostas na lteratra. Em 97, Nelder e Wedderbrn ntrodzram a teora de

13 5 Modelos Lneares Generalzados (MLG) qe podem ser tlzados para analsar dados dscretos o contínos, ma vez qe a varável resposta tenha ma dstrbção pertencente à famíla eponencal. Otra característca mportante a ser ctada é qe, assm como em modelos lneares clásscos, as respostas aq observadas também são consderadas ndependentes. Dversos atores, entre eles DEMÉTRIO () e PAULA (4), apresentam os prncpas concetos de Modelos Lneares Generalzados, qe agora vamos ntrodzr. Consdere a varável aleatóra Y, =,...,n, como sendo respostas ndependentes. Os MLG são caracterzados por: a) componente aleatóro: representado por m conjnto de varáves aleatóras Y, =,...,n, ndependentes provenentes de ma mesma dstrbção de probabldade pertencente à famíla eponencal na forma canônca com médas,, 3,..., n, o seja, E(Y )=, =,..., n, m parâmetro constante de escala, conhecdo, >, e qe depende de m únco parâmetro, chamado canônco o natral. A fnção densdade probabldade (f.d.p.) de Y é dada por: f(y ;, ) ep y b c y ; I A y () a sendo b(.) e c(.) fnções conhecdas. Em geral, a ( ) = / w, sendo w pesos a pror. A famíla eponencal é composta pelas dstrbções: Bnomal, Posson, Bnomal Negatva, Gama, Normal, Normal Inversa o Inversa Gassana, entre otras. Temos, anda, qe: E(Y ) = = b ( ) Var(Y ) = a ( )b ( ) = a ( )V( ) = a ( )V, onde: V = d /d é chamada fnção de varânca. Como depende ncamente da méda, temos qe o parâmetro natral pode ser epresso como: V d q, onde q( ) é ma fnção conhecda de. b) componente sstemátco: envolve as varáves eplcatvas qe entram no modelo na forma de ma soma lnear de ses efetos: p j j j ß ' o Xß, onde: X = (,,..., n ) é a matrz do modelo; = (,, 3,..., p) é o vetor de parâmetros desconhecdos;

14 6 = (,,..., n) é o predtor lnear. c) fnção de lgação: é ma fnção qe lga o componente aleatóro ao componente sstemátco, o seja, relacona a méda da varável resposta ao predtor lnear, sto é, = g(e(y )) = g( ) A nversa da fnção de lgação é chamada de fnção méda: g - ( ) =. Se a fnção de lgação é escolhda de tal forma qe g( ) =, o predtor lnear modela dretamente o parâmetro canônco e tal fnção de lgação é chamada lgação canônca. Para m conjnto de observações ndependentes y, y,..., y n, o logartmo da fnção de verossmlhança (, ; y) é dado pela soma das contrbções ndvdas:, n ; y ln L, ; y y b c y;, ; y, () a onde n n L(, ; y) f ( y ;, ) ep y b( ) c( y; ) é a fnção de a ( ) verossmlhança; e f(y ;, ) ep y b c y ; I A y é a densdade da famíla a eponencal. onde = g - ( ) e Seja, então, o logartmo da fnção de verossmlhança defndo por:, ß. n µ ;y ;, y Para o modelo satrado, onde o número de observações, n, é gal ao número de parâmetros, p, a fnção ( µ ; y) corresponde a: y ;y n y ; y e a estmatva de máma verossmlhança de é dada por ˆ y, =,..., n. Qando temos p < n, denotaremos o logartmo da fnção de verossmlhança de ( µ ; y) por ( µ ˆ, y) e a estmatva de máma verossmlhança de é dada por ˆ g ( ˆ ), onde ˆ ' ß ˆ. A estmação dos parâmetros de m MLG é feta pelo método de máma verossmlhança. Assm, dervamos o logartmo da fnção de verossmlhança em relação ao,

15 7 ( ; y, ) j, j =,,..., p e obtemos m sstema de fnções não lneares U( j ), j =,,..., p, denomnada fnção escore, epressa por: U ( ; y, n n j j w d na qal W. V( ) d ) j n d (Apêndce A jw y A), d Podemos escrever a fnção escore na forma vetoral: ( ; y, ) U( ß) X' W ( y µ ), ß onde X é ma matrz n p de posto completo, cjas lnhas serão denotadas por, =,..., n, W = dag{w,..., W n } é a matrz de pesos, = dag{d /d,..., d n /d n } = dag{g ( ),..., g ( n )}, y = {y,..., y n } e = {,..., n}. Como vmos, as fnções U( j ) não são lneares e, qando galadas a zero, devem ser resolvdas por processos teratvos, como por eemplo, o método escore de Fsher qe tlza a matrz de nformação esperada de Fsher e a fnção escore para estmar os s. Para obtermos a matrz de nformação de Fsher, precsamos calclar a esperança da segnda dervada do logartmo da fnção de verossmlhança: jk E ( j ; y, k ) E U j U k n (Apêndce A W A), j k w d onde W. V( ) d Desta forma, podemos escrever a nformação de Fsher na forma matrcal: ß X' WX, onde X é a matrz do modelo, W = dag{w,..., W n } é a matrz de pesos e dspersão. é o parâmetro de A estmatva de máma verossmlhança de, ߈, é obtda através do processo teratvo de Newton-Raphson, epandndo-se a fnção escore U( ) em torno de m valor ncal (), tal qe U( ) U( () ) + U ( () )( - () ), onde U ( ) representa a prmera dervada U( ) com respeto a. Repetndo-se o procedmento acma, chegamos ao processo teratvo

16 8 (m+) = (m) + {-U ( (m) )}U ( (m) ), m =,,... Já qe a matrz -U ( ) pode não ser postva defnda, aplcaremos método scorng de Fsher, sbsttndo esta matrz pelo se correspondente valor esperado, resltando em: (m+) = (m) + - ( (m) )U ( (m) ), m =,,... Fazendo-se algmas alterações, chegaremos a m processo teratvo de mínmos qadrados reponderados: (m+) = (X W (m) X) - X W (m) z (m), m =,,..., (3) na qal z (m) = (m) + (m) (y - ) (m) é chamada varável dependente ajstada. Incamos este processo teratvo especfcando ma estmatva ncal para () e procedemos alterando-a scessvamente até obtermos a convergênca e, assm, ˆ ( m ) ß ß. sege: Com estes resltados, podemos resmr os passos do algortmo de estmação como () obter as estmatvas ( m ) p j j ( m ) j ( m) ( m) e g ( ) ; ( m) ( m) ( m) ( m) () obter a varável dependente ajstada z ( y ) g' ( ) e os pesos ( m) w W ; V ( ) g' ( ) (3) calclar ( m) m (m+) = (X W (m) X) - X W (m) z (m), voltar ao passo (), fazer repetr o processo até a convergênca. (m) = (m+) e Temos, sob condções geras de reglardade, qe ߈ é m estmador consstente e efcente de e qe, conforme n, ߈ d n ß N, S ß p, onde ( ) é ma matrz postva defnda, ß (ß) lm e ( ) não contém aq o mltplcador. n n Para obtermos os erros padrões, ntervalos de confança e testes de hpóteses para os ߈ s, precsamos estmar do parâmetro de dspersão. Vale salentar qe os parâmetros ˆ e ߈ são ortogonas, já qe E[ (, ;y)/ j ] =. Este fato garante a ndependênca assntótca entre ˆ e ߈. Os métodos mas tlzados para estmação de são: método da máma verossmlhança, método dos momentos e ma estmatva baseada na estatístca de Pearson.

17 9 (a) método da máma verossmlhança: dervando-se o logartmo da fnção de verossmlhança apenas com relação ao parâmetro e galando a zero, obtemos a estmatva de máma verossmlhança para : (, ; y) / = ; (b) método dos momentos: nos fornece ma otra estmatva não consstente para, através de: D, n p ~ p onde D p é a devance do modelo sob estdo, n é o número de observações e p é o número de parâmetros do modelo sob estdo. Este método basea-se no fato de qe S p ~ Uma estmatva consderada melhor qe a anteror é ~ D m, n m n-p, o qe nem sempre é verdade. onde D m é a devance do modelo mamal, n é o número de observações e m é o número de parâmetros do modelo mamal. Neste caso, espera-se qe a scaled devance S m tenha m valor mas prómo da esperança da q-qadrado, o seja, E( S m ) ~ E( D m ) ~ n m. (c) estmatva baseada na estatístca de Pearson generalzada: é dada por: *, n m onde n é o número de observações e m é o número de parâmetros do modelo mamal. Vale salentar qe esta estatístca nem sempre é não vesada, mas, é consstente. dada por: A qaldade do ajste de m MLG é avalada através da fnção desvo (devance), D *( y; µ ˆ ) D( y; µ ˆ) { ( y; y) ( µ ˆ; y)}, qe é ma dstânca entre o logartmo da fnção de verossmlhança do modelo satrado (com n parâmetros) e do modelo sob estdo (com p parâmetros), avalado na estmatva de máma verossmlhança ߈. Um valor peqeno da fnção desvo ndca qe, para m número menor de parâmetros, obtém-se m ajste tão bom qanto o ajste com o modelo satrado. Se denotarmos por ˆ (ˆ ) e ˆ (ˆ ) as estmatvas de máma verossmlhança de para os modelos

18 com p parâmetros (p < n) e satrado (p = n), respectvamente, temos qe a fnção D ( y; µ ˆ) é dada por n D( y ; µ ˆ ) y ˆ ˆ b(ˆ ) b(ˆ ). S p Temos, anda, qe ( y; µ ˆ, ) D( y; µ ˆ ) é chamada scaled devance e é tlzada qando o parâmetro de dspersão é dferente de. Uma otra medda de ajste alternatva é a estatístca de Pearson dada por: ( y ˆ ) w, Vˆ( ˆ ) onde Vˆ (ˆ ) é a fnção de varânca estmada para a dstrbção em estdo. generalzada, Podemos mostrar qe, para respostas com dstrbções normas, S ( y; µ ˆ, ) p e tem dstrbção n p eata e, para respostas com dstrbções Bnomal e Posson, tem dstrbção n p assntótca. S p ( y; µ ˆ, ) Para verfcarmos a adeqabldade do modelo, devemos comparar as meddas e com os percents da dstrbção n-p. Se ( y; µ ˆ, ) S p n-p, e n-p n-p, consderamos qe há evdêncas, a m nível de % de probabldade, qe o modelo proposto está bem ajstado aos dados. Anda, m valor de S ( y; µ ˆ, ) prómo de (n p) pode ser ma ndcação de qe o p modelo ajstado está adeqado, já qe o valor esperado de ma varável com dstrbção dado pela dferença epressa acma. A análse de ma seqüênca de modelos é conhecda como análse da fnção desvo (ANODEV). Incamos pelo modelo mas smples, o modelo nlo, qe só tem o ntercepto, e, a partr daí, devemos ajstar novos modelos, nclndo mas termos do qe nos anterores, os efetos de fatores, covaráves e sas nterações. Tendo ajstado estes modelos, chamados de modelos encaados, tlzaremos a devance como ma medda de dscrepânca do modelo e formaremos ma tabela de dferença de devances. Para lstrar esta análse, sponhamos M p, M p,..., M pr, ma seqüênca de modelos encaados com a mesma dstrbção, a mesma fnção de lgação e com dmensões, é

19 respectvamente, p, p,..., p r. Sejam X p, X p,..., X pr, as matrzes dos modelos e D p > D p >...> D pr, as devances. Sponhamos, também, m ensao nteramente casalzado, com r repetções e dos tratamentos no esqema fatoral, com a níves para o fator A e b níves para o fator B. Neste caso, obtemos os resltados mostrados na Tabela. Tabela Análse de devance Modelo G.L. Devance Df. de Df. de Sgnfcado devances G.L. Nlo rab - D D a - efeto de A gnorando B A a(rb ) D A DA - DA+B b - efeto de B nclído A DA+B - DA*B (a ) (b ) Interação AB, estando nclídos A e B A + B + A.B ab(r ) D A*B DA*B Resído Satrado Pelos componentes da ANODEV é possível verfcarmos a magntde o sgnfcânca dos efetos desse partclar ensao. Sejam os modelos M p e M q (p < q), com p e q parâmetros respectvamente. A estatístca D p D q, com (p q) gras de lberdade, é ma medda de varação dos dados eplcada pelos termos qe estão em M q e não estão em M p. Assm, temos qe sto eqvale a testarmos se os s são conjntamente gas a zero, o seja, p+= p+=...= q =. Temos, assntotcamente, para conhecdo, qe (D p Dq ) ~ q p. Se é desconhecdo, devemos obter ma estmatva consstente ˆ, de preferênca baseada no modelo mamal (com m parâmetros), e a nferênca pode ser baseada na estatístca F, dada por: ( D D ) /( q ˆ p) p q F ~ Fq p, n m.

20 Para testarmos as hpóteses relatvas aos parâmetros estatístcas: razão de verossmlhanças, Wald e escore. s apresentamos três Seja T T, T ß ß ß ma partção do vetor de parâmetros onde, com dmensão q é o vetor de nteresse e, com dmensão (p q), o vetor nsance, o seja, m vetor com parâmetros pertrbadores, parâmetros qe não tenho nteresse medato. especfcado para. Sejam as hpóteses H : =, verss H :,, onde, é m valor Seja T T ߈ ߈, ˆ T T o estmador de máma verossmlhança para e ߈ ˆ ß,ˆ, T T ß onde ˆß, é o estmador de máma verossmlhança para, sob H. Para testarmos a hpótese H, temos: () Teste da Razão de verossmlhança: onde restrção e sob H. ln ߈, ˆ ;, ˆ ; ( ; ˆ ß y ß ß y D y µ ) D( y; µ ˆ), ß ˆ, ˆ ; y ß ß, ß, é o logartmo da fnção de verossmlhança mamzada sem ˆ ; y, ß é o logartmo da fnção de verossmlhança mamzada A regra de decsão é dada por: rejetamos H, a m nível %, se > q,-. () Teste de Wald: ˆ T W ß ß ) Vˆ ar(ˆ ß ) ( ߈ ), onde V ˆar( ˆ ) é a Var ß ˆ ) T T T avalada em ߈ ˆ ß,ˆ. (, ß,, ß, ß ( A regra de decsão é dada por: rejetamos H, a m nível %, se W > T (3) Teste escore: E U ( ˆ ) ˆ ( ˆ ß Var ß) U(ˆ ß), onde V ˆ ar (ˆ ß ) é a Var ( ß ˆ ) q,-. avalada T T T em ߈ ˆ ß,ˆ., ß, A regra de decsão é dada por: rejetamos H, a m nível %, se E > q,-. Uma regão de confança assntótca para obtda a partr da estatístca do teste da razão de verossmlhanças, com m coefcente de confança de (- )%, é dada por: ß ˆ, ߈ ; y ß, ˆ ; y < ß, q,-, onde ˆß, é a estmatva de máma verossmlhança para para cada valor de qe é testado ser pertencente o não a regão.

21 3 Pela estatístca de Wald, temos qe ma regão com (- )% de confança, é epressa por: ˆ T W ß ß ) Vˆ ar( ߈ ) (ˆ ß ) < ( ß q,-. Até este ponto, vmos qe a escolha de m Modelo Lnear Generalzado envolve três passos: defnção da dstrbção, da fnção de lgação e da matrz do modelo. Para avalarmos se estas escolhas resltaram em m modelo adeqado/aproprado aos dados devemos realzar ma análse de dagnóstcos, o análse dos resídos. Nesta fase, faremos a verfcação de possíves afastamentos das sposções fetas, tanto com relação a parte aleatóra, a parte sstemátca e a fnção de lgação, bem como a estênca de observações etremas (otlers e pontos de alavanca) com algma nterferênca desproporconal nos resltados do ajste. Uma observação é chamada de otler da regressão, o otler em y, se ela se afasta do padrão lnear defndo pelas otras observações, dando orgem a grandes resídos. Por otro lado, qando ma observação se destaca das demas no espaço das varáves eplanatóras, é chamada de ponto de alavanca. Uma defnção de ponto de alavanca é constrída fazendo ma analoga entre a solção de máma verossmlhança para ߈ nm MLG e a solção de mínmos qadrados de ma regressão normal ponderada. Na convergênca do processo teratvo dado pela eqação (3), temos qe: ˆ ( X' WX ˆ ) X' Wz ˆ, onde ˆ ˆ / z ˆ W / V ( y ˆ ). Portanto, ˆ pode ser nterpretado como a solção de mínmos qadrados da regressão lnear de ˆ z contra as colnas Wˆ / X. A matrz de projeção da W / solção de mínmos qadrados da regressão lnear de z contra X com pesos W fca dada por / / H W X( X' WX) X' W, qe sgere a tlzação dos elementos da dagonal prncpal de Ĥ para detectar a presença de pontos de alavanca neste modelo de regressão normal ponderada. Os tpos de resídos mas sados para os Modelos Lneares Generalzados são: a) resídos ordnáros r y ˆ ; b) resídos de Pearson generalzados r p y w ˆ ˆ V( ),

22 4 sendo ˆ ma estmatva consstente do parâmetro e w m peso a pror. c) resídos de Pearson generalzados estdentzados nternamente r p' w y ˆ V( ˆ )( sendo h o -ésmo elemento da dagonal da matrz H; Segndo DEMÉTRIO () há, anda, os resídos componentes da devance, componentes da devance estdentzado nternamente e componentes da devance estdentzado eternamente qe podem ser tlzados como meddas de dagnóstcos. Sponhamos, agora, qe o logartmo da fnção de verossmlhança de por (ß). Uma regão assntótca de confança de coefcente ( - ) para é dada por: [ ß ;{ (ˆ) ß ( ß)} ( )]. p h ) seja defndo Desta forma, para avalarmos o mpacto em (߈ ) com a retrada da -ésma observação podemos tlzar ma medda baseada na regão assntótca acma. Esta medda, denomnada afastamento da verossmlhança (lkelhood dsplacement), é defnda por LD () { (ˆ) ß (ˆ ß )}. Como não é possível obtermos ma forma analítca para LD, tlzamos a segnda apromação por sére de Taylor em torno de ߈, o qe nos leva na segnte epressão: LD ~ ( ß ßˆ)'{ ''(ˆ)}( ß ß ß ˆ). Sbsttndo L ''( ߈ ) pelo correspondente valor esperado e por ß ( ), obtemos LD ~ (ˆ ˆ )'( ˆ )(ˆ ˆ ß ß() X' WX ß ß() ) (4). Assm, temos ma boa apromação para LD qando (ß) for apromadamente qadrátca em torno de ߈. Como em geral não é possível obtermos ma forma fechada para ß ( ), tlzamos a apromação dada por: P rˆ w ß ( ) ߈ ( X' Wˆ X), ( hˆ ) ˆ ˆ

23 5 qe, na realdade, consste em tomarmos a prmera teração do processo teratvo pelo método scorng de Fsher qando o mesmo é ncado em ߈. Desta forma, sbsttndo a epressão acma em (4), obtemos: ĥ LD ts ( ĥ ), onde / ( y ˆ ) ts é chamado resído padronzado. Vˆ ( hˆ ) LD é também chamada de dstânca de Cook. Algmas técncas gráfcas para verfcarmos a adeqabldade do modelo ajstado são apresentadas a segr: (a) Resídos verss algma fnção dos valores ajstados: onde tlzamos algm resído estdentzado verss ˆ o verss os valores ajstados, transformados de tal forma qe se tenha ma varânca constante para a dstrbção tlzada. O padrão nlo deste gráfco é ma dstrbção dos resídos em torno de zero com ampltde constante. Não tem sgnfcado para dados bnáros; (b) Gráfco da varável adconada o da regressão parcal: com este gráfco é possível verfcarmos, também, se este ma relação entre os resídos do modelo ajstado e ma covarável anda não nclída no modelo. Para constrrmos este gráfco, devemos eectar os segntes procedmentos: - ajstar m modelo sem a varável a ser adconada; - obter deste modelo o resído de Pearson generalzado; - obter v = (I-H)W /, onde é a varável qe será adconada e v representa os resídos da regressão ponderada de em relação a X, com matrz de pesos W; - traçar, então, o gráfco do resído de Pearson generalzado verss v. Se o gráfco apresentar ma certa tendênca, o seja, se os pontos não estverem espalhados aleatoramente, a varável é sgnfcatva para o modelo; (c) Gráfco de resídos parcas o gráfco de resídos mas componente: este gráfco é tlzado para verfcarmos se ma determnada varável eplcatva precsa ser transformada. Incalmente, ajstamos o modelo com predtor lnear = X +, obtendo W - s e ˆ, sendo s o vetor com elementos s a y V ˆ ˆ d d. Em segda, traçamos o gráfco de W - s + verss. Se o gráfco apresentar ma tendênca, o

24 6 seja, se os pontos não estverem espalhados aleatoramente, a varável é não precsa ser transformada; (d) Gráfco normal o Q-Q plot (normal plot): o gráfco normal de probabldades nos ala na dentfcação da dstrbção orgnára dos dados e, também, dos valores qe se destacam no conjnto. Para constrrmos este gráfco, devemos segr os segntes passos: - ajstar m modelo a m conjnto de dados e obter d (), os valores ordenados de ma certa estatístca de dagnóstco (resídos, dstânca de Cook, h, etc); - dada a estatístca de ordem na posção, calclar a respectva probabldade acmlada p e o respectvo qantl, o seja, o nverso da fnção de dstrbção da varável resposta I d, no ponto p ; - constrr o gráfco de d () verss I d. A asênca da dstrbção esperada é verfcada qando este gráfco assme as formas: - S (esse): ndcando dstrbções com cadas mto crtas, sto é, dstrbções cjos valores estão mto prómos da méda; - S nvertdo (esse nvertdo): ndcando dstrbções com cadas mto longas e, portanto, presença de mtos valores etremos; - J e J nvertdo: ndcando dstrbções assmétrcas, postvas e negatvas, respectvamente. Estes gráfcos são mto dependentes do número de observações e atngem ma establdade qando o número de observações é grande. Um teste formal para verfcarmos a adeqacdade da fnção de lgação consste em adconarmos ˆ como ma covarável etra e eamnarmos a mdança ocorrda na devance, o qe eqvale ao teste da razão de verossmlhanças. Se ocorrer ma dmnção drástca, há evdênca de qe a fnção de lgação é nsatsfatóra... Eqações de Estmação Generalzadas A sposção de ndependênca entre as respostas observadas nem sempre pode ser consderada, como no caso de pesqsas qe envolvem o estdo de dados correlaconados. Dados correlaconados podem srgr a partr de stações tas como: - dados longtdnas, múltplas meddas de m mesmo ndvído em estdo são obtdas ao longo do tempo;

25 7 - agrpamentos, as meddas são provenentes de ndvídos qe compartlham categoras comns o característcas qe condz a ma correlação. Por eemplo, dados de ncdênca plmonar entre os membros de ma famíla podem estar correlaconados devdo a fatores heredtáros. Esta correlação deve ser comptada por métodos aproprados de análse de dados. Se a pesqsa em estdo poss dados correlaconados e se eles forem tratados como ndependentes, teremos como conseqüênca: - nferêncas ncorretas dos parâmetros regressores devdo a erros padrões sbestmados; - estmadores nefcentes, o seja, haverá m maor erro qadrátco médo nos estmadores dos parâmetros de regressão Neste sentdo, LIANG & ZEGER (986) propseram o so das Eqações de Estmação Generalzadas (EEG), ma etensão dos Modelos Lneares Generalzados, como m método de estmação dos parâmetros do modelo da regressão para tratar dos dados correlaconados. Os concetos aq apresentados podem ser encontrados em HORTON & LIPSITZ (999) e JOHNSTON (996). defnr: Para especfcarmos m modelo de regressão sando o método EEG, precsamos - a dstrbção da varável resposta; - a fnção de lgação; - as varáves eplcatvas; - a estrtra da matrz de correlação entre observações. Seja, então, Y j, =,,...,K, j =,,...,n representando a j-ésma medda do - ésmo objeto. Há n observações do objeto e K n o total de observações. Os dados correlaconados são modelados sando a mesma fnção de lgação e o mesmo predtor lnear (componente sstemátco) como no caso de ndependênca. O componente aleatóro é descrto pela mesma fnção de varânca, mas a estrtra de covarânca das meddas correlaconadas também deverão ser modeladas. Seja Y [Y,..., Yn ]' o vetor de observações do -ésmo objeto e [,..., n ]' se correspondente vetor de médas e, seja V o estmador da matrz de covarânca de Y. A Eqação de Estmação Generalzada para estmarmos etensão da eqação de estmação de ndependênca para dados correlaconados e é dada por: é ma

26 8 k µ ' V ß (Y µ ( ß)) Seja R ( ) ma matrz de correlação de trabalho (n n ) completamente especfcada pelo vetor de parâmetros. A matrz de covarânca de Y é modelada como: onde: A R a) V ( A, A é ma matrz dagonal (n n ) com V( j ), o j-ésmo elemento da dagonal, o seja, defne a varânca de Y j como fnção da méda margnal j; A V ( ) V ( ) V ( n ) n n R ( ) é a matrz de correlação de trabalho qe defne a estrtra de dependênca entre as meddas repetdas. Se R ( ) é a verdadera matrz de correlação de trabalho de Y, então V será a verdadera matrz de covarânca de Y. A matrz de correlação de trabalho salmente não é conhecda. Ela é estmada por m processo de ajste teratvo sando o valor corrente na teração do vetor de parâmetros para comptar a fnção aproprada de resído de Pearson: r j y j µ ˆ V(µ ˆ Há dversas estrtras da matrz de correlação de trabalho qe podem ser tlzadas para modelar a matrz de correlação de Y. Vale salentar qe a dmensão do vetor, qe é tratado como m parâmetro de pertrbação (nsance), e a forma do estmador de são dferentes para cada tpo de estrtra. As mas tlzadas são: (a) Independente o Identdade: assme ndependênca entre os tempos, sto é, R, se n n ( ) n n, c.c. o Assm EEG = MLG. j j )

27 9 (b) Constante no tempo: poss a mesma correlação entre todos os dferentes tempos de avalação, o seja, R ( ) n n, se n, c.c. n o, qe pode ser estmado por ˆ k K n( n ) j k r r j k. (c) Sem estrtra defnda: poss dferentes correlações entre todos os tempos de avalação, o seja, R ( por ˆ ) n n jk k, se n n n K rj r, c.c. k. n o n n Número de parâmetros a serem estmados: n (n -) n n, qe pode ser estmado (d) Ato-regressva: assme ma relação entre as correlações referentes aos tempos anteror e posteror, o seja,, se n n R ( ) n n n n, c.c. o n n n n, qe pode ser estmado por ˆ k K r r j n j n, j. (e) M-dependente: depende das M observações anterores, o seja,

28 , c.c., se ) ( t n n n n R o n n n n, qe pode ser estmado por K t n j t j, j t r r t n k ˆ Número de parâmetros a serem estmados: < M n (f) Fada: as correlações são fadas pelo pesqsador, o seja, c.c., r, se ) ( n n n n n n R o n n n n r r r r r r O ajste de m modelo específco tlzando EEG sege os segntes passos: - calclar o estmador ncal de, por eemplo com m Modelo Lnear Generalzado, assmndo ndependênca; - comptar a matrz de correlação de trabalho R ( ); - calclar o estmador da covarânca ) ( ˆ A R A V - atalzar : K I K I r r ) (Y ' ' µ V ß µ ß µ V ß µ - repetr até convergr. As EEG tem como boa propredade estatístca: - )) ( (, ) ˆ ( M ß ß k N K se o modelo médo está correto, anda qe V esteja especfcada ncorretamente, onde: ) ( I I I M K I o ' ß µ V ß µ I K I Cov ) (Y ' V ß µ V ß µ I

29 Esta propredade sgnfca qe não precsamos especfcar corretamente a matrz de correlação para termos m estmador consstente para os parâmetros regressores. Escolher a correlação de trabalho mas próma da verdadera correlação, amenta a efcênca estatístca dos estmadores dos parâmetros da regressão, assm, devemos especfcar a matrz de correlação tão precsa qanto o possível baseada em conhecmentos específcos da área em estdo. A Cov (߈ ) é dada por: Cov ( ߈) I. Esta é a nversa da Matrz de Informação de Fsher, mtas vezes tlzada em Modelos Lneares Generalzados como m estmador da covarânca do estmador de máma verossmlhança de. É m estmador consstente da matrz de covarânca de ߈ se o modelo médo e a matrz de correlação forem especfcadas corretamente. O estmador da matrz de covarânca de ߈, dado por: M I II é chamado empírco, o robsto, pos, tem a propredade de ser m estmador consstente, até mesmo se a matrz de correlação está mal especfcada, o seja, se Cov(Y ) V. No cálclo de M, e são sbsttídos por sas estmatvas ncas e, a Cov(Y ) é sbsttída por ma estmatva, como: ( Y (ˆ))'(Y ß µ (ˆ)) ß µ...3 Seleção de Modelos Uma das etapas de grande mportânca da constrção de m modelo de regressão é a seleção do modelo. Consderando qe temos m conjnto de varáves qe seram possíves canddatas a varáves eplcatvas em m modelo, vamos comentar algns procedmentos para obter m modelo parcmonoso e qe se ajste bem aos dados. Um prmero procedmento, conhecdo como de todas as regressões possíves, consste em fazermos todos os ajstes possíves. Por eemplo, com 4 varáves eplcatvas, devemos ajstar ( 4 -) modelos. Para cada modelo ajstado, podemos calclar m o mas crtéros para compará-los: R p, MSE p, C p, PRESS p e AIC. Na tlzação deste procedmento, vamos levar em consderação algmas sposções: (a) o número de potencas varáves é P ; (b) todos os modelos tem ntercepto: ; (c) p é o número de varáves em m partclar modelo, p P;

30 (d) o número de observações, n, é maor qe o número mámo de varáves eplcatvas, n > p, n > P. Os qatro prmeros crtéros descrtos a segr (R p, R a,p, C p e PRESS p ) e aplcados em MLG foram ctados e epressos em notas de ala por BARRETO (5). O crtéro AIC fo ctado como crtéro de seleção em PAULA (4). I. SSE p o R p (coefcente de determnação) Corresponde ao cálclo do coefcente de determnação do modelo ajstado, dado por: D p R p, D em qe D p é a devance do modelo sob estdo e D é a devance do modelo com m únco parâmetro. Esta qantdade mede a redção da varação total em Y ao tlzarmos o modelo com as varáves em qestão e tem as segntes propredades: - R p ; - valores grandes de R p, em geral, ndcam qe o modelo está bem ajstado. Assm, valores prómos de zero, ndcam m modelo pobre o m ajste rm; - em geral, valores altos de b prodzem R p grande, sem, no entanto, o modelo estar bem ajstado. Assm, nem sempre é bom sar só R p; - qanto maor o número de varáves eplcatvas, maor será o valor de R p. Para comparar R p de modelos com m número dferente de varáves eplcatvas, devemos tlzar o crtéro R a,p II. MSE p o R a,p (coefcente de determnação ajstado) Este crtéro, ao contráro do anteror, leva em consderação o número de parâmetros do modelo e dado por: n D p R a,p, n p D onde D p é a devance do modelo sob estdo e D é a devance do modelo com m únco parâmetro. III. C p Este crtéro é epresso como:

31 3 D p C p ( n p ) D ( n p ( p )) onde D p é a devance do modelo sob estdo e D p- é a devance do modelo sem a varável eplcatva qe está sendo adconada no modelo com D p. Usando este crtéro é possível dentfcarmos o sbconjnto de varáves para os qas: (a) o valor de C p é peqeno; (b) o valor de C p é prómo de p, o número de parâmetros do modelo sob estdo. Os sbconjntos com valores peqenos de C p tem ma devance peqena, enqanto qe o valor de C p prómo de p, ndca qe o víco do modelo de regressão é peqeno. IV. PRESS p (soma de qadrados dos valores predtos) Este crtéro é ma medda do qão bom é sarmos os valores predtos do partclar modelo para podermos prever as respostas observadas, ndcadas por y. n p ( y ˆ y ( ) ) PRESS, onde ŷ ( ) é o valor predto da observação qando ela fo omtda do ajste. Modelos com valores peqenos de PRESS p são consderados bons modelos. V. Crtéro de Akake Neste caso, o crtéro tlzado consste em encontrarmos o modelo tal qe a qantdade abao seja mnmzada AIC = D p + p, em qe D p denota a devance do modelo e p o número de parâmetros. A partr da obtenção dos cnco crtéros para cada modelo, é possível, então, dentfcarmos aqeles qe seram canddatos a melhores modelos. Em caso de empates, devemos optar pelo modelo com menor número de varáves eplcatvas (prncípo da parcmôna). Um segndo procedmento de seleção de modelos é conhecdo como procedmento de seleção de varáves stepwse. Ele consste em m algortmo qe pode adconar o remover varáves, tendo como crtéro a varação da devance, o coefcente de correlação parcal, a estatístca de teste do parâmetro assocado, a estatístca F* o o valor p.

32 4 Se so é ndcado qando o número de varáves eplcatvas é grande. A dferença deste método com o anteror é qe, aq, apenas m crtéro é tlzado. Há três maneras de se tlzar o algortmo stepwse: (I) Método forward Incamos o método pelo modelo mas smples qe contém apenas o ntercepto, sto é, =. Ajstamos, então, para cada varável eplcatva o modelo: Testamos H : j = contra H : j j j, j,..., p.. Seja P E o nível crítco do teste especfcado a pror e P o menor nível descrtvo entre os p testes. Se P P E, a varável correspondente entra no modelo. Sponhamos qe X tenha sdo escolhda. Então, no passo segnte, ajstamos os modelos j j, j,..., p. Testamos H : j = contra H : j. Seja P o menor nível descrtvo entre os (p ) testes. Se P P E, a varável correspondente entra no modelo. Repetmos o procedmento até qe ocorra P > P E. (II) Método backward Incamos o método pelo modelo Testamos H : j = contra H : j... p p., para j =,..., p. Seja P o maor nível descrtvo entre os p testes. Se P > P S, a varável correspondente sa do modelo. Sponhamos qe X tenha saído do modelo. Então, no passo segnte, ajstamos o modelo Testamos H : j = contra H : j... p p., para j =,..., p. Seja P o maor nível descrtvo entre os (p ) testes. Se P > P S, a varável correspondente sa do modelo. Repetmos o procedmento até qe ocorra P P S. (III) Método stepwse É ma mstra dos dos métodos acma. Incamos o processo com o modelo =. Após das varáves terem sdo nclídas no modelo, verfcamos se a prmera não sa do modelo. O processo contna até qe nenhma varável seja nclída o seja retrada do modelo.

33 5..4 Geoestatístca A metodologa Geoestatístca fo formalzada pelo engenhero Georges Matheron, na França, fnal da década de 6, a partr de estdos prátcos do cálclo de reservas de mnas de oro na Áfrca do Sl desenvolvdos por város pesqsadores, onde se destacaram o engenhero de mnas Danel G. Krge e o estatístco H. S. Schel. Esta metodologa se preocpa com o estdo das varáves regonalzadas o varáves com condconamento espacal, e tem como déa básca o fato de qe qanto mas prómos estverem dos pontos amostrados, espera-se qe ses valores sejam semelhantes. O valor de ma amostra localzada espacalmente em, onde é m conjnto de coordenadas geográfcas, é nterpretado como ma realzação y( ) da varável regonalzada Y( ). Em m espaço o regão de estdo no qal se dspersa o conjnto de amostras, temos as realzações das n varáves regonalzadas Y( ), Y( ),..., Y( n ) correlaconadas entre s. Conforme veremos, ma varável regonalzada qe depende, então, de sa posção espacal, será tlzada para medr a varação espacal de m fenômeno em estdo. A varável regonalzada é contína no espaço já qe poss como propredade o fato de apresentar valores mto prómos em dos pontos vznhos e progressvamente mas dferentes a medda qe os pontos vão se dstancando. Apesar dsto, não é possível conhecermos os ses valores em todos os pontos, mas sm apenas em algns qe foram obtdos por amostragem. A Geoestatístca tem como prncpal objetvo analsar os valores de ma varável dstrbída no espaço para se determnar sa estrtra de dependênca espacal e, assm, efetar nterpolações. Ao etrar dos dados dsponíves ma magem da sa varabldade e ma medda da correlação estente entre valores tomados em dos pontos do espaço, temos ma análse estrtral o análse da estrtra no espaço. A estmatva de dependênca entre amostras é feta através do semvarograma. Já a prevsão o nterpolação, sto é, nferênca sobre a realzação do processo em localzações não meddas, é feta através de m nterpolador geoestatístco chamado de krgagem, em homenagem ao engenhero de mnas D. G. Krge. Na etapa da análse estrtral, veremos qe há dos tpos mportantes de estrtra espacal: estaconaredade e sotropa. Ao admtrmos a hpótese de estaconaredade, assmmos qe o processo é smlar ao longo da regão de estdo. Anda, se o processo é estaconáro e sotrópco, a estrtra de peqena escala depende das localzações espacas apenas através da dstânca ecldeana entre elas, o seja, é nvarante sob rotação e translação das localzações. Resmdamente, os passos de m estdo por técncas geoestatístcas são:

34 6 (a) análse eploratóra dos dados; (b) análse estrtral (cálclo do semvarograma epermental e ajste do modelo teórco) e (c) prevsão (nterpolação) (krgagem e smlação). Os concetos aq apresentados podem ser encontrados em CAMARGO (997), CAMARGO et al. (), DIGGLE et al. (), JIAN et al. (996), LANDIM (3), MELLO et al. (5) e SOARES (6). A regão de estdo qe contém m número dscreto de amostras será denotada por A. O formato básco de dados geoestatístcos nvarados é dado por: (, y ), =,..., n, onde dentfca a localzação espacal (geralmente em das dmensões, embora ma e três dmensões possam ocorrer); y é ma medda escalar tomada na posção. O modelo geoestatístco é m processo estocástco {Y(): A}, o qal é consderado ser ma realzação parcal do processo estocástco {Y(): R }. O processo estocástco Y() é Gassano se a dstrbção conjnta de Y( ),..., Y( n ) é Gassana Mltvarada para qalqer ntero n e m conjnto de localzações. Seja Y() ma fnção aleatóra do conjnto de varáves aleatóras Y( ), Y( ),..., Y( n ), correlaconadas entre s e localzadas espacalmente em A, e {Y(): R } m processo espacal Gassano, com as segntes propredades: - a fnção méda: () = E[Y()], mtas vezes chamada de tendênca; - a fnção covarânca: Cov {Y(), Y( )}, onde = + e ma determnada dstânca; - e, a fnção varânca: () = Var{Y()}. Além dsso, o processo Y() é estaconáro se: - E[Y()] = for constante para todo, o seja, E[Y( )] = E[Y( )] =... = E[Y( n )] = ; - Cov{Y(), Y( )} = Cov( - ) depende somente da dferença entre das localzações de nteresse. A hpótese de estaconaredade em relação à covarânca é, então, defnda consderando qe a correlação entre das varáves aleatóras depende somente da dstânca espacal qe as separa e é ndependente da sa localzação. Esta hpótese de qe a correlação entre qasqer das varáves aleatóras dstancadas espacalmente de m vetor depende somente de, mplca qe a covarânca pode ser epressa como:

35 7 Cov Y,Y ' Cov Y,Y C Var Y Var Y ', onde = e () é a fnção de correlação dada por: C Y,Y ' Y,Y. Var Y Var Y ' Admtndo a estaconaredade em relação à esperança, o seja, qe a méda da varável regonalzada no ponto () é gal àqela no ponto ( + ), temos qe E[Y()] = E[Y( )] e, conseqüentemente, E[Y ()] = E[Y ( )]. Desta forma, para o processo estaconáro, a varânca de Y() é constante e é útl para escrever a fnção covarânca como C() = () (Apêndce B B), onde é a varânca, (.) é a fnção correlação e é a dstânca qe separa as das varáves aleatóras. O processo é estaconáro e sotrópco se, adconalmente, a covarânca depende somente da dstânca qe separa as das varáves aleatóras, de modo qe Cov( - ) = Cov( - ) = C( - ), onde. denota a dstânca Ecldeana. Uma relação próma à fnção covarânca é o varograma, ma ferramenta básca qe nos permte descrever qanttatvamente a varação de m fenômeno regonalzado no espaço (HUIJBREGTS, 975). Assm, a estmatva da dependênca entre os pontos amostras vznhos no espaço pode ser realzada através da atocorrelação e o varograma é o nstrmento mas ndcado na estmatva desta dependênca. Assm como a fnção covarânca, o varograma também é ma medda méda da correlação entre das varáves aleatóras. A estrtra de correlação espacal de m conjnto de dados é, então, defnda a partr da comparação de valores tomados smltaneamente em dos pontos, segndo ma determnada dreção. A fnção varograma (, ) é defnda como sendo a esperança matemátca do qadrado da dferença entre os valores de pontos no espaço, separados por ma dstânca, conforme a segnte eqação: E Y Y( ), e, através de ma amostra y( ), =,..., n, pode ser estmada por: N * y y( ), N( ) onde N() é o número de pares de pontos separados por ma dstânca, y() é o valor da varável regonalzada no ponto e y( + ) é o valor da varável regonalzada no ponto ( + ). A fnção varograma () pode ser epressa em termos da varânca e da fnção covarânca C(, ) = C(, + ) = C():

36 8 C. (Apêndce B B) Para m processo com estrtra de covarânca estaconára, o varograma se redz a: C C (Apêndce B B). A fnção () é denomnada fnção semvarograma, qe é a metade da fnção varograma. Esta fnção () é vetoral, já qe é ma fnção do vetor e, portanto depende da magntde e dreção de. Vale salentar qe o vetor é composto por ma componente dreção ( ), bem como o valor da dstânca. Estas consderações nos revelam qe é possível constrrmos semvarogramas segndo ma dreção predefnda (norte-sl (N-S): = º, nordeste-sdoeste (NE-SO): = 45º, leste-oeste (L-O): = 9º e noroeste-sdeste (NO-SE): = 35º - Fgra ). Na prátca, constrímos semvarogramas segndo váras dreções para conhecermos a estrtra da varável regonalzada em estdo, o melhor, para verfcarmos se há ma dferença na estrtra dos dados ao longo das dreções. Qando os semvarogramas mostram dferentes comportamentos para dferentes dreções ocorre o qe chamamos de ansotropa e, assm, a dstrbção espacal do fenômeno não é sotrópca, o seja, sem dreções prvlegadas de varabldade. Fgra. Convenções dreconas sadas na Geoestatístca O procedmento de obtenção e análse do semvarograma é chamado de análse estrtral. A nterpretação do semvarograma nos permte descrever o comportamento espacal das varáves regonalzadas através dos ses parâmetros estrtras: - varânca pepta o efeto pepta ( ngget ): ; - patamar ( sll ): Var{Y()} = + ; - alcance, ampltde o rao ( range ):.

37 9 Pelo semvarograma consegmos dentfcar qalqer valor de Y() correlaconado com otros valores Y( + ) qe estverem dentro de m rao (denomnado alcance o ampltde) de. Esta correlação, o melhor, a nflênca de m valor em otro, decresce conforme Y( + ) aproma-se de. Grafcamente, podemos lstrar o semvarograma como sege: - alcance o ampltde ( ): é a dstânca a partr da qal as amostras passam a ser ndependentes. Em otras palavras, a ampltde reflete o gra de homogenezação entre as amostras, o seja, qanto maor for a ampltde maor será a homogenedade entre as amostras. Nesse sentdo, o semvarograma dá m sgnfcado precso da noção tradconal de zona de nflênca. A ampltde ( ) é a dstânca qe separa o campo estrtrado (amostras correlaconadas) do campo aleatóro (amostras ndependentes); - patamar (Var{Y()} = + ): é o valor no qal o semvarograma establza-se (no campo aleatóro), é o ponto a partr do qal as amostras tornam-se ndependentes devdo à grande dstânca qe as separa; - efeto pepta ( ): é o valor da fnção semvarograma na orgem ( = ). Teorcamente esse valor devera ser zero, pos das amostras tomadas no mesmo ponto ( = ) deveram ter os mesmos valores; entretanto qando não é assm, atrb-se, esta dferença, geralmente, a erros de amostragem e/o análse devdo à varabldade natral da localzação de amostragem; Em m processo estaconáro, a fnção de covarânca depende de m argmento escalar e da defnção da fnção de correlação (.), o qe mplcara qe () =, desde qe

38 3 Y() seja perfetamente correlaconado com ele mesmo. Entretanto, na prátca, é razoável nvestgar qe o valor meddo na localzação podera estar replcado e qe o resltado de múltplos valores não seram dêntcos. Matematcamente, sto mplca qe () <. Um modelo físco para corresponder a este comportamento sera qe o Y() ncl m componente da varação aleatóra devdo ao erro de medda e, a representação estatístca dos valores Y,...,Y n, provenentes de localzações não necessaramente dstntas,..., n, sege o modelo: Y = S( ) +, =,..., n, (5) na qal S() é m processo Gassano estaconáro com fnção de covarânca C s () = (), tal qe () = e são varáves aleatóras mtamente ndependentes com dstrbção N(, ); Seja, então, o processo Y() na qal o valor da localzação é obtdo pelo modelo estatístco dado por eqação (5), com =. Então, Y() tem varânca covarânca C() = () e, daq, a fnção de correlação: Y() = () / ( + ) / ( + ) <, com. A correspondente fnção semvarograma deste processo é epressa por: Y() = + { - ()} = + s (), onde o parâmetro é a varânca pepta, Var{Y()} = + + e fnção de é o patamar, () é a fnção de correlação qe depende do parâmetro, denomnado alcance o ampltde. Este resltado nos mostra qe o efeto do termo do erro de medda em (5) está presente para ntrodzr m ntercepto dferente de zero para o semvarograma. Através do efeto pepta e patamar consegmos determnar o gra de aleatoredade presente nos dados através da segnte epressão E = efeto pepta/patamar = /( + ), na qal: E <,5: componente aleatóra peqena;,5 E,3: componente aleatóra sgnfcatva; E,3: componente aleatóra mto sgnfcatva. Para E,3 temos m modelo de pepta pra, no qal não ocorre covarânca entre os valores e, desta forma, a análse semvarográfca não se aplca, nos revelando, assm, qe devemos tlzar otros métodos de nterpolação. O procedmento a ser eectado para o cálclo do semvarograma depende do tpo de amostragem realzada, sendo mas comm trabalharmos com pontos amostras rreglarmente dstrbídos no espaço.

39 3 Consdere o conjnto de pontos amostrados e reglarmente espaçados em das dmensões (, y), com dstânca ndades de medda (.m.) entre dos pontos consectvos, conforme lstrado na Fgra. Fgra. Amostras reglarmente espaçadas em das dmensões O cálclo do semvarograma em ma determnada dreção deverá ser efetado para as todas as dstâncas (,,...). Sponhamos ma dreção = 9º, então, nclímos no cálclo de *( = 9º, ) todos os pares de pontos amostras na dreção Leste dstantes metros. Em segda, para todos os pares amostras dstantes m, calclamos *( = 9º, ) e, assm, scessvamente, o processo é repetdo para todas as dstâncas, dada ma dreção específca. Qando temos ma amostragem rreglarmente dstrbída no espaço bdmensonal (, y) torna-se mpossível, de nco, encontrarmos pares de amostras sfcentes com eatamente a mesma dstânca para o cálclo do semvarograma em ma determnada dreção. Para evtarmos este problema, devemos defnr ma dstânca de tolerânca para o espaçamento entre os pares de amostras e m ânglo de tolerânca para a dreção consderada. Desta forma, para o cálclo do semvarograma de ma dstrbção rreglar de pontos ao longo de ma dreção, consderamos todas as amostras qe se encontram no ânglo + e, em segda, classfcamos os pares de amostras em classes de dstânca +, +,..., onde é a dstânca básca. Este esqema de seleção dos pares de pontos amostras está lstrado em Fgra 3. Fgra 3. Esqema de obtenção de valores para o semvarograma a partr de ma grade rreglar.

40 3 Após gerarmos o semvarograma epermental, é necessáro ajstarmos ma fnção matemátca qe epresse a estrtra de dependênca espacal da varável regonalzada em estdo. Este ajste de ma fnção matemátca é conhecdo como ajste de modelos teórcos ao semvarograma epermental. O semvarograma como ferramenta básca será tlzado para calclarmos os valores da semvarânca para ma dada dstânca, os qas são necessáros para a organzação do sstema de eqações da krgagem (nterpolação geoestatístca). O semvarograma de pontos, chamado de semvarograma epermental, não serve para este fm, porqe há necessdade de nterpolação e, nvaravelmente, os pontos se apresentarão com ma certa dspersão, prncpalmente para dstâncas grandes, qando o número de pares de amostras va dmnndo. Devdo a este fato, devemos ajstar ma fnção matemátca qe descreva contnadamente a varabldade o correlação espacal estente nos dados. O ajste de modelos teórcos ao semvarograma epermental é feto de manera nteratva, onde, a partr dos parâmetros do semvarograma (modelo, efeto pepta, ampltde e patamar), o semvarograma teórco é desenhado jntamente como os pontos do semvarograma epermental e, se o ajste não for satsfatóro, novos parâmetros são fornecdos e assm scessvamente até qe o ajste seja consderado satsfatóro. A maora dos modelos paramétrcos do semvarograma tlzados na prátca nclrão m efeto pepta e, no caso estaconáro, são dados por: () = + { - ()}. Há dversos tpos de fnções de correlação ( ()) qe podem ser tlzadas sob a condção de postvdade, o seja, () deve ser ma fnção postva-defnda, qe ncorpore as segntes característcas: - (.) é monótona não crescente em (a correlação entre das meddas deca com o ncremento da dstânca entre das localzações amostras); - () qando (a correlação deca para zero para grandes dstâncas de separação); - pelo menos m parâmetro do modelo controla a taa na qal () deca para zero (já qe a dstânca de separação na qal a correlação torna-se nsgnfcante não será conhecda antecpadamente). Dadas as consderações acma, algmas famílas canddatas à fnção de correlação qe normalmente cobrem a generaldade das stações de dspersão de fenômenos espacas são: famíla Esférca, Eponencal Potênca e Matérn.

41 33 defnda por: A famíla de correlação esférca depende de m únco parâmetro de escala e é ( ; ) Sph( ),, A famíla eponencal potênca com dos parâmetros, k e, é defnda por: k ( ) ep{ ( / ) } Pot( ), com > e < k ; Qando k =, temos a famíla de fnção de correlação Eponencal, Ep( ), e qando k = é chamada de fnção de correlação Gassana, Ga( ). A famíla Matérn é epressa por: k k ( ;,k) { ( k)} ( / ) K k ( / ), onde (, k) são parâmetros e K k (.) é a fnção Bessel modfcada de tercero tpo de ordem k. Esta famíla é valda para > e k >. Se k =.5, temos ma fnção de correlação Eponencal, () = ep(-/ ). Para qe o modelo espacal apresente m bom poder predtvo é necessáro ncalmente dentfcarmos se a varável em estdo apresenta ma dreção prvlegada de varabldade, sto é, se este algm efeto eterno qe faz com qe a varável se espalhe mas ntensamente em ma determnada dreção. Neste caso, devemos ncorporar esta tendênca no modelo teórco do semvarograma bscando representar de forma mas adeqada, o mas próma possível da realdade, a varabldade espacal do fenômeno em estdo. As condções ambentas, por eemplo, podem ndzr estes efetos dreconas (vento, formação do solo, etc) e, como conseqüênca, a correlação espacal pode varar com a dreção. Qando sto é verfcado, dzemos qe a dstrbção espacal do fenômeno em estdo, por apresentar m espalhamento mas ntenso em ma determnada dreção, é denomnada ansotrópca. Neste sentdo, para ma correta nferênca sobre a realzação do processo em localzações não meddas, ao modelarmos a estrtra de correlação espacal devemos levar em consderação a estênca da ansotropa, ncorporando as dreções de maor e menor espalhamento da varável regonalzada em estdo. A ansotropa pode ser constatada de dversas maneras, como por eemplo, através da observação dos semvarogramas obtdos para as dferentes dreções convenconadas na

42 34 Geoestatístca: o, 45 o, 9 o e 35 o. Se os semvarogramas são dstntos nestas dreções, o modelo é denomnado ansotrópco. Se do contráro, o seja, se o semvarograma apresenta ma forma semelhante em todas as dreções no espaço, a estrtra do fenômeno é denomnada sotrópca, sem dreções prvlegadas de varabldade. Otra forma de detectá-la é através do esboço de m gráfco de ma elpse, também denomnado dagrama da rosa, calclado através dos alcances obtdos em dreções dstntas. Otra opção, consderada por CAMARGO (997) como a forma mas dreta e efcente para se dentfcar a presença da ansotropa, é a tlzação do mapa de semvarograma, o semvarograma de sperfíce, m gráfco em D qe lstra a varabldade espacal do fenômeno em estdo e qe nos permte dentfcar os eos de ansotropa, onde o eo maor da elpse corresponderá a dreção de maor varabldade do fenômeno nos ndcando, assm, o ânglo de ansotropa e, o eo menor (ortogonal ao maor) lstrará a dreção de menor varabldade. A forma mas comm de ansotropa sege o comportamento de ansotropa geométrca, Fgra 4, onde observamos m patamar constante e alcances varando conforme as dreções. Fgra 4. Ansotropa geométrca, onde e dentfcam, respectvamente, os ânglos de maor e menor espalhamento do fenômeno em estdo, e são ses alcances, é o efeto pepta e + o patamar. Para modelarmos a ansotropa geométrca devemos proceder da segnte forma: (a) dentfcar as dreções de maor ( ) e menor ( ) varabldade espacal (lembrese qe é ortogonal à ); (b) constrr o semvarograma epermental para cada ma destas dreções;

43 35 (c) ajstar os modelos teórcos de semvarograma tlzando ma fnção de correlação aproprada para epressar a estrtra de dependênca espacal da varável em estdo para cada ma das dreções acma ctadas e dentfcar ses parâmetros estrtras (patamar, efeto pepta e alcance); (d) ma vez defndos os modelos de semvarograma relatvos às dreções e, () e () respectvamente, elaboramos m únco modelo, (), para qalqer dstânca e dreção de, como especfcado a segr. Sabemos qe esta fnção de correlação depende de, qe é m vetor com componente dstânca e dreção e qe tem se módlo decomposto da segnte forma: e lstrado em Fgra 5. (, (6) ) ( ) Fgra 5. Decomposção genérca do vetor. Para a dreção de análse, o vetor não poss componente na dreção, o seja, para temos qe = 9º e, portanto, =.sen(9º) = e =.cos(9º) =. Normalzando (6) em relação ao alcance ( ), temos qe: (7) Como a componente é sempre nla, podemos atrbr m alcance nfnto na dreção. Desta forma, a eqação (7) pode ser reescrta na forma: lm a a (8) são defndos como: Assm, os modelos normalzados dos semvarogramas relatvos às dreções e

44 36 ( ) lm a a e (9) ( ) lm a a, () em qe e dentfcam, respectvamente, os ânglos de maor e menor espalhamento do fenômeno em estdo, e são ses alcances, é o efeto pepta, + o patamar e lm a a e lm a a são as fnções de correlação para cada dreção. Fnalmente, ma vez defndos os modelos de semvarograma relatvos às dreções e, elaboramos m únco modelo para qalqer dstânca e dreção de, epresso através da segnte eqação: ( ), () Um otro tpo de ansotropa qe pode ser verfcada é a denomnada ansotropa zonal onde a ampltde permanece constante e o patamar vara de acordo com a dreção. É m caso não mto freqüente nos fenômenos natras. O mas comm é encontrarmos combnações de ansotropa geométrca e zonal, denomnada ansotropa combnada o msta, qando as váras dreções resltam em dferentes semvarogramas, varando tanto a ampltde qanto o patamar (Fgra 6). Fgra 6. Ansotropa combnada e sa decomposção (em faas) para modelagem, onde é o ânglo de ansotropa, se alcance, se efeto pepta e + se patamar, é ânglo de menor espalhamento do fenômeno, se alcance, se efeto pepta e + se patamar.

45 37 Para modelarmos a ansotropa combnada segmos ncalmente os mesmos procedmentos (a), (b) e (c) ctados na modelagem da ansotropa geométrca, mas, para gerar o modelo completo tlzamos ma técnca qe consste em dvdrmos o gráfco do semvarograma teórco em faas, conforme lstrado em Fgra 6, de modo qe cada faa represente somente ma ansotropa geométrca. Desta forma, teremos qatro estrtras: ( () ) ( ) lm( ) (3) 3 ( ) ( ) (4) 4 ( ) lm( ) a a, (5) O modelo completo e consstente para qalqer dstânca e dreção do vetor resme-se na soma das qatro estrtras acma defndas: () = () + () + 3() + 4(). Os métodos de ajste dos modelos podem ser dvddos em dos grandes grpos: A) ajste dos modelos ao semvarograma epermental os métodos de ajste deste grpo são: método dos Mínmos Qadrados Ordnáros (Ordnary Least Sqares - OLS), método dos Mínmos Qadrados Ponderados (Weght Least Sqares WLS) e método de ajste denomnado de a sentmento ; B) método de ajste de m modelo dreto aos dados Método da Máma Verossmlhança (Mamm Lkelhood ML). Eplctaremos melhor somente os métodos dos Mínmos Qadrados Ordnáros e o dos Mínmos Qadrados Ponderados segndo os procedmentos apresentados por JIAN et al. (996). Seja ˆ( ) a forma vetoral de m semvarograma epermental contendo k estmatvas para valores ncrementados do lag, o seja, ( ) [ˆ( ), ˆ( ),..., ˆ( )] ˆ k e seja (, ) = [ (, ), (, ),..., ( k, )] m vetor com valores do modelo de semvarograma de nteresse com parâmetros desconhecdos = [,,..., p].

46 38 Seja, também, R, m valor qe representa a dferença da soma de qadrados entre os valores observados e os estmados pelo modelo, epresso por: R T ˆ ( ) (, ) V ˆ( ) (, ) O melhor conjnto de parâmetros é aqele qe mnmza R. Na estmatva dos parâmetros do semvarograma va Mínmos Qadrados Ordnáros, V é gal a matrz dentdade e, portanto, a mnmzação de R é dreta. Otra partclardade é qe este método spõe qe as dferenças são ndependentes, normalmente dstrbídas e qe todos os valores estmados têm a mesma varânca. A estmatva pelo Método dos Mínmos Qadrados Ponderados consdera para V somente os termos da dagonal prncpal da matrz de varânca/covarânca. Este método tlza teração, qe é rápda, pos todos os elementos fora da dagonal prncpal são assmdos como sendo zero, logo a nversão desta matrz é trval (a nversão de ma matrz dagonal é também ma matrz dagonal). Neste caso, cada dferença é ponderada dretamente pelo nverso da varânca do semvarograma epermental. O método de ajste a sentmento é sbjetvo e depende da eperênca do pesqsador, já qe consste em m ajste vsal do modelo seleconado aos pontos do semvarograma epermental. Fnalmente, o método de ajste dreto aos dados, Método da Máma Verossmlhança, qando aplcado a amostras grandes, nos fornece estmadores não vcados e efcentes. A déa neste caso é obter, a partr de ma amostra, o estmador mas verossímel dos parâmetros de m certo modelo probablístco. A avalação do desempenho de cada modelo geoestatístco pode ser efetada através do crtéro de nformação de Akake, AIC. A estmava deste crtéro é epressa por: R AIC ˆ m n ln p n, onde n é o número de pontos do semvarograma epermental e p é o número de parâmetros do modelo. Decdremos, então, a escolha dos parâmetros do modelo com o menor valor de AIC, o modelo mas parcmonoso. Fnalmente, após o ajste do modelo proposto, procedemos a análse geoestatístca eectando a valdação do modelo, ma técnca qe nos permte avalar a adeqação do modelo escolhdo, o seja, nos permte avalar o gra de ncerteza sobre os parâmetros tlzados.

47 39 Neste procedmento cada valor orgnal é removdo do domíno espacal e, sando-se os demas, m novo valor é estmado para este ponto através dos parâmetros ajstados ao modelo do semvarograma. A valdação não nos permte provar qe o modelo adotado é o mas correto, mas sm qe ele não é nteramente ncorreto.

48 4 3 - MATERIAL E MÉTODOS 3. Materal O Banco de Dados Os dados a serem aq analsados são provenentes de m projeto nttlado Estdo da relação entre ndcadores entomológcos para Aedes (Stegomya) aegypt obtdos de armadlhas adltcdas, de ovposção e de coleta de adltos, em área da regão noroeste do estado de São Palo (CHIARAVALLOTI-NETO et al. (4), Facldade de Medcna de São José do Ro Preto) qe poss como objetvo geral avalar, para o Aedes aegypt, as relações entre os ndcadores entomológcos obtdos através de armadlhas adltcdas e de ovposção e através de coletas de adltos e os ndcadores clmátcos na cdade de Mrassol, lotada na regão noroeste do estado de São Palo. Nesta dssertação vamos trabalhar com os dados das armadlhas adltcdas, Mosqtrap, bscando encontrar modelos qe eplqem bem os dados observados. A Mosqtrap é ma armadlha qe captra a fêmea grávda do pernlongo. Fo desenvolvda pelo Professor Álvaro Eras do Insttto de Cêncas Bológcas da Unversdade Federal de Mnas Geras (EIRAS, ). Em se nteror, ela poss ma sbstânca vscosa qe mpede a fêmea grávda de sar. Esta sbstânca, qe contém o feromôno para atrar o nseto, também fo desenvolvda por EIRAS e é denomnada AtrAedes. As armadlhas Mosqtrap foram dstrbídas em das áreas de estdo com amostragens dstntas. A prmera área de análse, aq denomnada A, é consttída por qadras e a segnda área, nttlada A4, engloba 3 qadras. Em cada qarterão da área A foram nstaladas armadlhas adltcdas com alternânca da dreção, ora na dreção norte-sl, ora na dreção leste-oeste. Assm, nesta área A, temos ma amostragem de observações georeferencadas, ma Mosqtrap por qadra. Na segnda área de análse, A4, temos ma amostragem de observações georeferencadas, 4 armadlhas adltcdas por qadra. Este cenáro está lstrado em Fgra 7.

49 4 + mosqtraps da área A mosqtraps da área A4 Fgra 7. Mapa da cdade de Mrassol/SP com a localzação das armadlhas para cada área de análse. Para tentar eplcar a presença/comportamento das fêmeas Aedes captradas foram anda coletados dados das segntes varáves meteorológcas: temperatra mínma, temperatra máma, temperatra méda e plvosdade. Smaramente, nesta análse trabalhamos com dados das armadlhas adltcdas de casas stadas em qarterões, ma armadlha por qadra - área A, e 3 qarterões, qatro armadlhas por qadra - área A4, coletados drante 3 semanas (Tabela ). Neste conteto, para a área A temos m total de.3 observações sendo a qadra a ndade amostral e, na área A4, temos.76 valores observados e o domcílo consderado como ndade amostral. Assm, a varável de análse é o número de fêmeas Aedes aegypt captradas em armadlhas adltcdas e as covaráves são temperatra mínma, temperatra máma, temperatra méda e plvosdade. Vale salentar, anda, qe possímos nformações das varáves meteorológcas referentes ao da da coleta e de até das atrás, portanto, temos 88 varáves eplcatvas qe podem ser ncorporadas ao modelo.

50 4 Tabela. Datas das coletas para cada semana e área de análse Coleta Semana A A4 / a 5//4 //4 9/ a //4 9//4 3 6/ a 9//4 6//4 4 3/ a 6//4 3//4 5 / a 3//4 //4 6 7/ a 3//4 7//4 7 3/ a 6//5 3//5 8 / a 3//5 //5 9 7/ a //5 7//5 4/ a 7//5 4//5 3/ a 3//5 3//5 7/ a //5 7//5 3 4/ a 7//5 4//5 4 / a 4//5 //5 5 8/ a 3/3/5 8//5 6 7/3 a /3/5 7/3/5 7 4/3 a 7/3/5 4/3/5 8 /3 a 4/3/5 /3/5 9 8/3 a 3/3/5 8/3/5 4/4 a 7/4/5 4/4/5 /4 a 4/4/5 /4/5 8/4 a /4/5 8/4/5 3 5/4 a 8/4/5 5/4/5 3. Metodologa Para relaconarmos a qantdade de Aedes captradas com as varáves meteorológcas, por se tratar de dados de contagem, ncalmente podemos spor qe a varável resposta assme ma dstrbção de Posson e a fnção de lgação logarítmca. Em ma prmera análse, para ambas as áreas de amostragem, A e A4, ajstamos modelos tlzando a metodologa de Modelos Lneares Generalzados e, posterormente, somente para a área A, ncorporamos a correlação temporal através da modelagem va teora de Eqações de Estmação Generalzadas, ma vez qe dentfcamos ma estrtra de correlação ato-regressva de ordem. Na área A4, possvelmente devdo ao esqema de amostragem tlzado, não detectamos ma estrtra de correlação temporal e, portanto, não efetamos ajstes va EEG para eplcarmos a presença do Aedes nesta área. Somente para facltar a apresentação dos resltados denomnamos estes modelos por: - Mosqtrap_A MLG; - Mosqtrap_A EEG; - Mosqtrap_A4 MLG.

51 43 Através desta nomenclatra estamos especfcando, para cada m deles, a varável resposta objeto da análse (Y = mosqtrap, o seja, o número de fêmeas Aedes aegypt captradas pela armadlha adltcda mosqtrap), a área de amostragem em qestão (A o A4) e a teora tlzada para o ajste do modelo (MLG o EEG). As seleções de varáves eplcatvas dos modelos acma ctados foram efetadas através das fnções stepwse_glm e stepwse_gee desenvolvdas em R. Elaboramos estas fnções, pos não encontramos procedmentos stepwse desenvolvdos para modelagem por MLG com termos fos, como no nosso caso, onde a qadra fo consderada como bloco para a área A e o domcílo para a área A4. Stepwse_gee fo desenvolvda, pos, até então, não tínhamos conhecmento da mplantação deste método em R o em SAS, softwares dsponíves no DEs/UFSCar. Utlzamos o procedmento stepwse ma vez qe se so é ndcado qando o número de covaráves é grande, e adotamos como crtéro de seleção o valor p, o nível descrtvo do teste, tendo sdo determnado m valor p de 5% para a entrada e % para a retrada da covarável. Para o so da fnção stepwse_glm (Apêndce C C) é necessáro fornecermos os segntes parâmetros: - Y, a varável resposta; - VE, m vetor contendo o nome (tpo teto, portanto, especfcado entre aspas dplas) de todas as varáves eplcatvas qe podem ser ntrodzdas no modelo; - PDADOS, o nome do objeto qe contém o banco de dados; - FAMILIA, dentfcando a dstrbção da varável resposta e a fnção de lgação tlzada. Por eemplo, FAMILIA = posson(lnk=log); - NIVEL, o nível de sgnfcânca tlzado para ntrodzr a varável no modelo; - NIVEL_RET, o nível de sgnfcânca tlzado para retrar a varável do modelo; - TERMO_OBR, m vetor contendo o nome (tpo teto, portanto, especfcado entre aspas dplas) de termos obrgatóros do modelo. Por eemplo, TERMO_OBR = c( factor(qadra) ) o TERMO_OBR = c( X, X ), se não hover covaráves fas, devemos defnr m valor ncal para este parâmetro da segnte forma: TERMO_OBR = c();

52 44 - NUM_PAR, o número de parâmetros fos do modelo. Por eemplo, se for somente o ntercepto, NUM_PAR =. Se tver m termo obrgatóro do tpo fator, lembre-se qe o R ncorpora m dos níves do fator como ntercepto, assm, como no nosso caso em qe consderamos a qadra como fator ( qadras), temos NUM_PAR = já qe ma qadra é o ntercepto. Se, TERMO_OBR = c( X, X ), então NUM_PAR = 3, o ntercepto e das covaráves, X e X, fas no modelo. Para o so da fnção stepwse_gee (Apêndce C C) são solctados os segntes parâmetros: - Y, a varável resposta; - VE, m vetor contendo o nome (tpo teto, portanto, especfcado entre aspas dplas) de todas as varáves eplcatvas qe podem ser ntrodzdas no modelo; - PID, a ndade de repetção; - PDADOS, o nome do objeto qe contém o banco de dados; - FAMILIA, dentfcando a dstrbção da varável resposta e a fnção de lgação tlzada (por eemplo, FAMILIA = posson(lnk= log )); - ESTRUTURA, dentfcando a estrtra da matrz de correlação de trabalho (do tpo teto). Por eemplo, ESTRUTURA = ar ; - NIVEL, o nível de sgnfcânca tlzado para ntrodzr a varável no modelo; - NIVEL_RET, o nível de sgnfcânca tlzado para retrar a varável do modelo; - TERMO_OBR, m vetor contendo o nome (tpo teto, portanto, especfcado entre aspas dplas) de termos obrgatóros do modelo; - NUM_PAR, o número de parâmetros fos do modelo. A fnção stepwse_glm desenvolvda ajsta os modelos através da fnção glm do R e, portanto, as famílas e fnções de lgações se restrngem àqelas presentes na fnção glm. A fnção stepwse_gee tlza no ajste a fnção geeglm, presente no pacote geepack do R e, assm, as famílas, as fnções de lgações e as estrtras da matrz de correlação de trabalho se restrngem àqelas presentes na fnção geeglm. Como ma tentatva de dentfcarmos o rao de correlação das amostras e a dreção prvlegada da varabldade espacal do número de fêmeas Aedes captradas por armadlhas adltcdas, o melhor, para dentfcarmos sa estrtra de correlação espacal, prossegmos

53 45 nosso estdo efetando modelagens va teora de Geoestatístca para qe ações de controle mas precsas possam ser realzadas. As modelagens va teora de Geoestatístca foram efetadas através do software Sprng, Sstema para Processamento de Informações Georeferencadas, m banco de dados geográfco desenvolvdo pelo INPE (Insttto Naconal de Pesqsas Espacas). Com esta análse obtvemos os alcances de maor e menor espalhamento do fenômeno em estdo, denomnados respectvamente de Alcance e Alcance. Em ma últma etapa deste estdo, ajstamos modelos para tentar relaconar os alcances de correlação das amostras com as varáves meteorológcas. Para esta nova varável resposta, do tpo contína, assmmos ma dstrbção Gama e ma fnção de lgação logarítmca. Para os alcances da área A, ma vez qe não dentfcamos a estênca de ma correlação temporal, ajstamos modelos va teora de MLG e tlzamos a fnção stepwse_glm para seleconarmos as covaráves, com níves de entrada e retrada gas a,5%. Os alcances da área A4 também não nos revelaram a estênca de ma estrtra de dependênca temporal e, por sso, ajstamos modelos va teora de MLG tlzando a fnção stepwse_glm para dentfcarmos as varáves eplcatvas mas sgnfcatvas, também com níves de entrada e retrada gas a,5%. Ao tentarmos dentfcar as covaráves qe pdessem eplcar os alcances da área A4, va fnção glm do R, verfcamos qe o algortmo não converga e, portanto, não consegmos, neste momento, dentfcar m modelo para jstfcar os resltados obtdos para as varáves respostas em qestão (alcance e alcance área A4). Assm como anterormente, para facltar a apresentação dos resltados, vamos denomnar estes últmos modelos analsados por: - Alcance_A MLG; - Alcance_A MLG. Novamente esta nomenclatra fo tlzada para qe se dentfqe, para cada m deles, a varável resposta objeto da análse (Alcance o Alcance, representando, respectvamente, os alcances de maor e menor espalhamento do fenômeno em estdo), a área de amostragem (A) e a teora tlzada para o ajste do modelo (MLG). Os modelos consderados neste estdo são apresentados a segr.

54 Aplcação dos Modelos Lneares Generalzados na modelagem do número de fêmeas Aedes aegypt captradas em armadlhas adltcdas, modelos: Mosqtrap_A MLG e Mosqtrap_A4 - MLG Seja Y o número de fêmeas Aedes aegypt captradas em armadlhas adltcdas. Assmmos qe varável resposta poss ma dstrbção de Posson (Y ~ Posson( )), com fnção densdade probabldade (f.d.p.) dada por: obtendo-se Temos, então, y e f ( y; ) I A( y), ; A y!,,... f ( y; ) ep y ln( ) ln( y!) I ( y), a( ) =, = ln e =, b( ) = e e c(y; ) = - ln y!. Desta forma, mostramos qe a dstrbção de Posson pertence à famíla eponencal na forma dada por eqação (). Assm, temos qe a esperança de Y é dada por com varânca epressa por onde V( ) = e = E[Y] = b ( ) = e =, Var[Y] = a( )b ( ) = a( )V( ) = e = é sa fnção de varânca. Como assmmos ma fnção de lgação logarítmca, o seja, = g( ) = ln( ), temos qe o modelo log-lnear, consderando-se a ndade amostral como m fator (sendo a qadra para a área A e o domcílo para a área A4), será epresso por: onde = ep{fator(ndade_amostral)+ } = ep{fator(qadra)+x }, X = (,,..., n ) é a matrz do modelo; = (,, 3,..., p) é o vetor de parâmetros desconhecdos, onde, no nosso caso, podemos ter até 89 parâmetros; = (,,..., n) é o predtor lnear; = (,, 3,..., n), é o vetor de médas, o seja, E(Y )=, =,..., n, com n =.3 observações para a área A ( qadras analsadas drante 3 semanas) e n =.76 observações para a área A4 ( domcílos analsados drante 3 semanas). A fnção devance para o modelo de Posson é epressa por: A.

55 47 D( y;ˆ ) n n y w ˆ y [log y ˆ b( ˆ ln ˆ ) ] b( ˆ y ) ˆ n w y log y ˆ ( y ˆ ) A estatístca de Pearson X generalzada é dada por: X n w y V ˆ ˆ n w y ˆ ˆ. 3.. Aplcação das Eqações de Estmação Generalzadas na modelagem do número de fêmeas Aedes aegypt captradas em armadlhas adltcdas, modelo: Mosqtrap_A EEG Seja a varável aleatóra Y o número de fêmeas Aedes aegypt captradas em armadlhas adltcdas. Com a aplcação desta teora consderamos as varáves respostas, Y j, =,,..., K, j =,,..., n, representando a j-ésma semana medda da -ésma ndade amostral (para a área A temos k = qadras e n = 3), como sendo dependentes. A dentfcação da estrtra de correlação fo efetada através do correlograma, ma representação gráfca das atocorrelações de m conjnto de dados, qe nos revelo a estênca de ma estrtra ato-regressva de ordem, AR(), para a área A. Assm, temos qe a matrz de trabalho R ( ) apresenta a segnte estrtra de correlação entre as meddas repetdas: 3 R ( ) =, 33 onde =,,..., qadras e ˆ k K r r j n j n, j, com r j y j µ ˆ V(µ ˆ j j ) (resído de Pearson). Como k = qadras, n = 3 semanas, = e V µ ˆ j µ ˆ j a fnção de varânca para a dstrbção de Posson, temos qe: ˆ r r, j r r, j, j 3 j j j

56 48 onde yj µˆ j r j. µˆ j 3..3 Aplcação da Geoestatístca para dentfcar a estrtra de dependênca espacal do número de fêmeas Aedes aegypt captradas em armadlhas adltcdas Para cada ma das 3 semanas de cada área de análse (A e A4) detectamos ncalmente a presença o não da ansotropa através do mapa de semvarograma, o semvarograma de sperfíce. Após dentfcarmos as dreções de maor e menor varabldade espacal, prossegmos a análse constrndo o semvarograma epermental para cada ma destas dreções. Neste estdo temos ma amostragem rreglarmente dstrbída nas das áreas de análse e, desta forma, para o cálclo do semvarograma epermental defnmos os parâmetros do lag, a dstânca de tolerânca para o espaçamento entre os pares de amostras, e os parâmetros de dreção, m ânglo de tolerânca para a dreção consderada. Nesta etapa, alternadamente, constrímos o semvarograma epermental e ajstamos dversos modelos, da segnte forma: alterávamos os parâmetros do lag (nº do lag, ncremento e tolerânca) e constríamos o semvarograma epermental, em segda, ajstávamos m modelo especfcando ma determnada fnção de correlação e analsávamos o resltado prodzdo pelo Sprng em ma tela denomnada Modelo de Ajste, lstrada em Fgra 8. Esta tela apresentava grafcamente o ajste do modelo teórco escolhdo e os lags do semvarograma epermental, nos permtndo avalar vsalmente se o ajste é o não satsfatóro. Além destes resltados, o Sprng também apresenta m conjnto de nformações na tela Relatóro de Dados, tas como, fnção de correlação escolhda e os parâmetros estrtras do modelo: efeto pepta, contrbção e alcance, além do valor de Akake, ndcador do ajste realzado. Neste ponto, seleconávamos os valores dos parâmetros estrtras com menor valor de Akake para compará-lo com otros ajstes realzados. Escolhdo os valores dos parâmetros estrtras do semvarograma, calclávamos, então, o gra de aleatoredade presente nos dados (E = patamar/efeto pepta) para verfcarmos se possíamos m modelo de pepta pra, stação na qal a aplcação da análse semvarográfca não se aplca. Prossegmos, então, segndo os procedmentos acma ctados e, após dentfcarmos o modelo com a fnção de correlação sposta adeqada para epressar a estrtra de dependênca espacal do fenômeno em estdo e os parâmetros estrtras do semvarograma teórco, defnmos e valdamos os modelos de semvarograma para cada ma das semanas de

57 49 análse. Vale salentar qe o modelo escolhdo fo aqele qe apresento o menor valor de Akake, já qe este valor nos ndca qe o modelo de ajste é mas precso. Fgra 8. Tela do Sprng denomnada Modelo de Ajste qe apresenta grafcamente o ajste do modelo teórco escolhdo (lnha) e os lags do semvarograma epermental (pontos) É mportante ressaltar qe a modelagem o ajste do semvarograma fo realzada no Sprng no modo atomátco, qe tlza o algortmo de JIAN et al. (996), baseado no método dos mínmos qadrados para estmar os parâmetros estrtras do modelo. A valdação do modelo no Sprng, realzada para avalar gra de ncerteza sobre os parâmetros tlzados, o seja, avalar o erro da estmatva, resme-se em re-estmar os valores conhecdos através dos parâmetros ajstados ao modelo do semvarograma. Para qe conclsões possam ser defndas, este módlo nos fornece o dagrama espacal do erro, hstograma do erro, estatístcas do erro, o dagrama dos valores observados estmados e resltados nmércos Aplcação dos Modelos Lneares Generalzados na modelagem dos alcances de maor e menor espalhamento do número de fêmeas Aedes aegypt captradas em armadlhas adltcdas na área de amostragem A, modelos: Alcance_A MLG e Alcance_A - MLG Assmmos ndependênca das observações ma vez qe os correlogramas constrídos para ambos alcances não nos ndco a estênca de dependênca temporal. Sejam X e Z as varáves aleatóras dos alcances Alcance e Alcance, representando, respectvamente, o rao de maor e menor espalhamento do fenômeno em estdo. A dstrbção padrão a ser assmda é a Gama, assm, X ~ G (, ) e Z ~ G z ( z, z), com fnção densdade probabldade (f.d.p.) dada por: v v v f ( ;, v ) ep I A( ),, ; A, v v

58 5 onde e d,. Temos, então, f ( ;, v ) ep v ln v ln v ln ln ( v ) I ( ) A obtendo-se a ( ),, b( ) = - ln(- ) e c(; ) = v ln(v ) ln ln (v ). Mostramos, portanto, qe a dstrbção Gama pertence à famíla eponencal na forma dada por eqação (). Desta forma, temos qe a esperança de X é dada por: E[X] = b ( ) = =, com varânca epressa por onde V( ) = é sa fnção de varânca. Var[X] = a( )b ( ) = a( )V( ) = v, Como assmmos ma fnção de lgação logarítmca, o seja, = g( ) = ln( ), temos qe o modelo log-lnear, consderando-se a qadra como m fator, será epresso por: = ep{fator(qadra)+ } = ep{fator(qadra)+c }, onde C = (c, c,...,c n ) é a matrz do modelo; = (,, 3,..., p) é o vetor de parâmetros desconhecdos, onde, no nosso caso, podemos ter até 89 parâmetros; = (,,..., n) é o predtor lnear; = (,, 3,..., n), é o vetor de médas, o seja, E(X )=, =,..., n, com n = 6 observações, já qe temos qadras analsadas drante 6 semanas 7 semanas não pderam ser modeladas va teora da Geoestatístca. A fnção devance para o modelo Gama é epressa por:

59 5 n n n w v w v b b v D ˆ ˆ ˆ ln ˆ ln ln ˆ ) (ˆ ) (ˆ ˆ ˆ ˆ ) ; ( µ A estatístca de Pearson X generalzada é dada por: n n w V w X ˆ ˆ ˆ ˆ. Por smetra, temos E[Z] = b ( ) = = z e Var[Z] = a( )b ( ) = a( )V( z ) = z z v.

60 5 4 RESULTADOS E DISCUSSÃO 4. Resltados dos modelos elaborados para estdar a varável resposta Y, o número de fêmeas Aedes captradas em armadlhas adltcdas áreas A e A4 Em ma análse descrtva ncal, constrímos os hstogramas da varável resposta Y das áreas A e A4, e, em segda, comparamos os valores observados destas amostras com ma dstrbção de Posson, através da sobreposção dos hstogramas, conforme lstrado em Fgra 9 e Fgra. Através dos resltados gráfcos obtdos, conclímos qe a sposção da dstrbção de Posson para a varável dependente Y, pode ser consderada nesta análse ncal, havendo, anda, a necessdade de confrmar a adeqação da fnção de lgação logarítmca. Fgra 9. Hstograma da varável resposta Y área A à esqerda e sobreposção de hstogramas: amostra observada (transparente) e dstrbção de Posson (cnza) à dreta. Fgra. Hstograma da amostra mosqtrap área A4 à esqerda e sobreposção de hstogramas: amostra observada (transparente) e dstrbção de Posson (cnza) à dreta. Em segda, para tentar relaconar Y, a qantdade de fêmeas Aedes captradas em armadlhas adltcdas, com as varáves meteorológcas, ajstamos, então, os modelos: Mosqtrap_A MLG, onde a qadra fo consderada bloco e Mosqtrap_A4 - MLG, onde

61 53 os domcílos foram consderados como blocos; e o modelo Mosqtrap_A EEG, sendo a qadra a ndade de repetção. 4.. Ajste do modelo Mosqtrap_A - MLG O modelo obtdo, as estmatvas dos parâmetros e ses respectvos desvos padrão foram: ˆ,59 (,93),69Q,plv (,7) 8 (,)... (,) (,46),5t ma,5q 9 * 5,79Q (,5) 6 (,8),plv 3...,98Q,5t ma (,) * 4 (,48) 5...,87Q,8t mn (,3) 79 (,49) ** 4,79Q 8 (,8)...,79Q 94 (,8)... onde nível:,; **,; *,5;, Verfcamos, também, a adeqabldade da fnção de lgação adconando ˆ como ma covarável etra e eamnamos a mdança ocorrda na devance. Como não hove ma dmnção drástca na devance (445,8 444,78 =,3), evdencamos qe a fnção de lgação logarítmca está adeqada. Os resltados apresentados em Tabela 3 mostram o valor da devance do modelo em estdo e deste mesmo modelo adconando-se ˆ. Tabela 3. Adeqabldade da fnção de lgação logarítmca para o modelo Mosqtrap_A - MLG Modelo GL Devance Df. de Resdal Devances Y = fator(qadra) + plv8 + tma9 + plv3 + tma5 + tmn ,8 Y = fator(qadra) + plv8 + tma9 + plv3 + tma5 + tmn4 + ˆ ,78,3 A contrbção de cada covarável no modelo sob pesqsa está apresentada na Tabela 4 de análse seqüencal. Tabela 4. ANODEV Tpo I modelo Mosqtrap_A - MLG Fonte de Devance GL valor p varação Regressão 337,98 4 factor(qadra) 6, 99,66e-6 plv8 38,48 5,535e- tma9 5,4 9,987e-5 plv3 8,33 3,897e-3 tma5 5,76, tmn4 8,7 4,56e-3 Resído 445,8 95 Total 783,6 99

62 54 Pela Tabela 4, observando o valor p da regressão, conclímos qe há evdêncas, a m nível de 5% de probabldade, qe o modelo proposto está bem ajstado aos dados, havendo, anda, a necessdade de analsar os resídos. A Tabela 4 mostra, anda, qe todas as varáves ndependentes são sgnfcatvas na presença das demas. Para verfcarmos se m termo no predtor lnear pdesse ser melhor epresso como h(; ) para algma fnção monótona h(; ), constrímos os gráfcos de resídos parcas qe nos revelaram qe as escalas das covaráves são satsfatóras, ma vez qe apresentaram ma tendênca lnear. Em ma análse gráfca dos resídos (r ) verss valores predtos, verfcamos qe modelo não está adeqado ma vez qe os pontos não estão espalhados de forma aleatóra em torno de r =, há ma tendênca como está apresentado na Fgra. Fgra. Gráfco de resídos verss valores ajstados para o modelo Mosqtrap_A - MLG Fo traçado, também, o gráfco normal de probabldades com envelope para os componentes padronzados do desvo, conforme lstra a Fgra. Notamos qe os valores etremos estão dstantes de ma dstrbção Posson.

63 55 Fgra. Gráfco normal de probabldades com envelope smlado para o modelo Mosqtrap_A - MLG Através do gráfco da dstânca de Cook detectamos as observações 863, e 79 como aberrantes (Fgra 3). Fgra 3. Gráfco da dstânca de Cook para o modelo Mosqtrap_A - MLG Fnalzando as análses de dagnóstcos deste modelo, constrímos os hstogramas dos resídos da devance e de Pearson. Observamos qe os gráfcos não apresentaram a normaldade desejada, nos revelando, portanto, a não adeqacdade do modelo ajstado.

64 56 Fgra 4. Hstograma dos resídos da devance e de Pearson - modelo Mosqtrap_A - MLG Como ma tentatva de encontrar m modelo qe melhor se adeqe aos dados, eclímos os dos maores pontos aberrantes dentfcados e realzamos m novo ajste. Este novo ajste apresento resltados semelhantes ao ajste anteror com relação às análses de dagnóstcos, não contrbndo, então, para qe o objetvo acma ctado fosse alcançado. Realzamos, anda, o procedmento stepwse_glm assmndo ma dstrbção de Posson e a fnção de lgação dentdade e raz qadrada, mas o algortmo da fnção glm do R não converg. 4.. Ajste do modelo Mosqtrap_A - EEG Constatamos, através das análses gráfcas apresentadas pela Fgra 5, qe devemos assmr ma estrtra de correlação ato-regressva de ordem.

65 57 Fgra 5. Correlogramas das qadras 3 e 3 foram: O modelo obtdo, as estmatvas dos parâmetros e ses respectvos desvos padrão ˆ, 79 (, 3 ), plv 8 (, ), 7t mn (, ) **, 5t ma (, ) * 9, 8tmed (, 3 ) **, 6t mn (, ) * Prossegndo a análse de dagnóstco deste modelo, constrímos os hstogramas dos resídos ordnáros e o de Pearson. Observe, através da Fgra 6, qe ambos os gráfcos não apresentaram a normaldade desejada, nos ndcando m ajste nadeqado. Fgra 6. Hstogramas dos resídos Ordnáro (esqerda) e de Pearson (dreta) modelo Mosqtrap_A - EEG Os gráfcos de valores predtos verss resídos ordnáros e de valores predtos verss resídos de Pearson nos confrmaram m ajste rm, ma vez qe os pontos não estão espalhados de forma aleatóra, mas sm apresentaram ma tendênca não desejada nesta análse nformal mostrada na Fgra 7.

66 58 Fgra 7. Gráfco de valores predtos verss resídos ordnáros (esqerda) e valores predtos verss resídos de Pearson (dreta) modelo Mosqtrap_A - EEG 4..3 Ajste do modelo Mosqtrap_A4 - MLG Spondo ma dstrbção de Posson e a fnção de lgação logarítmca, e, anda, consderando o domcílo como fator, o modelo obtdo, as estmatvas dos parâmetros e ses desvos padrão é dado por: ˆ, (,88)...,94D 36_ (,69),8D 36_ (,453),94D 36_3 (,69),94D 36_4 (,69)...,94D 36_ (,69)...,94D 36_4 (,69)...,94D 4_ (,69)...,94D 4_4 (,69),94D 4_ (,69)...,94D 45_ (,69)...,3D ** 45_3 (,45)...,94D 46_ (,69),94D 46_3 (,69)...,94D 47_3 (,69),94D 47_4 (,69),94D 447_ (,69)...,94D 45- (,69)...,94D 45_3 (,69)...,76D 458_4 (,457)...,94D 56_ (,69),94D 56_3 (,69)...,94D 57_4 (,69)...,94D 535_ (,69)...,plv (,) 9, tmn 5 (,3),4 plv (,6), plv ** 6 (,5),3 plv (,6),8 tmn 9 (,33),8 tmn 7 (,5), plv * 3 (,4) onde nível:,; **,; *,5;, Observe qe a maor parte dos domcílos sgnfcatvos a m nível de 5% de probabldade, eceto D 36_, D 45_3 e D 458_4, apresentaram a mesma estmatva dos parâmetros da regressão e mesmo desvo padrão. O teste da adeqabldade da fnção de lgação, efetado ao acrescentarmos como ma covarável etra no modelo para avalarmos a dferença nas devances, nos revelo ˆ

67 59 qe a fnção de lgação logarítmca não é adeqada a m nível de 5% de probabldade, conforme lstra a Tabela 5. Tabela 5. Verfcando a adeqabldade da fnção de lgação logarítmca para o modelo Mosqtrap_A4 - GLM Devance Modelo GL Resdal Y = fator(domcílo) + plv9 + tmn5 + plv + plv6 + plv + tmn9 + tmn7 + plv ,93 Df. de Devances Y = fator(domcílo) + plv9 + tmn5 + plv + plv6 + plv + tmn9 + tmn7 + plv3 + ˆ ,69,5 Este resltado nos levo a pesqsa de novos modelos. Assmndo ma dstrbção de Posson e fnção de lgação dentdade e raz qadrada tentamos ajstar novos modelos, mas o algortmo da fnção glm do R não converg. Neste conteto, prossegmos apresentando os resltados da análse de dagnóstco deste modelo. A contrbção de cada covarável no modelo sob pesqsa está apresentada na Tabela 6 de análse seqüencal. Tabela 6. ANODEV Tpo I modelo Mosqtrap_A4 - MLG Fonte de varação Devance GL valor p Regressão 57,38 7 factor(domcílo) 397, 9,e-3 plv9 3,9 3,75e-8 tmn5 8,4,777e-5 plv,57,3e-6 plv6,59 3,886e-4 plv,9 5,68e-4 tmn9 8,5,934e-5 tmn7,48,7e-3 plv3 5,77, Resído 799,93 63 Total 37,3 759 A Tabela 6 nos evdenca através do valor p da regressão, a m nível de 5% de probabldade, qe o modelo proposto está bem ajstado aos dados, havendo, anda, a necessdade de analsar os resídos. Observe, anda, qe todas as covaráves são sgnfcatvas na presença das demas. Constrímos, também, os gráfcos dos resídos parcas qe nos revelaram qe as escalas das covaráves são satsfatóras. Através do gráfco dos resídos verss valores predtos, verfcamos qe modelo não está adeqado pos os pontos não estão espalhados de forma aleatóra em torno de r =, há ma tendênca, como vsto na Fgra 8.

68 6 Fgra 8. Gráfco dos resídos verss valores predtos modelo Mosqtrap_A4 MLG O gráfco normal de probabldades com envelope smlado lstrado pela Fgra 9 e os hstogramas dos resídos mostrados na Fgra nos confrmam qe o modelo não se ajsto bem aos dados. Fgra 9. Gráfco normal de probabldades modelo Mosqtrap_A4 MLG Fgra. Hstograma dos resídos da Devance e de Pearson modelo Mosqtrap_A4 - MLG

69 6 O gráfco da dstânca de Cook (Fgra ) nos revelo a estênca das observações 4, 4 e 48 como otlers. Novamente tentamos ajstar novos modelos retrando as observações aberrantes mas, não consegmos encontrar modelos qe pdessem predzer adeqadamente o valor da varável em estdo. Fgra. Gráfco da dstânca de Cook modelo Mosqtrap_A4 - MLG 4..4 Ajste dos modelos va abordagem de Geoestatístca Para detectar a presença da ansotropa foram constrídos os gráfcos do semvarograma de sperfíce para as 3 semanas de cada área de análse. Para a área A - ma observação por qadra - estes gráfcos nos revelaram qe o fenômeno se espalha mas ntensamente na dreção Noroeste-Sdeste para todas as semanas da análse. Na área A4 qatro observações por qadra a dreção de ansotropa dentfcada para a maor parte das semanas é Norte-Sl, eceto para as semanas 6, 4, 5 e, onde a dreção de maor contndade espacal é concordante com a área A, o seja, ocorre mas ntensamente na dreção Noroeste-Sdeste. Após terem sdo dentfcadas as dreções de maor e menor contndade espacal, prossegmos as análses constrndo os semvarogramas epermentas para cada ma destas dreções. Como estamos trabalhando com amostragens rreglarmente dstrbídas, hove a necessdade de defnr os parâmetros do lag e os parâmetros de dreção e, desta forma, város semvarogramas foram constrídos para dferentes valores destes parâmetros. Após testarmos váras tentatvas, qando consegmos prodzr m semvarograma com ma aparênca desejada, escolhemos, então, os valores destes parâmetros, lstrados em Tabela 7, spondo serem os mas adeqados nesta prmera análse.

70 6 Tabela 7. Defnção dos parâmetros do lag e parâmetros de dreção para o cálclo do semvarograma epermental para as áreas A e A4 Área A Área A4 Intervalo Intervalo Tolerânca Tolerânca Semana Lag Incremento de Lag Incremento de anglar anglar tolerânca tolerânca , , , , , , , , , , , , , , , , , , , , Nesta etapa, para a maor parte das semanas, tanto na área A qanto na A4, não consegmos constrr m gráfco de semvarograma deal para ma destas dreções de análse e, neste conteto, assmmos m fenômeno sotrópco para estas semanas em qestão. É mportante destacar qe na área A4, para as semanas qe assmmos m modelo sotrópco, os gráfcos do semvarograma de sperfíce nos ndcaram ma dreção de ansotropa Norte-Sl. Após o ajste de város modelos, dentfcamos, tanto para a área A como A4, a fnção de correlação esférca para algmas semanas e, para otras, a fnção de correlação eponencal como as spostas mas adeqadas para epressar a estrtra de dependênca espacal do fenômeno em estdo, conforme lstra os gráfcos da Fgra.

71 63 (),3,,,9,8,7,6,5,4,3,, Área - Semana dstânca º Teórco º Fnção de correlação: esférca () Área - Semana dstânca 6º 6º Teórco 6º Teórco 6º Fnção de correlação: esférca (),3,,,9,8,7,6,5,4,3,, Área - Semana dstânca (),3,,,9,8,7,6,5,4,3,, Área - Semana dstânca º Teórco º º Teórco º Fnção de correlação: eponencal Fnção de correlação: esférca

72 64 (),3,,,9,8,7,6,5,4,3,, Área - Semana dstânca º º Teórco º Teórco º Fnção de correlação: eponencal (),3,,,9,8,7,6,5,4,3,, Área - Semana dstânca º Teórco º Fnção de correlação: eponencal (),3,,,9,8,7,6,5,4,3,, Área - Semana dstânca () Área - Semana dstânca º Teórco º º Teórco º Fnção de correlação: eponencal Fnção de correlação: esférca

73 65 () Área - Semana dstânca º Teórco º Fnção de correlação: esférca () Área - Semana dstânca 6º 6º Teórco 6º Teórco 6º Fnção de correlação: esférca () Área - Semana dstânca 3º º Teórco 3º Teórco º Fnção de correlação: esférca (),3,,,9,8,7,6,5,4,3,, Área - Semana dstânca º Teórco º Fnção de correlação: eponencal

74 66 () Área - Semana dstânca º Teórco º Fnção de correlação: esférca () Área - Semana dstânca 5º 5º Teórco 5º Teórco 5º Fnção de correlação: esférca () Área - Semana dstânca 5º 95º Teórco 5º Teórco 95º Fnção de correlação: esférca () Área - Semana dstânca 8º 98º Teórco 8º Teórco 98º Fnção de correlação: esférca

75 67 (),3,,,9,8,7,6,5,4,3,, Área - Semana dstânca () Área - Semana dstânca º Teórco º º Teórco º Fnção de correlação: eponencal Fnção de correlação: esférca (),3,,,9,8,7,6,5,4,3,, Área - Semana dstânca () Área - Semana dstânca º Teórco º º Teórco º Fnção de correlação: eponencal Fnção de correlação: esférca

76 68 () Área - Semana dstânca (),3,,,9,8,7,6,5,4,3,, Área - Semana dstânca º Teórco º º Teórco º Fnção de correlação: esférca Fnção de correlação: eponencal () Área - Semana dstânca º Teórco º Fnção de correlação: esférca

77 69 Área 4 - Semana Área 4 - Semana () 3,3 3,7,4,,8,5,,9,6, dstânca () dstânca º Teórco º º Teórco º Fnção de correlação: eponencal Fnção de correlação: esférca Área 4 - Semana 3 Área 4 - Semana 4 () 3,3 3,7,4,,8,5,,9,6, dstânca () 3,3 3,7,4,,8,5,,9,6, dstânca º Teórco º º Teórco º Fnção de correlação: eponencal Fnção de correlação: eponencal

78 7 Área 4 - Semana 5 Área 4 - Semana 6 () dstânca () 3,3 3,7,4,,8,5,,9,6, dstânca º Teórco º º Teórco º Fnção de correlação: esférca Fnção de correlação: eponencal Área 4 - Semana 7 Área 4 - Semana 8 () dstânca () 3,3 3,7,4,,8,5,,9,6, dstânca º Teórco º º Teórco º Fnção de correlação: esférca Fnção de correlação: eponencal

79 7 Área 4 - Semana 9 Área 4 - Semana () dstânca º 9º Teórco º Teórco 9º Fnção de correlação: esférca () dstânca º Teórco º Fnção de correlação: esférca Área 4 - Semana Área 4 - Semana () 3,3 3,7,4,,8,5,,9,6, dstânca () 3,3 3,7,4,,8,5,,9,6, dstânca º Teórco º º Teórco º Fnção de correlação: eponencal Fnção de correlação: eponencal

80 7 Área 4 - Semana 3 Área 4 - Semana 4 () dstânca () 3,3 3,7,4,,8,5,,9,6, dstânca º Teórco º º Teórco º Fnção de correlação: esférca Fnção de correlação: eponencal Área 4 - Semana 5 Área 4 - Semana 6 () dstânca 58º 48º Teórco 58º Teórco 48º Fnção de correlação: esférca () dstânca º Teórco º Fnção de correlação: esférca

81 73 Área 4 - Semana 7 Área 4 - Semana 8 () 3,3 3,7,4,,8,5,,9,6, dstânca () dstânca º Teórco º º Teórco º Fnção de correlação: eponencal Fnção de correlação: esférca Área 4 - Semana 9 Área 4 - Semana () dstânca () dstânca º Teórco º º Teórco º Fnção de correlação: esférca Fnção de correlação: esférca

82 74 Área 4 - Semana Área 4 - Semana () dstânca 7º 6º Teórco 7º Teórco 6º Fnção de correlação: esférca () dstânca º 9º Teórco º Teórco 9º Fnção de correlação: esférca Área 4 - Semana () dstânca º 9º Teórco º Teórco 9º Fnção de correlação: esférca Fgra. Semvarograma epermental e modelo ajstado para cada ma das semanas das dferentes áreas de análse, A e A4. Defnda a fnção de correlação, escolhemos os parâmetros estrtras do semvarograma teórco através do crtéro de seleção de Akake. Com estes valores, calclamos

83 75 o gra de aleatoredade presente nos dados, E = efeto pepta/patamar, e verfcamos qe as semanas,, 4, 5, 6, e 3, área A, e, semanas, 5, 9, 6 e 8, área A4, por apresentarem valores de E maores qe,3, apresentaram m modelo de pepta pra e, portanto, não podem ser modeladas tlzando a teora da Geoestatístca. Estes resltados estão lstrados em Tabela 8 e Tabela 9. Tabela 8. Resltados das análses da Área A: parâmetros estrtras do semvarograma teórco. Área A Dados para a dreção de maor e menor contndade espacal Sem. Ânglo Akake Efeto Pepta Contrbção Alcance Patamar Fnção de correlação º -8,88,6,36 65,46,3 esférca, ** 6º -34,855,68,45 594,449,43,4 esférca 6º -,489,4, 97,64,6,9 3 º -6,49,66,7 496,865,38 eponencal,8 4 º -38,73,6,5 335,35,68 esférca,4 5* º -4,63,89 59,,89, eponencal º -33,8,6,99 74,697,5,3 6 º -38,5,6,4 588,94,4 eponencal,9 7 º -34,88,9,88 496,65,7 eponencal,5 8 º -5,96,8,3 6,789,3 esférca,3 9 º -59,786,3,354 6,84,367 esférca,4 ** * 6º -,83,444,64 86,696,58,87 esférca 6º -3,38,498,86 59,95,584,85 3º -63,44,35, ,894,498,7 esférca º -4,48,36 3,775,36, º -5,7,7 868,96,7 eponencal, 3 º -33,59,4,359 84,5,4 esférca, 4** 5** 6** 5º -7,4,59,97 33,9,56,38 esférca 5º -8,39,84,4 33,3,88,98 5º -33,,57,3 4,4,7,9 esférca 95º -3,7,76,64 46,58,4,54 8º -4,478,94,63 63,954,57,75 esférca 98º -5,567,8,83 56,374 98º,57 7 º -36,4, 549,676, eponencal, 8 º -,74,9,94 46,4,3 esférca,7 9 º -44,8,9, ,,48 eponencal,9 º -6,57,68 765,34,68 esférca, ** º -66,3,63,4 45,544,44 esférca,65 º -36,9,9 759,537,9 eponencal, 3** º -,6,68,4 495,,7 esférca,94 * semanas onde assmmos m modelo ansotrópco; ** semanas qe não podem ser modeladas va teora da Geoestatístca por apresentarem m valor para E maor qe,3. E

84 76 Tabela 9. Resltados das análses da Área A4: parâmetros estrtras do semvarograma teórco. Área A4 Dados para a dreção de maor e menor contndade espacal Sem. Ânglo Akake Efeto Pepta Contrbção Alcance Patamar Fnção de correlação º -36,667,3,578 5,7,68 eponencal,4 ** º -43,99,7,97 45,73,4 esférca,56 3 º -46,89,,4 7,65,63 eponencal,3 4 º -66,55,,6 86,9,63 eponencal,3 5** º -44,3,3,9 6,44,4 esférca,96 6 º -45,38,43,4,94,83 eponencal,3 7 º -53,6,55 3,7,55 esférca, 8 º -64,63,7, 6,38,9 eponencal,3 9** º -8,4,37,75 73,4,4,8 esférca 9º -4,85,,98 49,88,3,34 º -4,45,5,656 65,9,78 esférca,7 º -95,669,9,74 34,45,3 eponencal,8 º -33,57,3,36 9,9,67 eponencal,8 3 º -43,44,649,3 6,6,77 esférca,3 4 º -66,837,54,35 8,46,89 eponencal,8 5* 58º -39,589,4 45,4,4, esférca 48º -8,457,638 43,3,638, 6** º -44,65,73,64 5,7,37 esférca,73 7 º -4,789,,8 4,78, eponencal,5 8** º -73,7,7,4 57,3,84 esférca,83 9 º 33,83,5,455 35,73,46 esférca, º -,585,743 9,34,743 esférca, * * 3* 7º -,,57 39,9,57, esférca 6º -,88,6,587 34,9,648,9 º -9,94,547 4,7,547, esférca 9º -4,563,3,389 76,5,49, º -6,934,7,8 63,39,35, esférca 9º -37,6,3,6 8,69,9, * semanas onde assmmos m modelo ansotrópco; ** semanas qe não podem ser modeladas va teora da Geoestatístca por apresentarem m valor para E maor qe,3. E Os valores obtdos para o parâmetro alcance do semvarograma teórco para a dreção de maor espalhamento do fenômeno em estdo, lstrados em Tabela 8 e Tabela 9, nos revelam raos de correlação de amostras varando de 46 a 868 metros para a área A e de 7 até 8 metros para a área A4, resltados mportantes a serem consderados e analsados para qe ações de controle e de prevenção mas segras e corretas sejam efetadas. Observe qe não

85 77 estamos consderando os alcances obtdos para as semanas qe não podem ser modeladas através da Geoestatístca. Após escolhermos os parâmetros estrtras do semvarograma, prossegmos a análse defnndo os modelos teórcos para as semanas qe apresentaram m gra de aleatoredade menor o gal a,3, o seja, E,3. Para as semanas onde consegmos constrr os semvarogramas adeqados para as das dreções, apresentamos os modelos relatvos às dreções de máma e mínma contndade espacal e o modelo da ansotropa, m modelo completo, (), e consstente para qalqer dstânca e dreção do vetor. Qando assmmos m fenômeno sotrópco, apresentamos a epressão do únco modelo ajstado. Todos estes modelos defndos são epressos a segr: ª semana A: ( ),6,36 3ª semana A: ( ),66,7 4ª semana A: ( ),6,5 5ª semana A: Sph Ep Sph 65,5 496,87 335,35 º ( ) lm a,89 Ep º 59, a º º ( ) lm,6 a,99 Ep º 74,7 a º ( ) lm lm a,6 Ep º º 74,7,83 Ep º 59, º 74,7,6 Ep º 59, a º

86 78 6ª semana A: ( ),6,4 7ª semana A: ( ),9,88 8ª semana A: ( ),8,3 9ª semana A: ( ),3,354 ª semana A: Ep Ep Sph Sph 588,94 496,7 6,789 6,84 3º ( ) lm,35 a,363 Sph 3º 536,894 a º º ( ) lm a,36 Sph º 3,775 a 3º ( ) lm lm a,35 Sph 3º º 3,775,9 Sph 3º 536,894 º 3,775,7 Sph 3º 536,894 a º ª semana A: ( ),7 Ep 868,96 3ª semana A: ( ),4,359 Sph 84,5

87 79 7ª semana A: ( ), Ep 549,68 8ª semana A: ( ),9,94 9ª semana A: ( ),9,389 Sph Ep 46,4 373, ª semana A: ( ),68 Sph ª semana A: ( ),9 Ep 765,34 759,54 ª semana A4: ( ),3,578 3ª semana A4: ( ),,4 4ª semana A4: ( ),,6 6ª semana A4: ( ),43,4 Ep Ep Ep Ep 5,7 7,65 86,9,94 7ª semana A4: ( ),55 Sph 3,7

88 8 8ª semana A4: ( ),7, ª semana A4: ( ),5,656 ª semana A4: ( ),9,74 ª semana A4: ( ),3,36 3ª semana A4: ( ),649,3 4ª semana A4: ( ),54,35 5ª semana A4: Ep Sph Ep Ep Sph Ep 6,38 65,88 34,45 9,9 6,57 8,46 58º ( ) lm a,4 Sph 58º 45,43 a 48º 48º ( ) lm a,638 Sph 48º 43,96 a 58º ( ) lm lm a Sph 58º 48º 43,96,4 Sph 58º 45,43 48º 43,96,38 Sph 58º 45,43 a 48º

89 8 7ª semana A4: ( ),,8 9ª semana A4: ( ),5,455 Ep Sph 4,78 35,78 ª semana A4: ( ),743 Sph 9,344 ª semana A4: 7º ( ) lm a,57 Sph 7º 39,95 a 6º 6º ( ) lm,6 a,587 Sph 6º 34,95 a 7º ( ) lm lm a,6 Sph 7º 6º 34,95,59 Sph 7º 39,95 6º 34,95,78 Sph 7º 39,95 a 6º ª semana A4: º ( ) lm a,547 Sph º 4,65 a 9º 9º ( ) lm,3 a,389 Sph 9º 76,5 a º

90 8 ( ) lm lm a,3 Sph º 9º 76,5,389 Sph º 4,65 9º 76,5,55 Sph º 4,65 a 9º 3ª semana A4: º ( ) lm,7 a,8 Sph º 63,386 a 9º 9º ( ) lm,3 a,6 Sph 9º 8,686 a º ( ) lm lm,3 a,4 Sph º 9º 8,686,8 Sph º 63,386 9º 8,686,6 Sph º 63,386 a 9º Como últma etapa, eectamos o processo de valdação destes modelos para avalar o gra de ncerteza ao tlzarmos os parâmetros escolhdos. Obtvemos, então, as nformações lstradas nas tabelas Tabela e Tabela referentes ao erro destas estmatvas.

91 83 Tabela. Informações referentes ao erro das estmatvas área A Área A Sem. Méda Varânca Desvo Padrão Coefcente de Varação Coefcente de Assmetra Coefcente de Crtose Valor Mínmo Valor Mámo -,7,37,37-5,654-3,346 4,8 -,548,8 3,,64,53 3,68 -,347 6,83 -,3,74 4 -,5,5,57-3, -,98 9,47 -,884,54 5 -,6,9,345 -,45 3,4 7,333 -,864,69 6 -,3,9,3-3, -3,65,77 -,976,8 7,7,48,9 9,937 -,,67 -,959,66 8,,88,96 7,8 -,8,99 -,4,85 9 -,4,347,589-4,67-5,773 48,45-4,886,76,5,4,45 86,556 -,8 8,49 -,36,66,58,4,474 8,98,89,36 -,6, 3,3,64,45 3,563-4, 3,9-3,,9 7 -,,49, -,9-6,947 68,667 -,7,73 8,,64,54 8,3-4,96 4,73 -,,79 9,6,67,48 68,995 -,677,67 -,95,776,6,33,83 3,564 -,5,8 -,99,4,7,47,6 3,573 -,698 5,689 -,,767 Tabela. Informações referentes ao erro das estmatvas área A4 Área A4 Sem. Méda Varânca Desvo Padrão Coefcente de Varação Coefcente de Assmetra Coefcente de Crtose Valor Mínmo Valor Mámo -,,89,98-366,34-4,6 3,35 -,73,93 3,5,4,56,83 -,49 6,68 -,874,486 4,,, 4,57-6,994 7,964 -,983,33 6,,67,58,96,9 6,9 -,,44 7,34,53,39,686 -,6,778 -,978,675 8,,45,3 6,64-5,887 5,86 -,84,5,57,9,344 6,34,368,769 -,95,93 -,,3,8 -,54-3,434 8,99 -,,47 -,,37,93-97,48-3,374 8,57 -,,4 3,8,54,735 5,83 -,764 4,94-3,634,98 4,6,66,58 6,47 -,489 8,48 -,998,84 5,,4, 7,56 4,48 5,76 -,, ,3,75,74-9,7-4,75 9,95 -,786,64 9 -,4,85,9-69,383-4,33 7,373 -,96,585 -,,59,398-34,986 -,57,59 -,74,55 -,9,66,56-6,5-3,764 3,583-4,,43,7,93,36 7,6 -,97 8,5 -,994,44 3 -,,79,8 -,55-4,35 5,3 -,994,4

92 84 Analsando os valores das Tabela e Tabela, verfcamos qe as estatístcas apresentam valores acetáves dentro das sposções mpostas ao erro das estmatvas. Vale destacar qe os modelos com maores desvos padrão são os das semanas 9,,, 3 e 9 para a área A e, semanas 7, 3, e, para a área A4, gerando, como conseqüênca, ma sperestmação o sbestmação dos valores amostras. Provavelmente sto ocorre devdo ao ecesso de zeros estentes nas das áreas de amostragem, o, de amostragens nadeqadas o com pocas observações, o, anda, do modelo adotado qe pode não estar representando de forma adeqada a varabldade espacal do número de fêmeas Aedes captradas por armadlhas adltcdas. Foram também constrídos os hstogramas dos erros, o dagrama dos valores observados verss estmados e a dstrbção espacal do erro. Todas estas representações gráfcas nos confrmaram os resltados acma relatados. 4. Resltados dos modelos elaborados para estdar as varáves respostas X e Z, os alcances de maor e menor espalhamento do número fêmeas Aedes captradas em armadlhas adltcdas área A Os hstogramas constrídos para as varáves aleatóras X e Z nos revelaram qe podemos spor, ncalmente, qe ambas possem ma dstrbção Gama, conforme lstra a Fgra 3. Fgra 3. Hstogramas das amostras X, à esqerda, e Z, à dreta. As análses va correlogramas não nos revelaram a estênca de ma correlação temporal para as varáves aleatóras em qestão, por sso efetamos modelagens va teora de MLG (Fgra 4).

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS 1 A análse de dagnóstco (ou dagnóstco do ajuste) confgura uma etapa fundamental no ajuste de modelos de regressão. O objetvo prncpal da análse de dagnóstco

Leia mais

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência. MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada,

Leia mais

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Regressão Múltipla. Parte I: Modelo Geral e Estimação Regressão Múltpla Parte I: Modelo Geral e Estmação Regressão lnear múltpla Exemplos: Num estudo sobre a produtvdade de trabalhadores ( em aeronave, navos) o pesqusador deseja controlar o número desses

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo 3 Metodologa de Avalação da Relação entre o Custo Operaconal e o Preço do Óleo Este capítulo tem como objetvo apresentar a metodologa que será empregada nesta pesqusa para avalar a dependênca entre duas

Leia mais

1. Quantidade de dinheiro doado para caridade: muitas pessoas não fazem este tipo de doação. Uma parcela expressiva dos

1. Quantidade de dinheiro doado para caridade: muitas pessoas não fazem este tipo de doação. Uma parcela expressiva dos Tópcos em Econometra I Ala /7/23 Modelo Tobt para solção de canto Eemplos Solções de canto. Qantdade de dnhero doado para cardade: mtas pessoas não fazem este tpo de doação. Uma parcela epressva dos dados

Leia mais

Redes de Petri. Definições:

Redes de Petri. Definições: Redes de Petr Defnções: Uma Rede de Petr (PN) é m grafo dreto bpartdo o qal tem dos tpos de nós denomnados lgares (qe representam estados) e transções (qe representam eventos). O estado é alterado pelo

Leia mais

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

DEFINIÇÃO - MODELO LINEAR GENERALIZADO DEFINIÇÃO - MODELO LINEAR GENERALIZADO 1 Um modelo lnear generalzado é defndo pelos seguntes três componentes: Componente aleatóro; Componente sstemátco; Função de lgação; Componente aleatóro: Um conjunto

Leia mais

3 A técnica de computação intensiva Bootstrap

3 A técnica de computação intensiva Bootstrap A técnca de computação ntensva ootstrap O termo ootstrap tem orgem na expressão de língua nglesa lft oneself by pullng hs/her bootstrap, ou seja, alguém levantar-se puxando seu própro cadarço de bota.

Leia mais

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 1 O nosso objetvo é estudar a relação entre duas varáves quanttatvas. Eemplos:. Idade e altura das cranças.. v. Tempo de prátca de esportes e rtmo cardíaco

Leia mais

Cálculo Vetorial / Ilka Rebouças Freire / DMAT UFBA

Cálculo Vetorial / Ilka Rebouças Freire / DMAT UFBA Cálclo Vetoral / Ila Reboças Frere / DMAT UFBA. Campos Escalares e Vetoras. Gradente. Rotaconal. Dvergênca. Campos Conservatvos..1 Campos Escalares e Vetoras Dada ma regão D do espaço podemos asocar a

Leia mais

REGRESSÃO NÃO LINEAR 27/06/2017

REGRESSÃO NÃO LINEAR 27/06/2017 7/06/07 REGRESSÃO NÃO LINEAR CUIABÁ, MT 07/ Os modelos de regressão não lnear dferencam-se dos modelos lneares, tanto smples como múltplos, pelo fato de suas varáves ndependentes não estarem separados

Leia mais

Associação entre duas variáveis quantitativas

Associação entre duas variáveis quantitativas Exemplo O departamento de RH de uma empresa deseja avalar a efcáca dos testes aplcados para a seleção de funconáros. Para tanto, fo sorteada uma amostra aleatóra de 50 funconáros que fazem parte da empresa

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca

Leia mais

MODELOS DE REGRESSÃO PARAMÉTRICOS

MODELOS DE REGRESSÃO PARAMÉTRICOS MODELOS DE REGRESSÃO PARAMÉTRICOS Às vezes é de nteresse nclur na análse, característcas dos ndvíduos que podem estar relaconadas com o tempo de vda. Estudo de nsufcênca renal: verfcar qual o efeto da

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Constata-se, freqüentemente, a estênca de uma relação entre duas (ou mas) varáves. Se tal relação é de natureza quanttatva, a correlação é o nstrumento adequado para descobrr e medr

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear normal com erros heterocedástcos O método de mínmos quadrados ponderados Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

2 Incerteza de medição

2 Incerteza de medição 2 Incerteza de medção Toda medção envolve ensaos, ajustes, condconamentos e a observação de ndcações em um nstrumento. Este conhecmento é utlzado para obter o valor de uma grandeza (mensurando) a partr

Leia mais

CURSO A DISTÂNCIA DE GEOESTATÍSTICA

CURSO A DISTÂNCIA DE GEOESTATÍSTICA CURSO A DISTÂNCIA DE GEOESTATÍSTICA Aula 6: Estaconardade e Semvarânca: Estaconardade de a. ordem, Hpótese ntríseca, Hpótese de krgagem unversal, Crtéros para escolha, Verfcação, Representatvdade espacal,

Leia mais

Contabilometria. Aula 8 Regressão Linear Simples

Contabilometria. Aula 8 Regressão Linear Simples Contalometra Aula 8 Regressão Lnear Smples Orgem hstórca do termo Regressão Le da Regressão Unversal de Galton 1885 Galton verfcou que, apesar da tendênca de que pas altos tvessem flhos altos e pas axos

Leia mais

4 Critérios para Avaliação dos Cenários

4 Critérios para Avaliação dos Cenários Crtéros para Avalação dos Cenáros É desejável que um modelo de geração de séres sntétcas preserve as prncpas característcas da sére hstórca. Isto quer dzer que a utldade de um modelo pode ser verfcada

Leia mais

Estatística II Antonio Roque Aula 18. Regressão Linear

Estatística II Antonio Roque Aula 18. Regressão Linear Estatístca II Antono Roque Aula 18 Regressão Lnear Quando se consderam duas varáves aleatóras ao mesmo tempo, X e Y, as técncas estatístcas aplcadas são as de regressão e correlação. As duas técncas estão

Leia mais

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro. Aplcação Por exemplo, se prepararmos uma área expermental com todo cudado possível e fzermos, manualmente, o planto de 100 sementes seleconadas de um mlho híbrdo, cudando para que as sementes fquem na

Leia mais

Deformações na Notação Indicial

Deformações na Notação Indicial SEÇÃO DE ENSINO DE ENGENHARIA DE FORTIFICAÇÃO E CONSTRUÇÃO Pós-gradação em Engenhara de Transportes Deformações na Notação Indcal MAJ MONIZ DE ARAGÃO Campo de deslocamentos; Componentes de deformação;

Leia mais

1. CORRELAÇÃO E REGRESSÃO LINEAR

1. CORRELAÇÃO E REGRESSÃO LINEAR 1 CORRELAÇÃO E REGREÃO LINEAR Quando deseja-se estudar se exste relação entre duas varáves quanttatvas, pode-se utlzar a ferramenta estatístca da Correlação Lnear mples de Pearson Quando essa correlação

Leia mais

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) UNDADE V DELNEAMENTO NTERAMENTE CASUALZADO (DC) CUABÁ, MT 015/ PROF.: RÔMULO MÔRA romulomora.webnode.com 1. NTRODUÇÃO Este delneamento apresenta como característca prncpal a necessdade de homogenedade

Leia mais

2 - Derivadas parciais

2 - Derivadas parciais 8 - ervadas parcas Sea por eemplo: Estma-se qe a prodção semanal de ma ábrca sea dada pela nção Q 00 500 ndades onde representa o número de operáros qalcados e representa o número dos não-qalcados. Atalmente

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Prncípos de cração de modelos empírcos: Modelos (matemátcos, lógcos, ) são comumente utlzados na

Leia mais

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall Sstemas Intelgentes Aplcados Carlos Hall Programa do Curso Lmpeza/Integração de Dados Transformação de Dados Dscretzação de Varáves Contínuas Transformação de Varáves Dscretas em Contínuas Transformação

Leia mais

Análise de Regressão

Análise de Regressão Análse de Regressão método estatístco que utlza relação entre duas ou mas varáves de modo que uma varável pode ser estmada (ou predta) a partr da outra ou das outras Neter, J. et al. Appled Lnear Statstcal

Leia mais

Cap. 11 Correlação e Regressão

Cap. 11 Correlação e Regressão Estatístca para Cursos de Engenhara e Informátca Pedro Alberto Barbetta / Marcelo Menezes Res / Antono Cezar Borna São Paulo: Atlas, 2004 Cap. 11 Correlação e Regressão APOIO: Fundação de Apoo à Pesqusa

Leia mais

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro UNIVERIDADE DE ÃO PAULO FACULDADE DE ECONOMIA, ADMINITRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE ADMINITRAÇÃO RAD1507 Estatístca Aplcada à Admnstração I Prof. Dr. Evandro Marcos adel Rbero

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ 1 É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-4 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Programa do curso: Semana Conteúdo Apresentação da dscplna. Prncípos de modelos lneares de regressão.

Leia mais

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear clássco com erros heterocedástcos O método de mínmos quadrados ponderados 1 Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA APLICAÇÃO NO CONTROLE DE QUALIDADE DE FÁRMACOS Prof. Dr. Marcelo Martns de Sena MÓDULO 04 Undade Unverstára de Cêncas Eatas e Tecnológcas UnUCET Anápols 1 MÓDULO 04

Leia mais

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos Curso de extensão, MMQ IFUSP, feverero/4 Alguns exercíco báscos I Exercícos (MMQ) Uma grandeza cujo valor verdadero x é desconhecdo, fo medda três vezes, com procedmentos expermentas dêntcos e, portanto,

Leia mais

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma Capítulo 8 Dferencação Numérca Quase todos os métodos numércos utlzados atualmente para obtenção de soluções de equações erencas ordnáras e parcas utlzam algum tpo de aproxmação para as dervadas contínuas

Leia mais

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES 1. Obtenha os estmadores dos coefcentes lnear e angular de um modelo de regressão lnear smples utlzando o método

Leia mais

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária. Modelagem multvarável com varáves quanttatvas e qualtatvas, com resposta bnára. O modelo de regressão não lnear logístco ou modelo logístco é utlzado quando a varável resposta é qualtatva com dos resultados

Leia mais

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Capítulo 1. Exercício 5. Capítulo 2 Exercício UNIVERSIDADE FEDERAL DE GOIÁS CIÊNCIAS ECONÔMICAS ECONOMETRIA (04-II) PRIMEIRA LISTA DE EXERCÍCIOS Exercícos do Gujarat Exercíco 5 Capítulo Capítulo Exercíco 3 4 5 7 0 5 Capítulo 3 As duas prmeras demonstrações

Leia mais

Métodos Avançados em Epidemiologia

Métodos Avançados em Epidemiologia Unversdade Federal de Mnas Geras Insttuto de Cêncas Exatas Departamento de Estatístca Métodos Avançados em Epdemologa Aula 5-1 Regressão Lnear Smples: Estmação e Interpretação da Reta Tabela ANOVA e R

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ Em mutas stuações duas ou mas varáves estão relaconadas e surge então a necessdade de determnar a natureza deste relaconamento. A análse

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análse Exploratóra de Dados Objetvos Análse de duas varáves quanttatvas: traçar dagramas de dspersão, para avalar possíves relações entre as duas varáves; calcular o coefcente de correlação entre as duas

Leia mais

Dados ajustáveis a uma linha recta

Dados ajustáveis a uma linha recta Capítulo VI juste dos Mínmos Quadrados Dados ajustáves a uma lnha recta Determnação das constantes e B Incerteza nas meddas de Incerteza na determnação de e B juste dos mínmos quadrados a outras curvas:

Leia mais

Estatística Aplicada II CORRELAÇÃO. AULA 21 07/11/16 Prof a Lilian M. Lima Cunha

Estatística Aplicada II CORRELAÇÃO. AULA 21 07/11/16 Prof a Lilian M. Lima Cunha 09//06 Estatístca Aplcada II CORRELAÇÃO AULA 07//6 Prof a Llan M. Lma Cunha CORRELAÇÃO: Identfcar a estênca ou não de assocação lnear entre varáves: -Preço de um produto em regões; -Frete e Km percorrdo;

Leia mais

Análise do Retorno da Educação na Região Norte em 2007: Um Estudo à Luz da Regressão Quantílica.

Análise do Retorno da Educação na Região Norte em 2007: Um Estudo à Luz da Regressão Quantílica. Análse do Retorno da Edcação na Regão Norte em 2007: Um Estdo à Lz da Regressão Qantílca. 1 Introdcão Almr Rogéro A. de Soza 1 Jâno Macel da Slva 2 Marnalva Cardoso Macel 3 O debate sobre o relaconamento

Leia mais

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais 30 Varáves aleatóras bdmensonas Sea ε uma experênca aleatóra e S um espaço amostral assocado a essa experênca. Seam X X(s) e Y Y(s) duas funções cada uma assocando um número real a cada resultado s S.

Leia mais

Cálculo Numérico BCC760 Interpolação Polinomial

Cálculo Numérico BCC760 Interpolação Polinomial Cálculo Numérco BCC76 Interpolação Polnomal Departamento de Computação Págna da dscplna http://www.decom.ufop.br/bcc76/ 1 Interpolação Polnomal Conteúdo 1. Introdução 2. Objetvo 3. Estênca e uncdade 4.

Leia mais

Cap. IV Análise estatística de incertezas aleatórias

Cap. IV Análise estatística de incertezas aleatórias TLF 010/11 Cap. IV Análse estatístca de ncertezas aleatóras Capítulo IV Análse estatístca de ncertezas aleatóras 4.1. Méda 43 4.. Desvo padrão 44 4.3. Sgnfcado do desvo padrão 46 4.4. Desvo padrão da méda

Leia mais

Algarismos Significativos Propagação de Erros ou Desvios

Algarismos Significativos Propagação de Erros ou Desvios Algarsmos Sgnfcatvos Propagação de Erros ou Desvos L1 = 1,35 cm; L = 1,3 cm; L3 = 1,30 cm L4 = 1,4 cm; L5 = 1,7 cm. Qual destas meddas está correta? Qual apresenta algarsmos com sgnfcado? O nstrumento

Leia mais

Representação e Descrição de Regiões

Representação e Descrição de Regiões Depos de uma magem ter sdo segmentada em regões é necessáro representar e descrever cada regão para posteror processamento A escolha da representação de uma regão envolve a escolha dos elementos que são

Leia mais

Análise de influência

Análise de influência Análse de nfluênca Dzemos que uma observação é nfluente caso ela altere, de forma substancal, alguma propredade do modelo ajustado (como as estmatvas dos parâmetros, seus erros padrões, valores ajustados...).

Leia mais

DELINEAMENTOS EXPERIMENTAIS

DELINEAMENTOS EXPERIMENTAIS SUMÁRIO 1 Delneamentos Expermentas 2 1.1 Delneamento Interamente Casualzado..................... 2 1.2 Delneamento Blocos Casualzados (DBC).................... 3 1.3 Delneamento Quadrado Latno (DQL)......................

Leia mais

Covariância na Propagação de Erros

Covariância na Propagação de Erros Técncas Laboratoras de Físca Lc. Físca e Eng. omédca 007/08 Capítulo VII Covarânca e Correlação Covarânca na propagação de erros Coefcente de Correlação Lnear 35 Covarânca na Propagação de Erros Suponhamos

Leia mais

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral. DEFINIÇÕES ADICIONAIS: PROBABILIDADE Espaço amostral (Ω) é o conjunto de todos os possíves resultados de um expermento. Evento é qualquer subconjunto do espaço amostral. Evento combnado: Possu duas ou

Leia mais

Gabarito da Lista de Exercícios de Econometria I

Gabarito da Lista de Exercícios de Econometria I Gabarto da sta de Exercícos de Econometra I Professor: Rogéro lva Mattos Montor: eonardo enrque A. lva Questão Y X y x xy x ŷ ˆ ˆ y ŷ (Y - Y ) (X - X ) (Ŷ - Y ) 360 00-76 -00 35.00 40.000 36-4 30.976 3076

Leia mais

NOTAS DE AULA DA DISCIPLINA CE076

NOTAS DE AULA DA DISCIPLINA CE076 5. COMPONENTES PRINCIPAIS 5. Introdução A análse de Comonentes Prncas está relaconada com a exlcação da estrutura de covarânca or meo de oucas combnações lneares das varáves orgnas em estudo, ou sea, rocura

Leia mais

Texto 03: Campos Escalares e Vetoriais. Gradiente. Rotacional. Divergência. Campos Conservativos.

Texto 03: Campos Escalares e Vetoriais. Gradiente. Rotacional. Divergência. Campos Conservativos. 1 Unversdade Salvador UNIFACS Crsos de Engenhara Cálclo IV Profa: Ila Reboças Frere Cálclo Vetoral Teto 03: Campos Escalares e Vetoras. Gradente. Rotaconal. Dvergênca. Campos Conservatvos. Campos Escalares

Leia mais

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EATAS DEPARTAMENTO DE ESTATÍSTICA UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Leia mais

AULA EXTRA Análise de Regressão Logística

AULA EXTRA Análise de Regressão Logística 1 AULA EXTRA Análse de Regressão Logístca Ernesto F. L. Amaral 13 de dezembro de 2012 Metodologa de Pesqusa (DCP 854B) VARIÁVEL DEPENDENTE BINÁRIA 2 O modelo de regressão logístco é utlzado quando a varável

Leia mais

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

ANÁLISE DA VARIÂNCIA DA REGRESSÃO ANÁLISE DA VARIÂNCIA DA REGRESSÃO PROCEDIMENTO GERAL DE REGRESSÃO Em um modelo de análse de varânca, como no DIA, o fator em estudo pode ser quanttatvo ou qualtatvo. FATOR QUANTITATIVO: é aquele cujos

Leia mais

Acompanhamento de Cenas com Calibração Automática de Câmeras

Acompanhamento de Cenas com Calibração Automática de Câmeras Acompanhamento de Cenas com Calbração Atomátca de Câmeras por Fláo Szenberg Orentadores: Marcelo Gattass Palo Cezar Pnto Caralho Departamento de Informátca, PUC-Ro 9 de dezembro de 00 Jz Vrtal pontos de

Leia mais

Regressão Linear Simples. Frases. Roteiro

Regressão Linear Simples. Frases. Roteiro Regressão Lnear Smples Frases Por serem mas precsos que as palavras, os números são partcularmente adequados para transmtr conclusões centífcas Pagano e Gauvre, 4 Rotero. Modelagem de Relação. Modelo Lnear

Leia mais

Análise de Variância. Comparação de duas ou mais médias

Análise de Variância. Comparação de duas ou mais médias Análse de Varânca Comparação de duas ou mas médas Análse de varânca com um fator Exemplo Um expermento fo realzado para se estudar dabetes gestaconal. Desejava-se avalar o comportamento da hemoglobna (HbA)

Leia mais

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA Análse de Regressão Profa Alcone Mranda dos Santos Departamento de Saúde Públca UFMA Introdução Uma das preocupações estatístcas ao analsar dados, é a de crar modelos que explctem estruturas do fenômeno

Leia mais

4 ANÁLISE DE CONFIABILIDADE COM ANÁLISE LIMITE

4 ANÁLISE DE CONFIABILIDADE COM ANÁLISE LIMITE 4 ANÁLISE DE CONIABILIDADE COM ANÁLISE LIMITE A avalação da segurança das estruturas geotécncas tem sdo sempre um dos objetvos da Engenhara Geotécnca. A forma convenconal de quantfcar a segurança de uma

Leia mais

Inicia-se este capítulo com algumas definições e propriedades para uma seqüência de funções tal como

Inicia-se este capítulo com algumas definições e propriedades para uma seqüência de funções tal como . Métodos de Resídos Ponderados. Defnções áscas Inca-se este capítlo com algmas defnções e propredades para ma seqüênca de fnções tal como x ( x ( x ( x ( (. ( 3 4 n x Tas fnções são assmdas satsfazerem

Leia mais

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas 3.6. Análse descrtva com dados agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas

Leia mais

Programa de Certificação de Medidas de um laboratório

Programa de Certificação de Medidas de um laboratório Programa de Certfcação de Meddas de um laboratóro Tratamento de dados Elmnação de dervas Programa de calbração entre laboratóros Programa nterno de calbração justes de meddas a curvas Tratamento dos resultados

Leia mais

Capítulo 2. Modelos de Regressão

Capítulo 2. Modelos de Regressão Capítulo 2 Modelos de regressão 39 Capítulo 2 Modelos de Regressão Objetvos do Capítulo Todos os modelos são errados, mas alguns são útes George E P Box Algumas vezes fcamos assustados quando vemos engenheros

Leia mais

Análise de Regressão Linear Múltipla IV

Análise de Regressão Linear Múltipla IV Análse de Regressão Lnear Múltpla IV Aula 7 Guarat e Porter, 11 Capítulos 7 e 8 He et al., 4 Capítulo 3 Exemplo Tomando por base o modelo salaro 1educ anosemp exp prev log 3 a senhorta Jole, gerente do

Leia mais

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha) Estatístca p/ Admnstração II - Profª Ana Cláuda Melo Undade : Probabldade Aula: 3 Varável Aleatóra. Varáves Aleatóras Ao descrever um espaço amostral de um expermento, não especfcamos que um resultado

Leia mais

ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO

ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO Anas Eletrônco ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO Anderson Takash Hara, Heraldo Takao Hashgut, Antôno Carlos Andrade

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-4 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Programa do curso: Semana Conteúdo Apresentação da dscplna. Prncípos de modelos lneares de regressão.

Leia mais

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16% Análse de Rsco 1 RISCO Rsco possbldade de perda. Quanto maor a possbldade, maor o rsco. Exemplo: Empresa X va receber $ 1.000 de uros em 30 das com títulos do governo. A empresa Y pode receber entre $

Leia mais

PRESSUPOSTOS DO MODELO DE REGRESSÃO

PRESSUPOSTOS DO MODELO DE REGRESSÃO PREUPOTO DO MODELO DE REGREÃO A aplcação do modelo de regressão lnear múltpla (bem como da smples) pressupõe a verfcação de alguns pressupostos que condensamos segudamente.. Os erros E são varáves aleatóras

Leia mais

AULA Exercícios. ORTOGONALIDADE EM R N. , o vector u tem norma. O produto interno entre os vector u e v, é

AULA Exercícios. ORTOGONALIDADE EM R N. , o vector u tem norma. O produto interno entre os vector u e v, é Note bem: a letra destes apontamentos não dspensa de modo algm a letra atenta da bblografa prncpal da cadera Chama-se a atenção para a mportânca do trabalho pessoal a realzar pelo alno resolvendo os problemas

Leia mais

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012

Notas Processos estocásticos. Nestor Caticha 23 de abril de 2012 Notas Processos estocástcos Nestor Catcha 23 de abrl de 2012 notas processos estocástcos 2 O Teorema de Perron Frobenus para matrzes de Markov Consdere um processo estocástco representado por um conunto

Leia mais

ALGORITMOS PARA DADOS AUMENTADOS

ALGORITMOS PARA DADOS AUMENTADOS ALGORITMOS PARA DADOS AUMNTADOS. INTRODUÇÃO Dos algortmos baseados na consderação de dados latentes. Temos os dados efetvamente observados e de uma manera convenente aumentamos esses dados ntroduzndo os

Leia mais

Teoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva

Teoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva Teora da Regressão Espacal Aplcada a Modelos Genércos Sérgo Alberto Pres da Slva ITENS DE RELACIONAMENTOS Tópcos Báscos da Regressão Espacal; Banco de Dados Geo-Referencados; Modelos Genércos Robustos;

Leia mais

UMA VALIDAÇÃO MATEMÁTICA PARA UM ALGORITMO QUE SIMULA MISTURAS DE DISTRIBUIÇÕES

UMA VALIDAÇÃO MATEMÁTICA PARA UM ALGORITMO QUE SIMULA MISTURAS DE DISTRIBUIÇÕES UMA VALIDAÇÃO MATEMÁTICA PARA UM ALGORITMO QUE SIMULA MISTURAS DE DISTRIBUIÇÕES Ana Paula Coelho MADEIRA Lucas Montero CHAVES Devanl Jaques de SOUZA Resumo: Uma valdação matemátca, utlzando o conceto de

Leia mais

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA CAPÍTULO DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA. A MÉDIA ARITMÉTICA OU PROMÉDIO Defnção: é gual a soma dos valores do grupo de dados dvdda pelo número de valores. X x Soma dos valores de x número de

Leia mais

2 Análise de Campos Modais em Guias de Onda Arbitrários

2 Análise de Campos Modais em Guias de Onda Arbitrários Análse de Campos Modas em Guas de Onda Arbtráros Neste capítulo serão analsados os campos modas em guas de onda de seção arbtrára. A seção transversal do gua é apromada por um polígono conveo descrto por

Leia mais

MODELAGEM CONJUNTA DE MÉDIA E VARIÂNCIA EM EXPERIMENTOS FRACIONADOS SEM REPETIÇÃO UTILIZANDO GLM

MODELAGEM CONJUNTA DE MÉDIA E VARIÂNCIA EM EXPERIMENTOS FRACIONADOS SEM REPETIÇÃO UTILIZANDO GLM UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL ESCOLA DE ENGENHARIA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE PRODUÇÃO MODELAGEM CONJUNTA DE MÉDIA E VARIÂNCIA EM EXPERIMENTOS FRACIONADOS SEM REPETIÇÃO UTILIZANDO

Leia mais

Cléber da Costa Figueiredo Séries Temporais PAE - 2º semestre de 2007

Cléber da Costa Figueiredo Séries Temporais PAE - 2º semestre de 2007 Quem sou? Autocorrelação Lcencado em matemátca pelo IME- USP; Incação Centífca sob orentação da Profª Drª Mônca Carnero Sandoval; Transformação de Bo-Co. Mestre em estatístca sob a orentação da Profª Drª

Leia mais

DISSERTAÇÃO DE MESTRADO

DISSERTAÇÃO DE MESTRADO UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL FACULDADE DE MEDICINA PROGRAMA DE PÓS-GRADUAÇÃO EM EPIDEMIOLOGIA DISSERTAÇÃO DE MESTRADO Equações de Estmação Generalzadas (GEE): Aplcação em estudo sobre mortaldade

Leia mais

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial

5 Métodos de cálculo do limite de retenção em função da ruína e do capital inicial 5 Métodos de cálculo do lmte de retenção em função da ruína e do captal ncal Nesta dssertação serão utlzados dos métodos comparatvos de cálculo de lmte de retenção, onde ambos consderam a necessdade de

Leia mais

REGRESSÃO LINEAR ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA REGRESSÃO CURVILÍNEA FUNÇÃO QUADRÁTICA

REGRESSÃO LINEAR ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA REGRESSÃO CURVILÍNEA FUNÇÃO QUADRÁTICA ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA REGRESSÃO LINEAR Verfcado, pelo valor de r, que ocorre uma sgnfcante correlação lnear entre duas varáves há necessdade de quantfcar tal relação, o que é feto pela análse

Leia mais

CIRCUITOS RESISTIVOS

CIRCUITOS RESISTIVOS Temátca Crctos Eléctrcos Capítlo nálse de Crctos Lneares CICITOS ESISTIVOS INTODÇÃO Nesta secção apresentamse dversas metodologas para resolção de crctos lneares tas como o método geral, a smplfcação do

Leia mais

Reconhecimento Estatístico de Padrões

Reconhecimento Estatístico de Padrões Reconhecmento Estatístco de Padrões X 3 O paradgma pode ser sumarzado da segunte forma: Cada padrão é representado por um vector de característcas x = x1 x2 x N (,,, ) x x1 x... x d 2 = X 1 X 2 Espaço

Leia mais

Elementos de Estatística e Probabilidades II

Elementos de Estatística e Probabilidades II Elementos de Estatístca e Probabldades II Varáves e Vetores Aleatóros dscretos Inês Das 203 O prncpal objetvo da deste documento é fornecer conhecmentos báscos de varáves aleatóras dscretas e pares aleatóros

Leia mais

MÉTODO DE ORIENTAÇÃO À MODELAGEM DE

MÉTODO DE ORIENTAÇÃO À MODELAGEM DE UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL ESCOLA DE ENGENHARIA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE PRODUÇÃO MÉTODO DE ORIENTAÇÃO À MODELAGEM DE DADOS MENSURADOS EM PROPORÇÃO Ângelo Márco Olvera

Leia mais

Nome: Nº: Estatística para Economia e Gestão Licenciaturas em Economia e Gestão. 2.º Semestre de 2008/2009

Nome: Nº: Estatística para Economia e Gestão Licenciaturas em Economia e Gestão. 2.º Semestre de 2008/2009 Estatístca para Economa e Gestão Lcencaturas em Economa e Gestão.º Semestre de 008/009 Exame Fnal (.ª Época) 16 de Junho de 009; 17h30m Duração: 10 mnutos INSTRUÇÕES Escreva o nome e número de aluno em

Leia mais

Ajuste dos Mínimos Quadrados

Ajuste dos Mínimos Quadrados TLF 00/ Cap. IX juste dos mínmos quadrados Capítulo IX juste dos Mínmos Quadrados 9.. juste de uma lnha recta a dados epermentas 9 9.. Determnação dos parâmetros da recta, e B (Incertezas apenas em e guas

Leia mais