MODELOS DE ESCOLHA BINÁRIA

Tamanho: px
Começar a partir da página:

Download "MODELOS DE ESCOLHA BINÁRIA"

Transcrição

1 MODELOS DE ESCOLHA BINÁRIA Introdução Em mutas aplcações do modelo de regressão lnear, pressupõe-se que a varável dependente é uma varável aleatóra contínua e que tem por domíno o conjunto dos números reas. Dos aspectos em que essa perspectva se manfesta de modo óbvo ocorrem na nterpretação dos coefcentes de regressão e nas hpóteses quanto à dstrbução de probabldade da varável explcada. Quando se escreve, a propósto de um coefcente de regressão β j, β j = Y, X j presume-se, mplctamente, ser Y uma função dferencável em ordem a X j. De modo análogo, a hpótese da normaldade das perturbações, em que assentam os procedmentos usuas de nferênca, supõe que a varável dependente seja uma varável aleatóra contínua. Esses aspectos não são, contudo, essencas na teora do modelo de regressão lnear. Se, por exemplo, X j for uma varável bnára, caso em que a dervada parcal a que se aludu acma não é defnda, é possível modfcar a forma de nterpretação de β j para acomodar essa stuação. E, se não for normal a dstrbução de probabldade das perturbações, haverá que modfcar os procedmentos de nferênca, mas os resultados fundamentas em matéra de estmação não são afectados. Exste, no entanto, uma grande varedade de stuações em que não é defensável admtr que a varável dependente tenha natureza contínua ou domíno real. Em prmero lugar, há casos em que a varável dependente é uma varável dscreta: número de empresas faldas num ano, número de empregos crados ou destruídos, número de balcões de uma nsttução de crédto, etc. O domíno da varável é, nestes exemplos, o conjunto dos números nteros e a hpótese de normaldade é, claramente, nadequada. Noutros casos, a varável dependente não é, sequer, quanttatva: ter ou não ter casa própra, deslocar-se para o trabalho de combóo, de autocarro, a pé, em vatura própra ou de outro modo, votar a favor, contra, ou abster-se numa delberação, etc. Conquanto seja habtual fazer-se corresponder números nteros às dversas categoras (por exemplo, à posse de casa própra e 0 ao caso contráro), esses números não

2 traduzem verdaderamente uma quantfcação, mas consttuem, antes, um dspostvo de codfcação essencalmente arbtráro. Em tercero lugar, ctem-se casos em que, conquanto a natureza de varável contínua seja acetável, não é váldo admtr-se que Y tenha R por domíno. Se a varável dependente for uma probabldade, por exemplo, o domíno deverá ser restrngdo ao ntervalo [0, ]. Noutros casos, anda, embora a varável de nteresse possa ser uma varável contínua, pode não ser observável em todo o domíno. Num exercíco de tro ao alvo, a dstânca a que a bala passa do centro só é observada, tpcamente, para os projéctes que embateram num rao lmtado em torno do centro; quanto aos outros, sabe-se apenas que a dstânca excedeu esse rao. As restrções à observabldade da varável podem ser anda mas drástcas e lmtá-la a uma mera nformação qualtatva, do tpo "acertou" ou "não acertou". Dspõe-se, em Econometra, de uma gama muto vasta de modelos para analsar problemas em que a varável dependente é dscreta, qualtatva, lmtada, censurada ou truncada. Consttuem objecto deste texto apenas alguns modelos elementares dessa classe, os chamados modelos de escolha bnára. Trata-se de modelos cuja utlzação mas frequente em Economa teve por objectvo o estudo das escolhas de um agente e em que a varável dependente é de natureza bnára: a escolha faz-se entre duas alternatvas e uma, ou outra, tem de ser escolhda. Além dos modelos com varável dependente dscreta ou lmtada, fora da análse fcarão os modelos de escolha multnomal, em que a escolha se faz entre mas de duas alternatvas. São muto numerosos os exemplos de emprego de modelos de escolha bnára: ) Em estudos da oferta de trabalho, é frequente modelzar-se a decsão de partcpação ou não na força de trabalho como função de uma sére vasta de atrbutos ndvduas (sexo, grau de nstrução, dade, etc.) ou famlares (estado cvl, número e dade dos flhos, rendmento do agregado, etc.) e, anda, de atrbutos dos empregos dsponíves (remunerações, horas de trabalho, etc.). A varável dependente é codfcada com o valor se o º ndvíduo partcpa na força de trabalho, ou com o valor 0 em caso contráro. ) Em estudos dos determnantes da aqusção de bens duradouros (automóves, casas, etc.), é também frequente relaconar-se a posse, ou não, de um certo bem com factores explcatvos como o rendmento, o preço, a taxa de juro, etc. ) Em estudos de comportamentos eletoras, usam-se, para explcar a verfcação do acontecmento "o º ndvíduo votou no partdo Z", ou da alternatva "o º ndvíduo não votou no partdo Z", varáves explcatvas como o rendmento do ndvíduo, o local de resdênca, a relgão ou outras. v) Em estudos da escolha de modos de transporte, a varável dependente podera corresponder ao acontecmento "uso de transporte públco" ou a "uso de outros modos de transporte", em função de varáves como os preços dos transportes, o rendmento do utente, a dstânca a percorrer, etc.

3 v) Em estudos de comportamentos mgratóros, a decsão de emgrar, ou não, é explcada em função dos saláros na regão de orgem e na de destno, de característcas pessoas dos mgrantes, etc. v) Em estudos da procura de educação e, em partcular, de educação superor: concluído um curso de nível secundáro, o ndvíduo escolhe entre o ngresso medato no mercado de trabalho ou a contnuação dos estudos, em função das oportundades de emprego, dos fluxos de rendmentos esperados numa e noutra alternatva, dos custos da frequênca de uma unversdade, etc. v) Em estudos sobre mercados monetáros e fnanceros, têm sdo analsadas a probabldade de recusa ou concessão de crédto pelas nsttuções fnanceras e a probabldade de cumprmento ou ncumprmento de obrgações pelos devedores. A nformação dsponível, quanto à varável dependente, é lmtada às alternatvas "empréstmo conceddo" vs. "empréstmo recusado", ou "prestações cumprdas" vs. "prestações não cumprdas". Modelos lneares de probabldade Consdere-se a habtual equação de regressão lnear ou, numa notação mas convenente, Y = β + β 2 X 2 + β 3 X β k X k + u, [] Y = X β + u [2] (em que X é o vector ( k) de componentes, X 2, X 3,..., X k e β o vector (k ) de coefcentes de regressão), e admta-se que Y desgna uma varável bnára codfcada com o valor ou o valor 0. Usualmente, o valor é atrbuído à presença de um certo atrbuto na ª observação, enquanto o valor 0 é atrbuído à sua ausênca. Noutra perspectva, podem ver-se os dos valores possíves como correspondendo à verfcação, ou não, de um certo acontecmento pela ª observação. De acordo com o modelo estatístco subjacente às hpóteses clásscas, num processo de amostragem repetda, para uma mesma sequênca ordenada (X 2, X 3,..., X k ) devera ser possível obter valores dferentes de Y. Na especfcação em análse, seram dos, apenas, os valores possíves: o acontecmento em causa sera observado para alguns ndvíduos e ter-se-a Y =, e não sera observado nos restantes para os quas, Y = 0. Seja p a probabldade de verfcação do acontecmento, sto é, p = Prob(Y = X 2, X 3,..., X k ) e, por consegunte, seja p a probabldade de não verfcação do acontecmento. Então, o valor médo de Y (condconal a X 2, X 3,..., X k ), caso exsta, terá de ser gual a p :

4 E(Y ) = 0( p ) + p = p. [3] Por consegunte, se for E(u ) = 0 na equação [], deverá ter-se E(Y ) = β + β 2 X 2 + β 3 X β k X k = p. [4] Sendo o valor médo condconal de Y a probabldade (condconal a X 2, X 3,..., X k ) de Y =, modelos com esta estrutura são conhecdos por modelos lneares de probabldade ou pela sgla nglesa LPM (lnear probablty models). De um ponto de vsta teórco, os modelos LPM apresentam alguns aspectos nsatsfatóros. Se o modelo for lnear na varável X j, e as dervadas abaxo exstrem, então, E(Y) Prob(Y = ) = = β j, X X j ou seja, tudo o resto gual, a probabldade de verfcação do acontecmento em análse é afectada sempre de modo dêntco por uma varação de X j, qualquer que seja o nível da varável. Por exemplo, um aumento de 00 para 200 no rendmento de um ndvíduo, tudo o mas constante, fara varar a probabldade de aqusção de casa própra pelo mesmo montante em que o fara um aumento de 0000 para 000. Uma vez que E(Y) é uma medda de probabldade, terá de ser 0 E(Y). Mas é dfícl compatblzar a restrção 0 E(Y) com a possbldade de varações absolutas constantes em E(Y) nduzdas por varações untáras de uma varável explcatva. Se E(Y) é uma função lnear de X j, é nevtável que, para alguns valores de X j, E(Y) venha a stuar-se fora do ntervalo admssível. Sera mas natural que, exercendo X j um efeto postvo na probabldade de ser Y =, esse efeto fosse pratcamente nulo para valores muto baxos ou muto altos de X j e fosse mas sensível para algum ntervalo de valores ntermédos da varável. Isto é, sera de esperar que fosse j e lm Prob(Y = ) = X β + lm Prob(Y = ) = 0. X β Por outro lado, a aplcação de algumas das técncas de estmação e de análse estatístca comummente empregues com o modelo clássco de regressão lnear suscta dfculdades séras em modelos LPM: Em prmero lugar, terá de ser, como se vu, 0 E(Y). Mas a estmação pelo método ordnáro de mínmos quadrados (OLS) dos coefcentes em [4] não obedecerá necessaramente a essa restrção, pelo que é possível que orgne valores estmados de Y negatvos ou superores à undade.

5 Em segundo lugar, não é acetável a hpótese da normaldade para a varável dependente (que, recorde-se, é uma varável dscreta), nem para a perturbação u. Esta poderá assumr apenas dos valores, com probabldade p, ou (β + β2 X 2 + β 3 X β k X k ), 0 (β + β 2 X 2 + β 3 X β k X k ), com probabldade p, pelo que possurá uma dstrbução bnomal. A consequênca mas mportante de tal facto será a de nvaldar as técncas de nferênca estatístca apresentadas anterormente, em amostras de dmensão fnta. O melhor que se poderá esperar é que, em amostras de grande dmensão, os resultados obtdos com essas técncas sejam uma boa aproxmação aos verdaderos. Em tercero lugar, não é sustentável a hpótese de homoscedastcdade relatvamente à perturbação u. Uma vez que E(u ) = 0, será Var(u ) = E(u 2). Ora, u 2 poderá apenas assumr dos valores, com probabldade p, e com probabldade p, pelo que Notando (da equação [4]) que [ (β + β 2 X 2 + β 3 X β k X k )] 2, [ (β + β 2 X 2 + β 3 X β k X k )] 2, E(u 2) = [ (β + β 2 X 2 + β 3 X β k X k )] 2 p + + (β + β 2 X 2 + β 3 X β k X k ) 2 ( p ). p = β + β 2 X 2 + β 3 X β k X k, é fácl smplfcar a expressão anteror para obter com a mplcação de heteroscedastcdade. Var(u ) = E(u 2) = p ( p ), [5] Conquanto as dfculdades ctadas (não normaldade, heteroscedastcdade, não obrgatoredade de verfcação de 0 Y ) possam ser contornadas na estmação de modelos LPM, têm maor voga nas aplcações empírcas outras formulações que, do ponto de vsta teórco, não apresentam nconvenentes como os que acma se apontaram. Avultam, entre elas, os modelos habtualmente desgnados pelas expressões probt e logt.

6 Modelos probt e logt Uma abordagem mas satsfatóra dos modelos em que a varável dependente é dcotómca é a que pressupõe que a varável Y, com Y = ou Y = 0, é apenas a manfestação observável de uma varável não observável Y (dta varável latente) tal que Y = β + β 2 X 2 + β 3 X β k X k + u = X β + u [6] e em que é especfcada uma regra de determnação de Y em função de Y. Essa regra é, tpcamente, da forma Y =, se Y 0 0, se Y < 0. [7] Note-se que, nesta formulação, quer a varável dependente latente, quer a perturbação aleatóra, podem ser valdamente defndas como varáves aleatóras contínuas e o carácter dscreto é reservado apenas para a contrapartda observável da varável de nteresse. Pode conceber-se a varável latente Y como a dferença entre a utldade, U, que para o º ndvíduo tera a alternatva representada por Y = e a utldade, U 0, assocada com a alternatva Y = 0, sto é, Y = U U 0 = β + β 2 X 2 + β 3 X β k X k + u. O ndvíduo optara pela prmera alternatva se U > U 0 e pela segunda se U U 0, ou seja, verfcar-se-a Y = ou Y = 0 conforme fosse, respectvamente, Y > 0 ou Y 0. Outra formulação possível é a que vê Y como um índce da propensão do º ndvíduo para a escolha de uma alternatva. Esse índce podera corresponder à dferença entre R, o rendmento ou benefíco margnal esperado se o ndvíduo fzer a escolha da alternatva assocada com Y =, e C, custo margnal dessa escolha. De manera análoga à anteror, ter-se-a agora Y = R C = β + β 2 X 2 + β 3 X β k X k + u, Y = se R C (e, portanto, Y 0), ou Y = 0 se Y < 0. A escolha da constante 0 como lmar de separação entre Y = 0 e Y = é, essencalmente, arbtrára. O assunto é dscutdo mas extensamente noutro ponto do texto.

7 Na classe de modelos caracterzada pelas relações [6] e [7], é Prob(Y = ) = Prob( Y > 0) = = Prob(β + β 2 X 2 + β 3 X β k X k + u > 0) = = Prob(u > X β) e, por consegunte, Prob(Y = 0) = Prob(u X β). Então, sendo u uma varável aleatóra com função de dstrbução F(.), vem Prob(Y = 0) = F( X β), Prob(Y = ) = F( X β). [8] As duas escolhas mas comuns para a forma funconal de F(.) são as que correspondem à dstrbução normal reduzda e à dstrbução logístca. No modelo probt, é postulado que u tem dstrbução normal reduzda e F(.) desgna, então, a função de dstrbução normal, Φ(x) = x 2 2 2π e t dt ; [9] a função de densdade de probabldade assocada é dada, como é sabdo, por φ(x) = d Φ (x) dx = e x 2 2. [0] 2π No modelo logt, a escolha de F(.) reca em Λ(x) = -x, [] + e a função de dstrbução de uma varável logístca de méda nula e varânca π 2 função de densdade da logístca é 3. A λ(x) = d Λ (x) dx = -x e -x ( + e ) 2 ; [2] É fácl verfcar que λ(x) = Λ(x) [ Λ(x)]. As duas dstrbuções consderadas têm característcas de smetra de que resultam algumas propredades nteressantes. Uma delas, por exemplo, é a de que

8 F(x) = F( x), desgne F(.) a função em [9] ou a função em []. Isso explca por que é possível dar às expressões em [8] um aspecto dferente: Prob(Y = 0) = F(X β), Prob(Y = ) = F(X β). [3] Do confronto da últma destas equações com a equação de regressão dos modelos LPM é fácl conclur que, nestes, se procede, mplctamente, como se fora F(X β) = X β. Não é dfícl dentfcar concretzações de X e β para as quas se tenha X β > ou X β < 0, em volação do requerdo para uma probabldade. Ao nvés, a própra especfcação dos modelos probt e logt garante (por ser 0 F(X β), quasquer que sejam X e β) que tal nunca sucederá. Por outro lado, os coefcentes ntegrados no vector β nos modelos probt e logt não têm a nterpretação usual dos modelos de regressão lnear. De facto, tem-se, usando [3], ou seja, Portanto, E(Y ) = 0[ F(X β)] + F(X β), E(Y) = F(X β). [4] E(Y ) = d F( X X ' d( X β) β) ( X β) ' X = f(x β) β, [5] em que f(.) desgna a função de densdade correspondente à função de dstrbução F(.). Na equação [5], o prmero membro é um vector-coluna de dervadas parcas, de que a componente genérca é, supondo que E(Y ) é uma função lnear de X j, E( Y ) X j = f(x β) β j. [6] Resulta de [6] que, nos modelos probt e logt, β j não mede necessaramente o efeto margnal de Xj sobre E(Y) (ou, o que é o mesmo, sobre Prob(Y = )). Relembre-se, contudo, que contnua a ser, salvo não lneardade em relação a X j,

9 E(Y X j ) = βj para qualquer e qualquer j, relatvamente à varável não observável Y, à semelhança do que ocorra na generaldade dos modelos de regressão estudados anterormente. Três factos merecem realce em [6]: ) O efeto margnal de X j sobre Prob(Y = ) é varável de ndvíduo para ndvíduo (devdo à presença de X 2,..., X j,..., X k em f(x β)). ) Esse efeto é também varável com X j ; sto é, para o mesmo ndvíduo, esse efeto será dferente de um valor de X j para outro. ) Por últmo, note-se que, para o º ndvíduo, os efetos margnas descrtos em [6] dependem, além do coefcente assocado, de um factor de proporconaldade dêntco, f(x β), qualquer que seja o regressor (X 2, ou X 3, etc., ou X k ) consderado. Uma vez que esse factor é, geralmente, postvo (recorde-se que f(.) desgna uma função de densdade), pode conclur-se que uma varação nfntesmal de X j, tudo o resto gual, nduz uma varação postva ou negatva na probabldade de ser Y =, conforme for postvo ou negatvo o coefcente β j. Em conclusão, enquanto na generaldade dos modelos de regressão lnear a estmatva de um coefcente fornece ndcação sobre o sentdo, postvo ou negatvo, da nfluênca de uma varável explcatva, X j, e sobre a grandeza dessa nfluênca (dêntca para todos os ndvíduos e, salvo não lneardade relatvamente às varáves ndependentes, ndependente do valor de X j ), nos modelos probt e logt a estmatva apenas dá, de medato, nformação sobre o sentdo da nfluênca. Informação sobre a grandeza do efeto requererá cálculos adconas, que conduzrão, geralmente, a resultados dferentes de ndvíduo para ndvíduo e dependentes do valor de X j. Embora, de um ponto de vsta teórco, seja mas fácl justfcar a adopção da especfcação normal para a função F(.), a especfcação que conduz à análse logt tem sdo a utlzada com maor frequênca, por razões que se prendem com a smplcdade da expressão analítca da sua função de dstrbução (por contraste com o ntegral requerdo em [9]) e com a facldade de cálculo na fase de estmação. As dstrbuções normal e logístca têm grande semelhança para argumentos na vznhança de 0, e é nas abas da dstrbução que a dferença é mas perceptível, com a logístca a apresentar abas "mas espessas". Para amostras em que a proporção de observações com Y = e a proporção com Y = 0 sejam equlbradas, não é de esperar grandes dferenças de resultados entre as duas especfcações. sendo As vantagens calculatóras da opção pelo logt são óbvas se se notar que,

10 E(Y) = Prob(Y = ) = + e -x e, por consegunte, vem Prob(Y = 0) = -x + e = e -x + e -x, e Prob(Y = ) Prob(Y = 0) = e x Prob(Y = ) ln = x. Prob(Y = 0) Tendo presente que o argumento x nas expressões acma é, neste contexto, X β, conclu-se que ln Prob(Y = ) = Prob(Y = 0) X β = β + β 2 X 2 + β 3 X β k X k, [7] com a varável no prmero membro da equação a exbr lneardade relatvamente aos coefcentes de nteresse. Essa varável é o logartmo natural da razão de probabldades (odds rato, na expressão em nglês). A razão de probabldades tem uma nterpretação sugestva: se as probabldades dos acontecmentos Y = e Y = 0 fossem, respectvamente, 0,8 e 0,2, dr-se-a que "as chances são de 4 para " em favor da verfcação do acontecmento a que corresponde Y =. Se o logartmo da razão de probabldades fosse observado (excepto por uma perturbação aleatóra), a equação em [7] podera servr de base a uma regressão lnear com as característcas habtuas. Veja-se que esse logartmo é uma varável contínua que assume valores de a +, à medda que a probabldade do acontecmento vara de 0 a. A smplcdade da equação [7] contrasta com Prob(Y = ) =, [8] β + β + β ) -( 2X kx k + e em que é patente a não lneardade da varável do prmero membro relatvamente aos coefcentes β, β 2,..., β k. Se o objectvo for a estmação das probabldades em [8], uma estratéga a consderar sera a de basear numa equação como [7] a estmação dos coefcentes e, depos, usar essas estmatvas na expressão [8].

11 Estmação de modelos lneares de probabldade Admta-se dsponível uma amostra de observações (X 2, X 3,..., X k ), =, 2,..., n, com a nformação, para cada uma das observações, sobre a verfcação do acontecmento em apreço, codfcada pela atrbução dos valores ou 0 a Y. O modelo pode ser escrto na forma habtual, Y = X β + u, em que X é a matrz (n k) cuja ª lnha é o vector X que se defnu acma, X = X X 2,... X n e Y é um vector (n ) de componentes Y, Y 2,..., Y n, guas, no caso, ou a 0, ou a. Desde que X tenha característca gual ao número de colunas, k, é possível calcular estmatvas de β por OLS segundo β = (X'X) - X'Y e, a partr delas, estmatvas de Prob(Y = ) de acordo com Pr ob( Y = ) = X β. Como já se afrmou, não está garantdo que as estmatvas da probabldade assm obtdas pertençam, para todo, ao ntervalo [0; ]. As perturbações aleatóras em u são heteroscedástcas e, por razões já conhecdas, o estmador OLS de β não é efcente. Sabe-se (de [5]) que Var(u) será uma matrz dagonal, em que o º elemento da dagonal prncpal é Var(u ) = p ( p ) = X β ( X β). [9] Uma vez que Var(u ) depende do vector β, desconhecdo, o estmador generalzado de mínmos quadrados (GLS), que sera o estmador lnear e cêntrco de varânca mínma, não é exequível. O estmador exequível (EGLS) é β EGLS = {X' [ Var( u) ] - X} - X' [ Var( u) ] - Y, [20] em que, por Var( u), se desgnou um estmador da matrz dagonal Var(u). Esse estmador pode ser construído substtundo β em [9] por β OLS. O procedmento equvalera a, ncalmente, estmar β por OLS, utlzar as estmatvas dos coefcentes para formar estmatvas das varâncas em [9] e, por últmo, a

12 reestmar β por EGLS. Embora não cêntrco em amostras fntas, o estmador assm defndo é consstente. Contudo, para as observações em que seja X β 0 ou X β, a estmatva da varânca segundo [9] conduzrá a valores negatvos ou nulos. Na lteratura, dos procedmentos ad hoc que têm sdo usados para ldar com o problema consstem na exclusão das observações em que tal suceda, ou na substtução de X β por um número próxmo de 0 (v.g., 0,0), quando X β 0, ou por um número próxmo de (v.g., 0,99), se X β. Em amostras de confguração pecular, é possível recorrer a uma varante, proposta por Goldberger, do procedmento de estmação que se acaba de descrever. A confguração em causa requer que, para cada sequênca ordenada (X 2, X 3,..., X k ) haja multplcdade de observações. Então, é possível calcular, para cada grupo de observações que apresentam exactamente os mesmos valores para todas as varáves explcatvas, a proporção das observações em que Y =, e utlzá-la como estmatva da probabldade (condconal a X 2 = X 2, X 3 = X 3,..., X k = X k ) de verfcação do acontecmento em causa. Essa proporção, que se desgnará por p, poderá assumr valores dferentes de 0 e. Pelo contráro, numa amostra em que não houvesse nenhum par de observações "repetdas" (sto é, com os mesmos valores para as varáves explcatvas), todas as proporções assm calculadas teram de ser ou 0, ou. Uma lustração do tpo de amostra referdo ocorre em estudos sobre a escolha de modos de transporte. Suponha-se que, para cada ndvíduo,, e para cada um de n das útes de certo mês, é regstado o modo de transporte empregue, públco ou prvado. As varáves que determnam a escolha (rendmento do ndvíduo, dstânca da resdênca ao trabalho, etc.) assumem valores mutáves para as n observações relatvas a uma pessoa nqurda, mas o modo de transporte utlzado pode não ser sempre o mesmo e verfcar-se que houve recurso aos transportes públcos em, por exemplo, 30% das deslocações efectuadas. O expedente que esta confguração da amostra vablza é o da substtução da sére de 0's e 's de valores de Y na amostra orgnal por uma sére de proporções p no ntervalo real [0, ]. Se as n observações relatvas ao º ndvíduo no da t (t =, 2,..., n ) obedecem a Y t = β + β 2 X 2t + β 3 X 3t β k X kt + u t, em que Y t = ou Y t = 0, X jt = X jt', para quasquer t, t' =, 2,..., n e j = 2, 3,..., k, e u t é uma perturbação aleatóra de méda nula e varânca p( p), somando essas observações e dvdndo por n, obtém-se n t= n Y t = β + β 2 X 2 + β 3 X β k X k + n t= n u t.

13 Para n fnto, a varável no prmero membro desta equação é a proporção p e a perturbação no segundo membro, que se desgnará por u, tem valor esperado nulo e varânca dada por p ( p )/n. Suponha-se que se formaram, a partr das observações orgnas e de acordo com a regra explcada acma, n observações agrupadas (uma por cada ndvíduo nqurdo, na lustração) e que se calculou p para cada um desses grupos. Seja p o vector-coluna em que se reunram essas n proporções e u o vector-coluna das perturbações correspondentes. Então, é O estmador OLS de β sera dado por p = X β + u. [2] β OLS = (X' X) X' p ; [22] como se sabe, conquanto cêntrco e consstente, esse estmador não é efcente. Uma alternatva sera o estmador GLS de β dado por β GLS = {X' [Var( u )] X} X' [Var( u )] p, [23] com Var( u ) a desgnar uma matrz dagonal em que o elemento genérco da dagonal prncpal é p( p)/n, Var( u ) = dag[p ( p )/n, p 2 ( p 2 )/n 2,..., p n ( p n )/n n ]. Uma vez que as probabldades p não são observadas, o estmador GLS exequível a empregar sera β EGLS = {X' [ Var( u) ] X} X' [ Var( u) ] p, [24] em que Var( u) desgna um estmador de Var( u ). Oferecem-se duas vas para a construção desse estmador: corresponde uma à utlzação drecta das proporções amostras, Var( u) = dag[p ( p )/n, p 2 ( p 2 )/n 2,..., p n ( p n )/n n ]; [25] parece preferível uma segunda va em que essas proporções seram substtuídas pelas estmatvas resultantes da estmação da equação [2] por OLS, e p = X β OLS, Var( u) = dag[ p ( p )/n, p 2 ( p 2 )/n 2,..., p n ( p n )/n n ]. [26]

14 Os estmadores defndos por [24] e [26] serão, geralmente, consstentes e assmptotcamente efcentes. Embora o procedmento que se acaba de descrever para amostras com observações repetdas permta, ao substtur uma varável dependente dcotómca por outra, contínua no ntervalo [0, ], mnorar o problema da possível obtenção de estmatvas de probabldades fora desse ntervalo, não o resolve por completo. Quando sso acontece, não é sequer possível construr a estmatva de Var( u ) segundo [26], devdo à presença de estmatvas (de varâncas) negatvas. Se é certo que com a fórmula em [25] tal não sucede, uma vez que se trata de proporções amostras, não é raro que entre essas proporções se ncluam algumas que são guas a 0 ou a ; nesse caso, haverá elementos nulos na dagonal prncpal da matrz da equação [25], essa matrz não será nvertível e, por consequênca, as estmatvas GLS defndas em [24] não são determnadas. Estmação de modelos probt e logt Seja o modelo Y = β + β 2 X 2 + β 3 X β k X k + u = X β + u, em que β é um vector de parâmetros a estmar. Apesar da lneardade de Y relatvamente a β, a equação não pode servr de base à estmação, porquanto a varável dependente não é observável. Observável é uma varável dcotómca Y tal que Y =, com probabldade F( X β), 0, com probabldade - F( Xβ) conforme se vu atrás (equações [3]). Seja F(.) uma ou outra das funções de dstrbução que se consderaram atrás, F(X β) não é função lnear de β e a estmação pelos métodos habtuas no contexto do modelo de regressão lnear não é possível. A estmação de modelos probt ou logt é feta, geralmente, pelo método da máxma verosmlhança. Admta-se dsponível uma amostra aleatóra em que há n 0 observações com Y = 0 e n (= n n 0 ) observações em que Y =. A função de verosmlhança é dada por L = Π 0 Prob(Y = 0) Π Prob(Y = ), em que Π 0 pretende sgnfcar o produto terado das n 0 observações para as quas Y = 0, enquanto Π corresponde ao produto terado das n observações restantes. É possível dar à função de verosmlhança uma expressão com notação mas smples, fazendo uso do facto de que Y apenas assume os valores 0 e :

15 Y { } n Y L = [ Prob(Y = 0) ] [ Prob(Y ] = ) ou, substtundo pelas expressões apropradas, = { } Y Y n L = [ F( X β ] [ F( X β ] = ) ). [27] 2 Os estmadores de máxma verosmlhança do vector β são as funções de valores amostras que maxmzam L em ordem a β. Como se sabe, é geralmente mas fácl determnar o máxmo da função logarítmca de verosmlhança, n ln L = {( Y ) ln[ F( X )] + Y ln[ F( X )]} = β β. [28] Os estmadores de máxma verosmlhança dos parâmetros do modelo (probt ou logt) são os que maxmzam a função L e, por mplcação, também a função em [28]. A condção usual para resolução do problema requer o anulamento das k dervadas parcas de prmera ordem, ou seja, requer ln L = 0, j =, 2,..., k. [29] β j A condção de 2ª ordem, por sua vez, será preenchda se, na vznhança do óptmo, for negatva defnda a matrz das dervadas parcas de 2ª ordem de ln L em ordem a β. O sstema de k equações em [29] não é lnear em β, β 2,..., β k, e não é possível, por sso, defnr por uma expressão analítca a solução do problema, seja F(.) a função de dstrbução normal dos modelos probt ou a função logístca dos modelos logt. Note-se, contudo, que a prmera classe de modelos é, do ponto de vsta calculatóro, bastante mas dfícl de tratar, por envolver a avalação de n ntegras. Esse é um dos factores que, antes do advento de meos de cálculo automátco poderosos, tornava popular o recurso à especfcação logt em detrmento do probt. Hoje em da, sabe-se que é côncava a função de verosmlhança para ambas as classes de modelos e que, por consequênca, o máxmo da função é únco (se exstr um máxmo); e há já software adequado para determnação desse máxmo sem grande 2 Embora se tenha usado, nas expressões acma, o símbolo L, smplesmente, para facltar a notação, deve ter-se presente que L se refere a uma função dos parâmetros do modelo, dados os valores amostras das varáves. Entre os parâmetros do modelo ncluem-se, de modo óbvo, os coefcentes das varáves explcatvas que são as componentes de β, e, eventualmente, também os parâmetros da matrz de varâncas e covarâncas das perturbações. Entenda-se, portanto, que L L(β X, X 2,..., X n,y, Y 2,..., Y n ).

16 custo. Não se entrará aqu, contudo, nos pormenores dos métodos de optmzação numérca que permtem a dentfcação do máxmo. É nstrutvo, no entanto, e útl para um desenvolvmento a apresentar adante, analsar neste contexto a formulação mas smples possível do problema, aquela em que o vector β tem uma únca componente, β. Ter-se-á, nesse caso, n ln L = {( Y ) ln [ F( )] Y ln [ F( β + β )]} = e, pela condção de ª ordem,, d ln L β d = 0 n ( Y ) = f( β ) ) Y f( β + F( β) F( β) = 0 (recorde-se que d F( β) = f(β ), por defnção de função de densdade) d β f( β) F( β ) n f( β n ) Y ( Y ) = 0 = F( β ) = n f( β) F( β ) = (n n ) f( β) F( β ) (usando a convenção ntroduzda anterormente de smbolzar por n o número de observações com Y = e por n0 (n 0 = n n ) o número de observações com Y = 0) F(β) = n. [30] n O valor máxmo da função logarítmca de verosmlhança, atngdo quando β satsfzer a condção em [30], será após smplfcação, n n ln L 0 = ( Y ) ln Y ln n = n + n ; ln L 0 = n ln n n ln n [3] n n

17 Note-se que os resultados em [30] e [3] foram obtdos sem que alguma vez se partcularzasse se F(.) se refera a uma dstrbução normal reduzda ou à função logístca, pelo que são váldos para ambos os casos. A nterpretação de [30] é, no entanto, dferente nos dos casos. Num modelo probt, o estmador de máxma verosmlhança de β é β tal que Φ( β ) = β 2π e 2 t 2 dt = n ; [32] n num modelo logt, o estmador de máxma verosmlhança de β é β tal que Λ( β ) = + e = n β n, donde resulta β = ln n n 0. [33] Por exemplo, se for de 50% a percentagem de observações com Y = na amostra, a estmatva de máxma verosmlhança de β será gual a 0, quer se trate de um modelo probt ou de um logt. Prova-se que, sob certas condções, os estmadores de máxma verosmlhança são consstentes e têm dstrbução assmptótca normal, que pode ser aproxmada, em amostras fntas, por uma dstrbução normal de méda β e matrz de varâncas e covarâncas 2 Var( ln L β ML ) = β β', [34] em que a matrz das dervadas parcas de 2ª ordem ndcada na expressão deve ser entendda como avalada para β = β ML. 3 Embora, com o software modernamente dsponível, a estmação de modelos probt e logt pelo método da máxma verosmlhança não suscte dfculdades de maor, é possível, apenas para o logt e para amostras com observações repetdas como se descreveu atrás, recorrer também à estmação por métodos de mínmos quadrados. Recordando (ver equação [7]) que 3 Há outras aproxmações possíves à matrz Var( β ML ); a escolha por uma ou outra aproxmação depende, geralmente, do algortmo usado na busca do máxmo da função, questão que não será dscutda neste texto.

18 ln p = X p β = β + β 2 X 2 + β 3 X β k X k, ocorre medatamente que podera obter-se estmatvas OLS dos coefcentes, por ajustamento de ln p = β p + β 2 X 2 + β 3 X β k X k + erro, desde que nenhuma das proporções amostras p fosse gual a 0 ou a. Em amostras sem observações repetdas, o uso desse expedente está, evdentemente, excluído. Avalação de resultados e análse estatístca As classes de modelos LPM, probt e logt têm em comum o facto de, neles, a varável dependente ser uma varável qualtatva com dos estados possíves, a que, habtualmente, se faz corresponder o símbolo ou o símbolo 0. Dspondo-se de uma amostra aleatóra de observações (X 2, X 3,..., X k ), =, 2,..., n, e anda, para cada observação, de nformação sobre a qual dos dos grupos possíves pertence, sera concebível proceder-se à estmação, com os mesmos dados, de um LPM (por OLS), de um probt, ou de um logt (por máxma verosmlhança). Que comparação se pode estabelecer entre os resultados segundo as três especfcações? No que toca a estmatvas dos coefcentes, as comparações fetas tendem a sugerr a valdade aproxmada das relações seguntes, para as estmatvas obtdas num LPM, β j,lpm, e num modelo logt, β j,l : β,lpm 0,25 β,l + 0,5, para o termo ndependente, e β j,lpm 0,25 β j,l, j = 2, 3,..., k, para os coefcentes das varáves ndependentes. Por sua vez, as estmatvas obtdas por probt, β j,p, e por logt, β j,l, tendem a verfcar, aproxmadamente, β j,l,6 β j,p, j = 2, 3,..., k, em que o factor,6 está assocado com a desgualdade da varânca das perturbações nos modelos logt (π 2 /3) e probt ().

19 Um segundo elemento de comparação dos resultados é o que respeta às estmatvas das probabldades. Quanto a esse aspecto, os modelos LPM, de um lado, e os modelos probt e logt, do outro, podem produzr resultados radcalmente dferentes. Como já se apontou, pode acontecer, com os prmeros, que as estmatvas se stuem fora do ntervalo [0, ]; com os outros, tal nunca sucede. De resto, tem-se constatado frequentemente que as estmatvas de probabldades obtdas pela formulação probt e pela formulação logt são muto semelhantes, o que não surpreende se se atender à smltude de comportamento das duas funções de dstrbução. Essa semelhança é, geralmente, mas acentuada quando, na amostra, são próxmas as proporções de ocorrênca dos dos valores possíves, Y = e Y = 0. Para a ª observação, a probabldade de ser Y = num LPM é estmada segundo = Pr ob( Y = ) = X β, [35] Y em que se desgnou por β o estmador (OLS ou EGLS) utlzado e se admtu ser 0. X β. Num modelo probt, essa probabldade sera estmada de acordo com e, num modelo logt, por Pr ob( Y = ) = Φ(X β ) = X β 2π e 2 t 2 dt [36] Pr ob( Y = ) = Λ(X β ) = + e -X β. [37] Quer em [36], quer em [37], desgnou-se, agora, por β o estmador de máxma verosmlhança do vector de coefcentes. Como se vu em secção anteror, ao contráro do que se passa nos modelos LPM, não é medata a nterpretação das estmatvas dos coefcentes dos modelos probt e logt. Nestes, a únca nformação óbva que se derva das estmatvas é a do snal, postvo ou negatvo, da nfluênca margnal do regressor em causa sobre a probabldade de verfcação do acontecmento. É usual, por sso, que, a par dessas estmatvas, seja fornecda nformação sobre a grandeza dessa nfluênca; e, uma vez que ela é varável de observação para observação e, também, com os valores das varáves explcatvas, a prátca corrente é a de calcular estmatvas desses efetos referdas às médas amostras dos regressores. Quando se contarem varáves dummy entre estes regressores, a abordagem mas correcta será a de confrontar as estmatvas de probabldades calculadas para o valor e para o valor 0 dessa varável explcatva bnára, para um mesmo vector de valores das outras varáves explcatvas.

20 Poderá ter algum nteresse dspor, para os modelos probt e logt, de um ndcador sntétco da qualdade do "ajustamento", smlar ao coefcente de determnação R 2 da regressão clássca. Um ndcador referdo por vezes é o chamado pseudo-r 2, defndo por ps.r 2 = ln L ( β ML ), [38] ln L em que ln L( β ML ) é o valor da função logarítmca de verosmlhança avalada para β ML (e, portanto, gual ao máxmo dessa função), enquanto ln L 0 desgna o máxmo dessa função, sob a restrção de serem nulos todos os coefcentes das varáves ndependentes (β 2 = β 3 =... =β k = 0). Este máxmo fo já calculado anterormente (ver equação [3]). À semelhança de R 2, o pseudo-r 2 assume apenas valores no ntervalo [0, ]; dferentemente de R 2, o pseudo-r 2 não tem nterpretação ntutva medata. Ter-se-a ps.r 2 = quando ln L( β ML ) = 0 e, portanto, L( β ML ) =. Recorde-se que a função de verosmlhança é um produto de n factores, cada um dos quas dado por Y [ Prob(Y = 0 ] [ Prob(Y = ] 0 Y ) ) ; logo, são todos não negatvos e não superores a (por corresponderem a probabldades). Então, o produto só sera gual a se esses n factores fossem todos guas a, o que exgra que, sendo Y =, fosse gual a a probabldade estmada de ser Y = ; e, sendo Y = 0, fosse também gual a a estmatva da probabldade de ser Y = 0 (ou, por outras palavras, que fosse 0 a estmatva da probabldade de ser Y = ). O modelo estmado sera então um "prevsor perfeto", no sentdo de predzer correctamente, para todas as observações sem excepção, a qual dos dos grupos pertenca. Tenha-se em atenção, contudo, que, seja F(.) a função de dstrbução normal reduzda ou a função logístca, apenas se aproxmara de (ou 0) se o argumento tendesse para nfnto (ou ). Um valor de ps.r 2 vrtualmente gual a sera mas sugestvo de uma má especfcação do que de um "perfeto ajustamento". No outro extremo, ter-se-a ps.r 2 = 0 quando ln L( β ML ) = ln L 0 e, por consegunte, quando fossem nulas todas as componentes do vector β ML, excepto a prmera (relatva ao termo ndependente). Nesse caso, nenhuma das varáves "explcatvas" afectara a probabldade de ocorrênca do acontecmento em análse. Como se vu na equação [30], a estmatva dessa probabldade sera, smplesmente, gual à proporção de observações na amostra com Y =. Outro elemento de aprecação dos resultados de estmação que, por vezes, se usa é uma matrz em que se confrontam as predções do modelo com a repartção efectva das observações da amostra pelos dos grupos em presença. Calculada, para cada observação, uma estmatva da probabldade de Y = (usando fórmulas já apresentadas e tendo em conta se se trata de um modelo probt ou de um logt), é

21 costume predzer-se Y = ou Y = 0 conforme essa estmatva exceda ou não 0,5. Depos, a nformação é organzada numa tabela da forma: Y predto = Y predto = 0 Totas Y observado = A B n Y observado = 0 C D n 0 Totas E F n Os números representados por A e D correspondem a prevsões acertadas do modelo, enquanto B e C quantfcam prevsões erradas. A proporção de observações erradamente classfcadas, (B+C)/n, é a chamada taxa aparente de erro. A esse respeto, refra-se que, como métodos de classfcação ou de prevsão, as análses probt e logt têm um competdor séro em prevsores ad hoc, como aquele que prevê, para toda e qualquer observação, o acontecmento com maor frequênca relatva na amostra. Por exemplo, se 90% das observações numa amostra apresentam Y =, o prevsor " Y =, " fará predções correctas em 90% das vezes, o que não dexa grande escopo para melhora a métodos mas complexos. Não é raro que, em termos de capacdade predtva, os métodos probt e logt apenas consgam uma melhora modesta sobre a desse prevsor ad hoc, anda quando consgam explcar razoavelmente os determnantes da probabldade do acontecmento em estudo. Essa é uma das razões por que, apesar do seu carácter atraente, a vala da nformação na tabela acma é, frequentemente, questonada. A análse estatístca dos modelos probt e logt é, geralmente, conduzda em termos análogos aos que se conhecem para o modelo de regressão lnear, apenas com as modfcações requerdas pelo carácter de aproxmação assmptótca da matrz de varâncas estmadas em [34]. Assm, testes de hpóteses sobre coefcentes ndvduas podem ser conduzdos da forma usual. Embora se contnue a desgnar, por abuso de lnguagem, o quocente da estmatva do coefcente pela estmatva do desvo-padrão do estmador por ráco t, os valores crítcos aproxmados devem obterse nas tabelas da dstrbução normal reduzda. Testes de hpóteses sobre restrções aos parâmetros envolvem uma comparação entre os máxmos da função logarítmca de verosmlhança atngdos quando as restrções são observadas e quando são gnoradas, à semelhança do que na regressão lnear clássca se faz com as somas de quadrados dos resíduos. A estatístca de teste (chamada razão de verosmlhança) é calculada como 2 (ln L r ln L u ), [39] em que ln L r desgna o valor da função logarítmca de verosmlhança quando maxmzada sob as restrções fxadas na hpótese nula sob teste e ln L u o valor da função logarítmca de verosmlhança sem restrções (para que se usou atrás o símbolo ln L( β ML )). O valor crítco aproxmado é obtdo nas tabelas da dstrbução do ququadrado, com número de graus de lberdade gual ao de restrções consderadas na hpótese nula.

22 Um caso partcular de uso da razão de verosmlhança que tem partcular nteresse em modelos estmados pelo método da máxma verosmlhança ocorre no teste da hpótese nula β 2 = β 3 =... = β k = 0, que tem alcance análogo ao do teste de sgnfcânca global na regressão clássca. Sob essa hpótese, tem-se, assmptotcamente, 2 [ln L 0 ln L( β ML )] χ 2 (k ), [40] em que o sgnfcado dos símbolos é o exposto a propósto do pseudo-r 2. É frequente, no relato dos resultados de estmação destes modelos, dar-se conta do valor amostral da estatístca em [40] como ndcador sumáro da qualdade do "ajustamento", em papel semelhante ao que, na regressão clássca, se conferra à estatístca F para teste da mesma hpótese nula. Refra-se, a termnar, que, ao contráro do que se passa no modelo clássco de regressão lnear, ou em mas alto grau do que nesse, se tem constatado, em modelos como o probt ou logt, forte sensbldade dos resultados e propredades dos estmadores a stuações como a não normaldade da dstrbução dos erros, heteroscedastcdade ou erros de especfcação. Dado o papel crucal da hpótese da normaldade em algumas das formulações expostas, não é, talvez, surpreendente essa sensbldade. Tal como no modelo lnear clássco se enxertaram numerosíssmos desenvolvmentos e extensões, também nos modelos com varável qualtatva ou dependente há uma vasta lteratura que prolonga as potencaldades dos modelos baslares ora estudados. Identfcação dos parâmetros de modelos probt e logt A possbldade de dentfcar os parâmetros de uma população, a partr de uma amostra dela extraída, não é lmtada. Esse é o facto subjacente a um problema complexo de Econometra, conhecdo pela questão da dentfcação. Afloramentos dessa questão surgem logo no modelo clássco de regressão lnear. É conhecdo, por exemplo, que com uma amostra de dmensão nferor ao número de parâmetros do modelo não é possível estmá-los ou, pelo menos, estmá-los a todos. Embora possbldade de estmação e dentfcação não sejam snónmos, os dos tpos de problema aparecem, frequentemente, assocados. Um outro exemplo, anda no domíno da regressão clássca, ocorre a propósto do termo ndependente. Consderem-se os modelos Y = β + β 2 X + u, em que u é uma perturbação aleatóra de méda nula, e Y = β + β 2 X + v, em que é v u + 2 e β = β 2. Por muto grande que seja a dmensão da amostra de observações dos pares (X, Y), não é possível dstngur se foram geradas por um ou outro dos dos modelos, o prmero com termo constante β e perturbações de méda 0, o segundo com termo constante β e perturbações de méda 2. Se a perturbação aleatóra de um modelo tver valor esperado µ, constante, mas não gual a 0, a soma (β + µ) é dentfcável e pode ser estmada, mas nem β, nem µ, soladamente, o serão. Essa é, de resto, uma

23 das razões por que, na generaldade das análses econométrcas, não é conferdo grande nteresse às estmatvas de termos constantes. Para uma tercera lustração, seja o modelo não lnear Y = β 2 X + u. É óbvo que o parâmetro β não pode ser dentfcado, já que qualquer amostra gerada com um valor de β sera dêntca à gerada com o valor smétrco. No entanto, β 2 é dentfcável e, por essa razão, costuma dzer-se que β é dentfcável, excepto pelo snal. Mas prementes nos modelos não lneares e nos modelos multequaconas, os problemas de dentfcação colocam-se, também, naqueles em que a varável dependente é qualtatva ou lmtada. Duas característcas comuns destes são: ) uma relação estrutural que envolve uma varável dependente, Y, que não é observável ou, pelo menos, não é observável para todos os ndvíduos da população; 2) uma regra que determna uma varável observada, Y, em função da varável latente, Y, ou, se Y é observável para apenas alguns ndvíduos da população, que dscrmna entre esses e os restantes. A restrção à observabldade de Y actua como um fltro que dstorce a magem da relação que se pretende estmar e, em alguns casos, a dstorce a ponto de mpedr a dentfcação de certos parâmetros. Por exemplo, num exercíco de tro em que a nformação dsponível se cnja a "acertou, ou falhou", não é possível dentfcar o parâmetro assocado com a dspersão dos tros em torno do alvo; já o sera, contudo, se se dspusesse de nformação quanto à dstânca do ponto de mpacto relatvamente ao centro do alvo, para os projéctes que embateram numa vznhança desse centro. Para dscutr a questão da dentfcação em modelos probt e logt, consderese uma população A, caracterzada pelas relações Y A = β + β 2 X + u, E(u ) = 0, Y = A, se Y > 0 A. 0, se Y 0 por Em prmero lugar, confronte-se essa população com outra, B, caracterzada Y B = α + β 2 X + v, α = β µ, v u + µ, E(v ) = µ, Y = B, se Y > 0 B. 0, se Y 0 A Para todos os pares (X, u ), é Y = Y B ; por consegunte, também a varável observada Y será dêntca. Não é possível determnar, a partr de qualquer amostra de observações (X, Y ), se fo gerada pela população A ou pela população B e, portanto, se os parâmetros relevantes são β, β 2, 0, ou α, β 2, µ. Em segundo lugar, confronte-se A com a população C, em que

24 Y C = α + β 2 X + u, α = β + λ, E(u ) = 0, Y =, se Y 0, se Y C C > λ λ. Desta vez, são dferentes, para cada par (X, u ), as varáves latentes Y C e Y A ( Y C A = Y + λ), mas a varável observada, Y, é a mesma, tornando mpossível dstngur se, na população, o lmar de transção de Y = 0 para Y = é 0 e o termo constante é β, ou se são λ e α, respectvamente. As comparações efectuadas permtem conclur que não é possível dentfcar três constantes: o termo ndependente da relação estrutural, o valor médo das perturbações e o lmar de transção. É possível, no entanto, dentfcar uma constante que descreve, em condções que se precsarão abaxo, o efeto conjugado desses três factores. Para assegurar comparabldade de resultados, a convenção de normalzação usualmente adoptada é a de postular serem guas a 0 as duas últmas constantes referdas e dexar, portanto, que seja a estmatva de β a reflectr a nfluênca conjunta. Para uma tercera lustração, comparem-se A e D, com Y D = α + α 2 X + v, α = σβ, α 2 = σβ 2, v = σu, Y =, se Y 0, se Y D D > 0 0, com σ > 0. Para cada par (X, u ), as varáves latentes Y D e Y A são, novamente, dferentes (agora, Y D = σ Y A ), mas é óbvo que, sempre que for Y A > 0, também D será Y > 0. Por consegunte, a varável observada, Y, será a mesma, quer a população tenha por parâmetros β, β 2 e Var(u), ou σβ, σβ 2 e σ 2 Var(u). Do que acaba de expor-se neste últmo exemplo, devem reter-se duas consequêncas. A prmera é a de que a varânca das perturbações em modelos probt ou logt não é dentfcável: há uma nfndade de populações, cada uma com o seu valor para σ, de que poderá ter sdo extraída uma certa amostra de pares (X, Y ). A segunda conclusão a trar é a de que não é possível dstngur amostras de populações com coefcentes β, β 2 das geradas por populações com coefcentes σβ, σβ 2. Costuma referr-se esta stuação dzendo que os coefcentes da relação são dentfcados, excepto por um factor de proporconaldade constante. Abordada a questão da dentfcação com recurso a alguns exemplos smples, passar-se-á, na sequênca, a um tratamento mas formal do problema. Analsar-se-á, apenas, o caso dos modelos probt, mas é fácl a extensão dos resultados à especfcação logt. Mostrar-se-á, em prmero lugar, que, em condções a explctar adante, o mesmo conjunto de observações pode ter sdo gerado ndstntamente por uma de váras estruturas, o que mpossblta a dentfcação de alguns dos parâmetros estruturas. Provar-se-á, em segundo lugar, que não é possível obter estmatvas para todos os parâmetros requerdos por uma especfcação supostamente mas geral.

25 Com esse objectvo, consderem-se as especfcações Z = δ + δ 2 X 2 + δ 3 X δ k X k + v = X δ + v [4] Y =, se Z > 0 0, se Z 0 [42] e v N(0,) [43] W = γ + γ 2 X 2 + γ 3 X γ k X k + w = X γ + w [44] Y =, se W > λ 0, se W λ [45] w N(µ,σ 2 ) [46] São parâmetros do prmero modelo as k componentes do vector δ, δ, δ 2,..., δ k ; no segundo, além dos k coefcentes γ, γ 2,..., γ k, ncluem-se λ, µ e σ 2 como parâmetros adconas. As observações das populações em causa são, genercamente, do tpo (X 2, X 3,..., X k, Y ), em que Y é um mero ndcador, codfcado com os valores 0 e, da pertença da ª observação a um de dos grupos possíves. Buscar-se-á, na sequênca, resposta para duas questões. Podem as observações ser geradas, ndstntamente, por qualquer das estruturas em confronto, apesar da dspardade de especfcações quanto a aspectos como os parâmetros da dstrbução das perturbações aleatóras, ou como a defnção da varável observada a partr da varável latente? Em caso afrmatvo, em que condções? Para verfcar que a resposta à prmera questão é afrmatva, e que os dos modelos são equvalentes, sob o ponto de vsta de poderem gerar amostras perfetamente concdentes, analsem-se as consequêncas das três acções seguntes: ) Some-se e subtraa-se µ ao segundo membro da equação [44]; obter-se-á W = (γ + µ) + γ 2 X 2 + γ 3 X γ k X k + (w µ) e, evdentemente, não se altera com sso o valor de W, nem a regra em [45] conduz a observações de Y dferentes das anterores. 2) Subtraa-se λ a ambos os membros da equação anteror; vem W λ = (γ + µ λ) + γ 2 X 2 + γ 3 X γ k X k + (w µ).

26 Se se modfcar [45] para ou seja, se, se W λ > λ λ Y = 0, se W λ λ λ,, se W λ > 0 Y =, 0, se W λ 0 as observações de Y serão as mesmas que anterormente. 3) Por últmo, dvdam-se ambos os membros da equação acma por σ > 0; vrá W λ σ = γ + µ λ + γ 2 σ σ X 2 + γ 3 σ X γ k σ X k + w µ σ. [47] É medato que a dvsão de ( W λ) por uma constante postva não trará modfcação alguma aos valores observados para Y, que contnuarão a ser dados por Y =, se W λ > 0. 0, se W λ 0 Deve já ser claro que o modelo resultante das transformações ndcadas é, essencalmente, o postulado em [4]-[43]: a perturbação w µ verfca [43] (sto é, σ tem dstrbução normal de parâmetros 0 e ), a relação entre Y e a varável latente é a prevsta em [42] e, do confronto da equação [47] com a equação [4], depreende-se que as observações extraídas das duas populações serão concdentes se for δ = γ + µ λ, σ [48] δ j = γ j σ, para j = 2, 3,..., k. De facto, se as condções em [48] se verfcarem, ter-se-á, para qualquer X, E( Z X ) = E( W λ X σ ), Var( Z X ) = Var( W λ X σ ), e, como Z e W λ têm ambas dstrbução normal, a dentdade da méda e da σ varânca é sufcente para garantr a dentdade das dstrbuções.

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva.

A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. Dstrbução de Frequênca Tabela prmtva ROL Suponhamos termos feto uma coleta de dados relatvos à estaturas de quarenta alunos, que compõem uma amostra dos alunos de um colégo A, resultando a segunte tabela

Leia mais

Análise dos resíduos e Outlier, Alavancagem e Influência

Análise dos resíduos e Outlier, Alavancagem e Influência Análse dos resíduos e Outler, Alavancagem e Influênca Dagnóstco na análse de regressão Usadas para detectar problemas com o ajuste do modelo de regressão. Presença de observações mal ajustadas (pontos

Leia mais

Probabilidade e Estatística. Correlação e Regressão Linear

Probabilidade e Estatística. Correlação e Regressão Linear Probabldade e Estatístca Correlação e Regressão Lnear Varáves Varável: característcas ou tens de nteresse de cada elemento de uma população ou amostra Também chamada parâmetro, posconamento, condção...

Leia mais

Variáveis Indicadoras. Roteiro. Introdução

Variáveis Indicadoras. Roteiro. Introdução Varáves Indcadoras Rotero 1. Introdução 2. Varável Bnára de Intercepto 3. Varável de Interação 4. Aplcação 5. Varáves Qualtatvas com Váras Categoras 6. Referêncas Introdução Varáves Bnáras Modelo estenddo

Leia mais

Escola Secundária de Lousada Ficha de trabalho de Matemática do 7º ano nº Data: / / 2011 Assunto: Tratamento de dados I Lições nº, e,

Escola Secundária de Lousada Ficha de trabalho de Matemática do 7º ano nº Data: / / 2011 Assunto: Tratamento de dados I Lições nº, e, Escola Secundára de Lousada Fcha de trabalho de Matemátca do 7º ano nº Data: / / 2011 Assunto: Tratamento de dados I Lções nº, e, Estatístca é um ramos da Matemátca que permte fazer um estudo de uma forma

Leia mais

Coordenação de Semáforos

Coordenação de Semáforos Paragem dos Veículos Veículos "Lbertados" Paragem dos Veículos Veículos "Lbertados" "Agrupamento " Pelotões "Agrupamento " Pelotões C O O R D E N A Ç Ã O Onda Verde... IST/ Lcencaturas em Engª Cvl & Terrtóro

Leia mais

Determinantes. De nição de determinante de uma matriz quadrada. Determinantes - ALGA - 2004/05 15

Determinantes. De nição de determinante de uma matriz quadrada. Determinantes - ALGA - 2004/05 15 Determnantes - ALGA - 004/05 15 Permutações Determnantes Seja n N Uma permutação p = (p 1 ; p ; : : : ; p n ) do conjunto f1; ; ; ng é um arranjo dos n números em alguma ordem, sem repetções ou omssões

Leia mais

CÁLCULO DA DIRECTRIZ

CÁLCULO DA DIRECTRIZ CÁCUO DA DIRECTRIZ I - Elementos de defnção da polgonal de apoo: - Coordenadas dos vértces da polgonal (M, P ); - Dstânca entre vértces da polgonal ( d); - Rumos dos alnhamentos (ângulo que fazem com a

Leia mais

Probabilidade: Diagramas de Árvore

Probabilidade: Diagramas de Árvore Probabldade: Dagramas de Árvore Ana Mara Lma de Faras Departamento de Estatístca (GET/UFF) Introdução Nesse texto apresentaremos, de forma resumda, concetos e propredades báscas sobre probabldade condconal

Leia mais

O que heterocedasticidade? Heterocedasticidade. Por que se preocupar com heterocedasticidade? Exemplo de heterocedasticidade.

O que heterocedasticidade? Heterocedasticidade. Por que se preocupar com heterocedasticidade? Exemplo de heterocedasticidade. Heterocedastcdade y = β 0 + β + β + β k k + u O que heterocedastcdade? Lembre-se da hpótese de homocedastcdade: condconal às varáves eplcatvas, a varânca do erro, u, é constante Se sso não for verdade,

Leia mais

ESTATÍSTICA. na Contabilidade Revisão - Parte 2. Medidas Estatísticas

ESTATÍSTICA. na Contabilidade Revisão - Parte 2. Medidas Estatísticas 01/09/01 ESTATÍSTICA na Contabldade Revsão - Parte Luz A. Bertolo Meddas Estatístcas A dstrbução de frequêncas permte-nos descrever, de modo geral, os grupos de valores (classes) assumdos por uma varável.

Leia mais

Casos de estimação do modelo de ajustamento da dívida com o xtabond2 do Stata

Casos de estimação do modelo de ajustamento da dívida com o xtabond2 do Stata Lus Fernandes Rodrgues Casos de estmação do modelo de ajustamento da dívda com o xtabond do Stata Arellano-Bond (99) nspraram-se na forma de nstrumentar de Holtz-Eakn, Newe, e Rosen (988) que preconzam,

Leia mais

Comprimento de Arco. Comprimento de Arco

Comprimento de Arco. Comprimento de Arco UNIVERSIDADE DO ESTADO DE MATO GROSSO CAMPUS UNIVERSITÁRIO DE SINOP FACULDADE DE CIÊNCIAS EXATAS E TECNOLÓGICAS CURSO DE ENGENHARIA CIVIL DISCIPLINA: CÁLCULO DIFERENCIAL E INTEGRAL I Comprmento de Arco

Leia mais

Critérios de divisibilidade em bases numéricas genéricas

Critérios de divisibilidade em bases numéricas genéricas Crtéros de dvsbldade em bases numércas genércas Clezo A. Braga 1 Jhon Marcelo Zn 1 Colegado do Curso de Matemátca - Centro de Cêncas Exatas e Tecnológcas da Unversdade Estadual do Oeste do Paraná Caxa

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos Curso de extensão, MMQ IFUSP, feverero/4 Alguns exercíco báscos I Exercícos (MMQ) Uma grandeza cujo valor verdadero x é desconhecdo, fo medda três vezes, com procedmentos expermentas dêntcos e, portanto,

Leia mais

b. As medidas de posição mais importantes são as medidas de tendência central. Dentre elas, destacamos: média aritmética, mediana, moda.

b. As medidas de posição mais importantes são as medidas de tendência central. Dentre elas, destacamos: média aritmética, mediana, moda. Meddas de Posção Introdução a. Dentre os elementos típcos, destacamos aqu as meddas de posção _ estatístcas que representam uma sére de dados orentando-nos quanto à posção da dstrbução em relação ao exo

Leia mais

MÉTODO DE FIBONACCI. L, em que L

MÉTODO DE FIBONACCI. L, em que L Métodos de bonacc e da Seção Aúrea Adotando a notação: MÉTODO DE IBOACCI L e L L, em que L b a, resulta a: ncal orma Recursva: ara,,, - (-a) ou ara,,, - (-b) A esta equação se assoca a condção de contorno

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

Y = AN α, 0 < α < 1 (1) Π = RT CT = P Y W N (2) Π/ N = α N α -1 AP W = 0. W = α P AN α -1. P = W/α AN α -1

Y = AN α, 0 < α < 1 (1) Π = RT CT = P Y W N (2) Π/ N = α N α -1 AP W = 0. W = α P AN α -1. P = W/α AN α -1 Gabarto da Lsta 1 de Macro II 2008.01 1 a Questão a)falso, pode ocorrer que a força de trabalho cresça juntamente com o número de empregados. Se a Força de trabalho crescer mas que o número de empregados

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

Proposta de resolução da Prova de Matemática A (código 635) 21 de Junho de 2010

Proposta de resolução da Prova de Matemática A (código 635) 21 de Junho de 2010 Proposta de resolução da Prova de Matemátca A (códgo 6 Como A e B são acontecmentos ncompatíves, 0 e Ou seja, de acordo com os dados do enuncado, 0% 0% 0% Versão : B Versão : C Como se trata de uma únca

Leia mais

Em muitas aplicações, estamos interessados em subgrafos especiais de um determinado grafo.

Em muitas aplicações, estamos interessados em subgrafos especiais de um determinado grafo. .4 Árvores Geradoras Em mutas aplcações estamos nteressados em subgrafos especas de um determnado grafo. Defnção Árvore Geradora - uma árvore T é chamada de árvore geradora de um grafo G se T é um subgrafo

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca

Leia mais

Teoria Elementar da Probabilidade

Teoria Elementar da Probabilidade 10 Teora Elementar da Probabldade MODELOS MATEMÁTICOS DETERMINÍSTICOS PROBABILÍSTICOS PROCESSO (FENÓMENO) ALEATÓRIO - Quando o acaso nterfere na ocorrênca de um ou mas dos resultados nos quas tal processo

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ 1 É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

Laboratório de Mecânica Aplicada I Determinação de Centros de Gravidade

Laboratório de Mecânica Aplicada I Determinação de Centros de Gravidade Laboratóro de Mecânca Aplcada I Determnação de Centros de Gravdade 1 Introdução Em mutos problemas de mecânca o efeto do peso dos corpos é representado por um únco vector, aplcado num ponto denomnado centro

Leia mais

Interpolação Segmentada

Interpolação Segmentada Interpolação Segmentada Uma splne é uma função segmentada e consste na junção de váras funções defndas num ntervalo, de tal forma que as partes que estão lgadas umas às outras de uma manera contínua e

Leia mais

O mercado de oligopólio

O mercado de oligopólio Fernando Branco Ano lectvo 2003-2004 Trmestre de Inverno Sessão 6 O mercado de olgopólo Exstem poucas empresas Produtos dferencados ou homogéneo Interacções estratégcas: As decsões de umas empresas afectam

Leia mais

Modelos Dinâmicos com Dados em Painel: revisão de literatura

Modelos Dinâmicos com Dados em Painel: revisão de literatura Modelos Dnâmcos com Dados em Panel: revsão de lteratura Outubro, Luís Davd Marques lbmarq@fep.up.pt CEMPRE *, FACULDADE DE ECOOMIA DO PORO RUA DR. ROBERO FRIAS, 4 PORO, PORUGAL ABSRAC Snce Hsao [986] s

Leia mais

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo 3 Metodologa de Avalação da Relação entre o Custo Operaconal e o Preço do Óleo Este capítulo tem como objetvo apresentar a metodologa que será empregada nesta pesqusa para avalar a dependênca entre duas

Leia mais

PREFEITURA DA CIDADE DE SÃO PAULO SECRETARIA MUNICIPAL DE TRANSPORTES. CONCORRÊNCIA nº /12-SMT Processo Administrativo nº 2010-0.349.

PREFEITURA DA CIDADE DE SÃO PAULO SECRETARIA MUNICIPAL DE TRANSPORTES. CONCORRÊNCIA nº /12-SMT Processo Administrativo nº 2010-0.349. SECRETARIA MUNICIPAL DE TRANSPORTES MINUTA Fls.... do PA nº 2010-0.349.079-0, (a)... PREFEITURA DA CIDADE DE SÃO PAULO SECRETARIA MUNICIPAL DE TRANSPORTES CONCORRÊNCIA nº /12-SMT Processo Admnstratvo nº

Leia mais

4 Critérios para Avaliação dos Cenários

4 Critérios para Avaliação dos Cenários Crtéros para Avalação dos Cenáros É desejável que um modelo de geração de séres sntétcas preserve as prncpas característcas da sére hstórca. Isto quer dzer que a utldade de um modelo pode ser verfcada

Leia mais

LEIS DE KIRCHHOFF EM CIRCUITOS DE CORRENTE CONTÍNUA

LEIS DE KIRCHHOFF EM CIRCUITOS DE CORRENTE CONTÍNUA EXPERIÊNCI 04 LEIS DE KIRCHHOFF EM CIRCUITOS DE CORRENTE CONTÍNU 1. OBJETIVOS a) Determnar a força eletromotrz e a resstênca nterna de uma batera em um crcuto de malha únca. b) Calcular a resstênca nterna

Leia mais

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência. MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada,

Leia mais

3 A técnica de computação intensiva Bootstrap

3 A técnica de computação intensiva Bootstrap A técnca de computação ntensva ootstrap O termo ootstrap tem orgem na expressão de língua nglesa lft oneself by pullng hs/her bootstrap, ou seja, alguém levantar-se puxando seu própro cadarço de bota.

Leia mais

Gabarito da Lista de Exercícios de Econometria I

Gabarito da Lista de Exercícios de Econometria I Gabarto da sta de Exercícos de Econometra I Professor: Rogéro lva Mattos Montor: eonardo enrque A. lva Questão Y X y x xy x ŷ ˆ ˆ y ŷ (Y - Y ) (X - X ) (Ŷ - Y ) 360 00-76 -00 35.00 40.000 36-4 30.976 3076

Leia mais

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária. Modelagem multvarável com varáves quanttatvas e qualtatvas, com resposta bnára. O modelo de regressão não lnear logístco ou modelo logístco é utlzado quando a varável resposta é qualtatva com dos resultados

Leia mais

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear normal com erros heterocedástcos O método de mínmos quadrados ponderados Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

2 PROPRIEDADES ÓPTICAS

2 PROPRIEDADES ÓPTICAS 23 2 PROPRIEDADES ÓPTICAS A segur será feta uma revsão sobre as prncpas propredades óptcas de nteresse para o nosso estudo. 2.1. Luz Segundo Maxwell, a luz é uma modaldade de energa radante que se propaga

Leia mais

MODELOS DE REGRESSÃO PARAMÉTRICOS

MODELOS DE REGRESSÃO PARAMÉTRICOS MODELOS DE REGRESSÃO PARAMÉTRICOS Às vezes é de nteresse nclur na análse, característcas dos ndvíduos que podem estar relaconadas com o tempo de vda. Estudo de nsufcênca renal: verfcar qual o efeto da

Leia mais

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais

R X. X(s) Y Y(s) Variáveis aleatórias discretas bidimensionais 30 Varáves aleatóras bdmensonas Sea ε uma experênca aleatóra e S um espaço amostral assocado a essa experênca. Seam X X(s) e Y Y(s) duas funções cada uma assocando um número real a cada resultado s S.

Leia mais

Covariância na Propagação de Erros

Covariância na Propagação de Erros Técncas Laboratoras de Físca Lc. Físca e Eng. omédca 007/08 Capítulo VII Covarânca e Correlação Covarânca na propagação de erros Coefcente de Correlação Lnear 35 Covarânca na Propagação de Erros Suponhamos

Leia mais

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu 1 Programação Não Lnear com Restrções Aula 9: Programação Não-Lnear - Funções de Váras Varáves com Restrções Ponto Regular; Introdução aos Multplcadores de Lagrange; Multplcadores de Lagrange e Condções

Leia mais

Estatística I Licenciatura MAEG 2006/07

Estatística I Licenciatura MAEG 2006/07 Estatístca I Lcencatura MAEG 006/07 AMOSTRAGEM. DISTRIBUIÇÕES POR AMOSTRAGEM.. Em determnada unversdade verfca-se que 30% dos alunos têm carro. Seleccona-se uma amostra casual smples de 0 alunos. a) Qual

Leia mais

Algarismos Significativos Propagação de Erros ou Desvios

Algarismos Significativos Propagação de Erros ou Desvios Algarsmos Sgnfcatvos Propagação de Erros ou Desvos L1 = 1,35 cm; L = 1,3 cm; L3 = 1,30 cm L4 = 1,4 cm; L5 = 1,7 cm. Qual destas meddas está correta? Qual apresenta algarsmos com sgnfcado? O nstrumento

Leia mais

Caderno de Fórmulas. CCB, CCE e NCE - Cetip21

Caderno de Fórmulas. CCB, CCE e NCE - Cetip21 - Cetp21 Elaboração: Novembro/2005 Últma Atualzação: 27/05/2016 Apresentação E ste Caderno de Fórmulas tem por objetvo nformar aos usuáros a metodologa e os crtéros de precsão dos cálculos referentes às

Leia mais

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear clássco com erros heterocedástcos O método de mínmos quadrados ponderados 1 Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

7 - Distribuição de Freqüências

7 - Distribuição de Freqüências 7 - Dstrbução de Freqüêncas 7.1 Introdução Em mutas áreas há uma grande quantdade de nformações numércas que precsam ser dvulgadas de forma resumda. O método mas comum de resumr estes dados numércos consste

Leia mais

Associação entre duas variáveis quantitativas

Associação entre duas variáveis quantitativas Exemplo O departamento de RH de uma empresa deseja avalar a efcáca dos testes aplcados para a seleção de funconáros. Para tanto, fo sorteada uma amostra aleatóra de 50 funconáros que fazem parte da empresa

Leia mais

1ª e 2ª leis da termodinâmica

1ª e 2ª leis da termodinâmica 1ª e 2ª les da termodnâmca 1ª Le da Termodnâmca Le de Conservação da Energa 2ª Le da Termodnâmca Restrnge o tpo de conversões energétcas nos processos termodnâmcos Formalza os concetos de processos reversíves

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~vall/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal http://www.mat.ufrgs.br/~vall/ ou expermental. Numa relação

Leia mais

Sistemas de equações lineares

Sistemas de equações lineares Sstemas - ALGA - / Sstemas de equações lneares Uma equação lnear nas ncógntas ou varáves x ; x ; :::; x n é uma expressão da forma: a x + a x + ::: + a n x n = b onde a ; a ; :::; a n ; b são constantes

Leia mais

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha)

X = 1, se ocorre : VB ou BV (vermelha e branca ou branca e vermelha) Estatístca p/ Admnstração II - Profª Ana Cláuda Melo Undade : Probabldade Aula: 3 Varável Aleatóra. Varáves Aleatóras Ao descrever um espaço amostral de um expermento, não especfcamos que um resultado

Leia mais

Medidas de tendência central. Média Aritmética. 4ª aula 2012

Medidas de tendência central. Média Aritmética. 4ª aula 2012 Estatístca 4ª aula 2012 Meddas de tendênca central Ajudam a conhecer a analsar melhor as característcas de dados colhdos. Chamamos de meddas de tendênca central em decorrênca dos dados observados apresentarem

Leia mais

Nome: Nº: Estatística para Economia e Gestão Licenciaturas em Economia e Gestão. 2.º Semestre de 2008/2009

Nome: Nº: Estatística para Economia e Gestão Licenciaturas em Economia e Gestão. 2.º Semestre de 2008/2009 Estatístca para Economa e Gestão Lcencaturas em Economa e Gestão.º Semestre de 008/009 Exame Fnal (.ª Época) 16 de Junho de 009; 17h30m Duração: 10 mnutos INSTRUÇÕES Escreva o nome e número de aluno em

Leia mais

Conceitos básicos de transferência de Calor:

Conceitos básicos de transferência de Calor: Condução - Le de ourer Concetos báscos de transferênca de Calor: órmula geral para 3 dmensões: ρc = λ t x + λ x y + λ y z p x y z z com ρ - densdade (Kg/m³). λ - condutvdade térmca na drecção (x, y ou

Leia mais

Testes não-paramétricos

Testes não-paramétricos Testes não-paramétrcos Prof. Lorí Val, Dr. http://www.mat.ufrgs.br/val/ val@mat.ufrgs.br Um teste não paramétrco testa outras stuações que não parâmetros populaconas. Estas stuações podem ser relaconamentos,

Leia mais

Laboratório de Mecânica Aplicada I Estática: Roldanas e Equilíbrio de Momentos

Laboratório de Mecânica Aplicada I Estática: Roldanas e Equilíbrio de Momentos Laboratóro de Mecânca Aplcada I Estátca: Roldanas e Equlíbro de Momentos 1 Introdução O conhecmento das condções de equlíbro de um corpo é mprescndível em númeras stuações. Por exemplo, o estudo do equlíbro

Leia mais

Introdução e Organização de Dados Estatísticos

Introdução e Organização de Dados Estatísticos II INTRODUÇÃO E ORGANIZAÇÃO DE DADOS ESTATÍSTICOS 2.1 Defnção de Estatístca Uma coleção de métodos para planejar expermentos, obter dados e organzá-los, resum-los, analsá-los, nterpretá-los e deles extrar

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Constata-se, freqüentemente, a estênca de uma relação entre duas (ou mas) varáves. Se tal relação é de natureza quanttatva, a correlação é o nstrumento adequado para descobrr e medr

Leia mais

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.

Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral. DEFINIÇÕES ADICIONAIS: PROBABILIDADE Espaço amostral (Ω) é o conjunto de todos os possíves resultados de um expermento. Evento é qualquer subconjunto do espaço amostral. Evento combnado: Possu duas ou

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRGS Insttuto de Matemátca

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ Em mutas stuações duas ou mas varáves estão relaconadas e surge então a necessdade de determnar a natureza deste relaconamento. A análse

Leia mais

Controle Estatístico de Qualidade. Capítulo 8 (montgomery)

Controle Estatístico de Qualidade. Capítulo 8 (montgomery) Controle Estatístco de Qualdade Capítulo 8 (montgomery) Gráfco CUSUM e da Méda Móvel Exponencalmente Ponderada Introdução Cartas de Controle Shewhart Usa apenas a nformação contda no últmo ponto plotado

Leia mais

TEORIA DE ERROS * ERRO é a diferença entre um valor obtido ao se medir uma grandeza e o valor real ou correto da mesma.

TEORIA DE ERROS * ERRO é a diferença entre um valor obtido ao se medir uma grandeza e o valor real ou correto da mesma. UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO CENTRO DE CIÊNCIAS EXATAS DEPARTAMENTO DE FÍSICA AV. FERNANDO FERRARI, 514 - GOIABEIRAS 29075-910 VITÓRIA - ES PROF. ANDERSON COSER GAUDIO FONE: 4009.7820 FAX: 4009.2823

Leia mais

Variáveis Aleatórias

Variáveis Aleatórias Unversdade Federal do Pará Insttuto de Tecnologa Estatístca Aplcada I Prof. Dr. Jorge Teóflo de Barros Lopes Campus de Belém Curso de Engenhara Mecânca /08/06 7:39 ESTATÍSTICA APLICADA I - Teora das Probabldades

Leia mais

QUESTÕES DISCURSIVAS Módulo 01 (com resoluções)

QUESTÕES DISCURSIVAS Módulo 01 (com resoluções) QUESTÕES DISCURSIVAS Módulo 0 (com resoluções D (Fuvest-SP/00 Nos tens abaxo, denota um número complexo e a undade magnára ( Suponha a Para que valores de tem-se? b Determne o conjunto de todos os valores

Leia mais

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma Capítulo 8 Dferencação Numérca Quase todos os métodos numércos utlzados atualmente para obtenção de soluções de equações erencas ordnáras e parcas utlzam algum tpo de aproxmação para as dervadas contínuas

Leia mais

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES Capítulo. Aproxmações numércas 1D em malhas unformes 9 Capítulo. AROXIMAÇÕS NUMÉRICAS 1D M MALHAS UNIFORMS O prncípo fundamental do método das dferenças fntas (MDF é aproxmar através de expressões algébrcas

Leia mais

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES 1. Obtenha os estmadores dos coefcentes lnear e angular de um modelo de regressão lnear smples utlzando o método

Leia mais

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

DEFINIÇÃO - MODELO LINEAR GENERALIZADO DEFINIÇÃO - MODELO LINEAR GENERALIZADO 1 Um modelo lnear generalzado é defndo pelos seguntes três componentes: Componente aleatóro; Componente sstemátco; Função de lgação; Componente aleatóro: Um conjunto

Leia mais

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) UNDADE V DELNEAMENTO NTERAMENTE CASUALZADO (DC) CUABÁ, MT 015/ PROF.: RÔMULO MÔRA romulomora.webnode.com 1. NTRODUÇÃO Este delneamento apresenta como característca prncpal a necessdade de homogenedade

Leia mais

F-328 Física Geral III

F-328 Física Geral III F-328 Físca Geral III Aula exploratóra- 06 UNICAMP IFGW username@f.uncamp.br F328 2 o Semestre de 2013 1 Corrente elétrca e resstênca Defnção de corrente: Δq = dq = t+δt Undade de corrente: 1 Ampère =

Leia mais

Reconhecimento Estatístico de Padrões

Reconhecimento Estatístico de Padrões Reconhecmento Estatístco de Padrões X 3 O paradgma pode ser sumarzado da segunte forma: Cada padrão é representado por um vector de característcas x = x1 x2 x N (,,, ) x x1 x... x d 2 = X 1 X 2 Espaço

Leia mais

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Capítulo 1. Exercício 5. Capítulo 2 Exercício UNIVERSIDADE FEDERAL DE GOIÁS CIÊNCIAS ECONÔMICAS ECONOMETRIA (04-II) PRIMEIRA LISTA DE EXERCÍCIOS Exercícos do Gujarat Exercíco 5 Capítulo Capítulo Exercíco 3 4 5 7 0 5 Capítulo 3 As duas prmeras demonstrações

Leia mais

2 Incerteza de medição

2 Incerteza de medição 2 Incerteza de medção Toda medção envolve ensaos, ajustes, condconamentos e a observação de ndcações em um nstrumento. Este conhecmento é utlzado para obter o valor de uma grandeza (mensurando) a partr

Leia mais

Equações Simultâneas

Equações Simultâneas Equações Smultâneas Caracterzação. Os modelos de equações smultâneasenvolvem mas de uma varável dependente, ou endógena, sendo necessáras tantas equações quanto for o número de varáves endógenas 2. Uma

Leia mais

Uma construção de códigos BCH

Uma construção de códigos BCH Uma construção de códgos BCH Antono Aparecdo de Andrade, Tarq Shah e Attq Qamar Resumo Um códgo BCH C (respectvamente, um códgo BCH C ) de comprmento n sobre o anel local Z p k (respectvamente, sobre o

Leia mais

3 Algoritmos propostos

3 Algoritmos propostos Algortmos propostos 3 Algortmos propostos Nesse trabalho foram desenvolvdos dos algortmos que permtem classfcar documentos em categoras de forma automátca, com trenamento feto por usuáros Tas algortmos

Leia mais

7. Resolução Numérica de Equações Diferenciais Ordinárias

7. Resolução Numérica de Equações Diferenciais Ordinárias 7. Resolução Numérca de Equações Dferencas Ordnáras Fenômenos físcos em dversas áreas, tas como: mecânca dos fludos, fluo de calor, vbrações, crcutos elétrcos, reações químcas, dentre váras outras, podem

Leia mais

ANÁLISE DE ESTRUTURAS I INTRODUÇÃO AO MÉTODO DE CROSS

ANÁLISE DE ESTRUTURAS I INTRODUÇÃO AO MÉTODO DE CROSS DECvl ANÁLISE DE ESTRUTURAS I INTRODUÇÃO AO ÉTODO DE CROSS Orlando J. B. A. Perera 20 de ao de 206 2 . Introdução O método teratvo ntroduzdo por Hardy Cross (Analyss of Contnuous Frames by Dstrbutng Fxed-End

Leia mais

5 Análise Modal da Estrutura

5 Análise Modal da Estrutura 5 Análse Modal da Estrutura No capítulo anteror comentou-se sobre as característcas construtvas da bancada, composta de um sstema rotatvo e uma estrutura de base (a qual chamaremos estrutura). Város trabalhos

Leia mais

Criptologia Criptografia Códigos Cifras Transposição Substituição Esteganografia Cripto-análise

Criptologia Criptografia Códigos Cifras Transposição Substituição Esteganografia Cripto-análise Cfra de Vgenère Técncas de Data Mnng para Crptoanálse Mestrado em Sstemas de Dados e Processamento Analítco Segurança e Prvacdade em Sstemas de Armazenamento e Transporte de Dados Joel Tago Rbero Introdução

Leia mais

EFICIÊNCIA NA PRODUÇÃO E NA VENDA DE MANGAS NO PÓLO PETROLINA-JUAZEIRO: O QUE OS ÍNDICES DE EFICIÊNCIA REPRESENTAM?

EFICIÊNCIA NA PRODUÇÃO E NA VENDA DE MANGAS NO PÓLO PETROLINA-JUAZEIRO: O QUE OS ÍNDICES DE EFICIÊNCIA REPRESENTAM? EFICIÊNCIA NA PRODUÇÃO E NA VENDA DE MANGAS NO PÓLO PETROLINA-JUAZEIRO: O QUE OS ÍNDICES DE EFICIÊNCIA REPRESENTAM? João Rcardo Ferrera de Lma (EMBRAPA - PPGECON/UFPE) Yony de Sá Barreto Sampao (PIMES/UFPE)

Leia mais

Objetivos da aula. Essa aula objetiva fornecer algumas ferramentas descritivas úteis para

Objetivos da aula. Essa aula objetiva fornecer algumas ferramentas descritivas úteis para Objetvos da aula Essa aula objetva fornecer algumas ferramentas descrtvas útes para escolha de uma forma funconal adequada. Por exemplo, qual sera a forma funconal adequada para estudar a relação entre

Leia mais

Regressão e Correlação Linear

Regressão e Correlação Linear Probabldade e Estatístca I Antono Roque Aula 5 Regressão e Correlação Lnear Até o momento, vmos técncas estatístcas em que se estuda uma varável de cada vez, estabelecendo-se sua dstrbução de freqüêncas,

Leia mais

Lei dos transformadores e seu princípio de funcionamento. Os transformadores operam segundo a lei de Faraday ou primeira lei do eletromagnetismo.

Lei dos transformadores e seu princípio de funcionamento. Os transformadores operam segundo a lei de Faraday ou primeira lei do eletromagnetismo. Le dos transformadores e seu prncípo de funconamento Os transformadores operam segundo a le de Faraday ou prmera le do eletromagnetsmo. Prmera le do eletromagnetsmo Uma corrente elétrca é nduzda em um

Leia mais

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA CAPÍTULO DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA. A MÉDIA ARITMÉTICA OU PROMÉDIO Defnção: é gual a soma dos valores do grupo de dados dvdda pelo número de valores. X x Soma dos valores de x número de

Leia mais

AULA Espaços Vectoriais Estruturas Algébricas.

AULA Espaços Vectoriais Estruturas Algébricas. Note bem: a letura destes apontamentos não dspensa de modo algum a letura atenta da bblografa prncpal da cadera Chama-se a atenção para a mportânca do trabalho pessoal a realzar pelo aluno resolvendo os

Leia mais

Sistemas Robóticos. Sumário. Introdução. Introdução. Navegação. Introdução Onde estou? Para onde vou? Como vou lá chegar?

Sistemas Robóticos. Sumário. Introdução. Introdução. Navegação. Introdução Onde estou? Para onde vou? Como vou lá chegar? Sumáro Sstemas Robótcos Navegação Introdução Onde estou? Para onde vou? Como vou lá chegar? Carlos Carreto Curso de Engenhara Informátca Ano lectvo 2003/2004 Escola Superor de Tecnologa e Gestão da Guarda

Leia mais

Cap. IV Análise estatística de incertezas aleatórias

Cap. IV Análise estatística de incertezas aleatórias TLF 010/11 Cap. IV Análse estatístca de ncertezas aleatóras Capítulo IV Análse estatístca de ncertezas aleatóras 4.1. Méda 43 4.. Desvo padrão 44 4.3. Sgnfcado do desvo padrão 46 4.4. Desvo padrão da méda

Leia mais

UM PROCEDIMENTO PARA CALCULAR ÍNDICES A PARTIR DE UMA BASE DE DADOS MULTIVARIADOS

UM PROCEDIMENTO PARA CALCULAR ÍNDICES A PARTIR DE UMA BASE DE DADOS MULTIVARIADOS Vol. 21, No. 1, p. 107-117, junho de 2001 Pesqusa Operaconal 107 UM PROCEDIMENTO PARA CALCULAR ÍNDICES A PARTIR DE UMA BASE DE DADOS MULTIVARIADOS Luca Slva Kubrusly Insttuto de Economa /UFRJ Av. Pasteur,

Leia mais

Diagnóstico em Regressão. Rejane Sobrino Pinheiro Tania Guillén de Torres

Diagnóstico em Regressão. Rejane Sobrino Pinheiro Tania Guillén de Torres Dagnóstco em Regressão Rejane Sobrno Pnhero Tana Gullén de Torres Dagnóstcos em Regressão Introdução Conjunto de ferramentas para análse dos resíduos, detecção de valores extremos (outlers), de pontos

Leia mais

Flambagem. Cálculo da carga crítica via MDF

Flambagem. Cálculo da carga crítica via MDF Flambagem Cálculo da carga crítca va MDF ROF. ALEXANDRE A. CURY DEARTAMENTO DE MECÂNICA ALICADA E COMUTACIONAL Flambagem - Cálculo da carga crítca va MDF Nas aulas anterores, vmos como avalar a carga crítca

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D. Unversdade Federal do Paraná Departamento de Informátca Reconhecmento de Padrões Classfcadores Lneares Luz Eduardo S. Olvera, Ph.D. http://lesolvera.net Objetvos Introduzr os o conceto de classfcação lnear.

Leia mais

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16% Análse de Rsco 1 RISCO Rsco possbldade de perda. Quanto maor a possbldade, maor o rsco. Exemplo: Empresa X va receber $ 1.000 de uros em 30 das com títulos do governo. A empresa Y pode receber entre $

Leia mais

CÁLCULO DE INCERTEZAS: FOLHA DE CÁLCULO VERSUS PROGRAMA DEDICADO

CÁLCULO DE INCERTEZAS: FOLHA DE CÁLCULO VERSUS PROGRAMA DEDICADO CÁLCULO DE INCERTEZAS: FOLHA DE CÁLCULO VERSUS PROGRAMA DEDICADO Manuel Matos, Helena Paulo, Hugo Slva, Vasco Matos, Nelson Slva ISEL - Departamento de Engenhara Químca, R. Conselhero Emído Navarro, 1,

Leia mais