Modelos Logísticos e Hierárquicos



Documentos relacionados
1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

6 Construção de Cenários

MAT 461 Tópicos de Matemática II Aula 3: Resumo de Probabilidade

1. Introdução. 1.1 Introdução

Correlação Canônica. Outubro / Versão preliminar. Fabio Vessoni. fabio@mv2.com.br (011) MV2 Sistemas de Informação

Qual é o risco real do Private Equity?

Aplicação de Métodos de Escolha Discreta na Estimação da Demanda por Serviços de Acesso à Internet Igor Vilas Boas de Freitas

AULAS 13, 14 E 15 Correlação e Regressão

AV2 - MA (a) De quantos modos diferentes posso empilhá-los de modo que todos os CDs de rock fiquem juntos?

Os métodos para a análise de dados categóricos ocupam lugar central nas

Opções Reais. Processos Estocásticos. Processos Estocásticos. Modelando Incerteza. Processos Estocásticos

EXERCÍCIOS EXERCÍCIOS. Definições Básicas. Definições Básicas. Definições Básicas. Introdução à Estatística. Dados: valores de variáveis observadas.

Exercícios Resolvidos sobre Amostragem

3 Concurso de Rentabilidade

4 Avaliação Econômica

Lista de Exercícios 4: Soluções Sequências e Indução Matemática

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

O conceito de probabilidade

Projetos. Universidade Federal do Espírito Santo - UFES. Mestrado em Informática 2004/1. O Projeto. 1. Introdução. 2.

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Correlação e Regressão Linear

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO

Estimativas de Software Fundamentos, Técnicas e Modelos... e o principal, integrando isso tudo!

3.1 Definições Uma classe é a descrição de um tipo de objeto.

DISTRIBUIÇÃO DE WEIBULL CONCEITOS BÁSICOS APLICAÇÕES

CURSO ON-LINE PROFESSOR GUILHERME NEVES 1

Teoria de Filas. Prof. Gustavo Leitão. Campus Natal Central. Planejamento de Capacidade de Sistemas

Modelos. O que, por que, quando, qual e como

Preparando sua empresa para o forecasting:

PESQUISA SOBRE PRECONCEITO E DISCRIMINAÇÃO NO AMBIENTE ESCOLAR SUMÁRIO EXECUTIVO

Estatística I Aula 1. Prof.: Patricia Maria Bortolon, D. Sc.

Eventos independentes

FACULDADE CAMPO LIMPO PAULISTA MESTRADO EM CIÊNCIA DA COMPUTAÇÃO. Projeto e Análise de Algoritmos II Lista de Exercícios 2

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

x0 = 1 x n = 3x n 1 x k x k 1 Quantas são as sequências com n letras, cada uma igual a a, b ou c, de modo que não há duas letras a seguidas?

Ajuda ao SciEn-Produção O Artigo Científico da Pesquisa Experimental

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

DELIBERAÇÃO CVM Nº 731, DE 27 DE NOVEMBRO DE 2014

ESCOLA SECUNDÁRIA/3 da RAINHA SANTA ISABEL ESTREMOZ PLANIFICAÇÃO ANUAL DA DISCIPLINA DE MATEMÁTICA APLICADA ÀS CIÊNCIAS SOCIAIS (MACS) 10º ANO

AULAS 04 E 05 Estatísticas Descritivas

Regressão logística na identificação de factores de risco em acidentes automóveis e fraude de seguros.

INTRODUÇÃO AO ESTUDO DE EQUAÇÕES DIFERENCIAIS

Noções de Pesquisa e Amostragem. André C. R. Martins

ALESSANDRO RODRIGO FRANCO FERNANDO MARTINS RAFAEL ALMEIDA DE OLIVEIRA

Curso CPA-10 Certificação ANBID Módulo 4 - Princípios de Investimento

Dois eventos são disjuntos ou mutuamente exclusivos quando não tem elementos em comum. Isto é, A B = Φ

Este material traz a teoria necessária à resolução das questões propostas.

INFLUÊNCIA DE VARIÁVEIS SOCIODEMOGRÁFICAS SOBRE O EMPREENDEDORISMO DO BRASIL

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE II

CAPÍTULO 9 RISCO E INCERTEZA

Como Elaborar Um Projeto de Pesquisa

Regra do Evento Raro p/ Inferência Estatística:

AULA 11 Desenhos, recursos e obstáculos

2 Diagrama de Caso de Uso

LINKAGE E OS MAPAS GENÉTICOS

Seleção e Monitoramento de Fundos de Investimentos

Novo Aeroporto de Lisboa e privatização da ANA

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

A MATEMÁTICA NO ENSINO SUPERIOR POLICIAL 1

Documento Explicativo

Jogos. Redes Sociais e Econômicas. Prof. André Vignatti

Prof. Antonio Fundamentos de Sistemas Operacionais UNIP/2015

SisDEA Home Windows Versão 1

Sumário. Uma visão mais clara da UML

Parece claro que há uma, e uma só, conclusão a tirar destas proposições. Esa conclusão é:

Gerenciamento de Riscos do Projeto Eventos Adversos

Após essa disciplina você vai ficar convencido que a estatística tem enorme aplicação em diversas áreas.

Dificuldades de Modelos de PNL. Onde está a solução ótima? Outro exemplo: Condição ótima Local vs. Global Quinta-feira, 25 de abril

Calculando probabilidades

SUMÁRIO 1. AULA 6 ENDEREÇAMENTO IP:... 2

Carga dos alimentadores

COMO DETERMINAR O PREÇO DE UMA

Conceito de pesquisa

Professor Severino Domingos Júnior Disciplina: Gestão de Compras e Estoques no Varejo

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

O QUE É E COMO FUNCIONA O CREDIT SCORING PARTE I

Engenharia de Software III

Lógica e Raciocínio. Decisão sob Risco Probabilidade. Universidade da Madeira.

Como redigir o projeto de pesquisa? Identificação

Guia de Atividades para Introdução do Powersim no Processo Ensinoaprendizagem de Equações Diferenciais Ordinárias

AULA 6 LÓGICA DOS CONJUNTOS

Métodos Matemáticos para Gestão da Informação

Variáveis Instrumentais (auto-seleção em não-observáveis)

Espaço Amostral ( ): conjunto de todos os

Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO)

PROCESSO CONTATO-AGENDA

Como monitorar seus concorrentes e fazer pesquisa de mercado nas redes sociais. Por Gustavo Valvasori

AGRUPAMENTO DE ESCOLAS DR. VIEIRA DE CARVALHO

Modelagem e Simulação Material 02 Projeto de Simulação

TEORIAS DE CONTÉUDO DA MOTIVAÇÃO:

Curso: Redes II (Heterogênea e Convergente) Tema da Aula: Características Roteamento

Aula 5 Técnicas para Estimação do Impacto

Cálculo das Probabilidades e Estatística I

Material Teórico - Módulo de Divisibilidade. MDC e MMC - Parte 1. Sexto Ano. Prof. Angelo Papa Neto

Uma análise econômica do seguro-saúde Francisco Galiza Outubro/2005

Orientação a Objetos

AULAS 02 E 03 Modelo de Regressão Simples

Transcrição:

1 Modelos Logísticos e Hierárquicos Ernesto F. L. Amaral Magna M. Inácio 30 de setembro de 2010 Tópicos Especiais em Teoria e Análise Política: Problema de Desenho e Análise Empírica (DCP 859B4)

REGRESSÃO LOGÍSTICA MULTINOMIAL A regressão logística multinomial pode ser vista como uma extensão do modelo logístico binário, em situações nas quais a variável dependente tem múltiplas categorias. 2 É possível estimar uma regressão logística em que a variável dependente tem mais de duas categorias. São geradas k 1 equações, sendo k o número de categorias. As equações geram probabilidades para predizer se uma categoria está acima/abaixo da categoria de referência.

GOVERNISTA / INDEPENDENTE / OPOSICIONISTA Com a intenção de estimar um modelo que explique variações na escala governista/independente/oposicionista, é possível utilizar o modelo logístico multinomial. 3 Este tipo de modelagem é utilizado quando a variável dependente em questão é ordinal. No nível ordinal de mensuração, as categorias da variável podem ser organizados em alguma ordem. Sabe-se que há diferenças relativas entre os valores dos dados, mas as magnitudes das diferenças entre as categorias não são conhecidas. Na escala de governista/independente/oposicionista, é possível ordenar os dados, mas não sabemos se a diferença entre governista e independente é a mesma que independente e oposicionista.

VARIÁVEIS ORDINAIS Powers and Xie (2000) argumentam que variáveis ordinais podem ser vistas como algo entre variáveis nominais de um lado e variáveis contínuas por outro. 4 As variáveis ordinais são: Mais gerais que as variáveis contínuas, já que permitem a existência de diferentes distâncias entre as categorias. Mais restritas que as variáveis nominais, já que suas categorias podem ser colocadas em ordem. Em alguns casos, a variável dependente ordinal também pode ser tratada como uma variável contínua. Em suma, uma variável ordinal revela a ordem de ordenamento de seus diferentes valores, mas não as magnitudes de suas diferenças em uma escala de significado substantivo.

APLICAÇÃO À ESCALA GOVERNISTA/OPOSICIONISTA A escala governista/independente/oposicionista possui um total de três categorias (J=3), o que gera três probabilidades distintas: 5 Equação 1: Equação 2: Equação 3:

PROBABILIDADES Nas equações anteriores, β 2 e β 3 denotam os efeitos específicos da variável independente para as segundas e terceiras categorias de respostas, tomando a primeira categoria como referência. 6 A primeira equação (P i1 ) é derivada do fato de que as três probabilidades somam uma unidade [P i1 =1 (P i2 +P i3 )]. As probabilidades de resposta da variável dependente dependem de transformações não-lineares da função linear: K é o número de variáveis independentes.

IIA (LONG E FREESE 2001) Os modelos logísticos multinomiais e os modelos logísticos condicionais se baseiam no pressuposto de independência de alternativas irrelevantes ( independence of irrelevant alternatives - IIA). 7 Com este pressuposto, as probabilidades não dependem das outras categorias que são disponíveis. As outras categorias alternativas são irrelevantes, o que significa que adicionar ou remover categorias da variável dependente não afetam as chances das categorias restantes.

EXEMPLO DO ÔNIBUS VERMELHO / AZUL Suponha que: Temos a escolha de ir para o trabalho em um ônibus vermelho ou em um carro. A chance de pegar um ônibus vermelho comparada ao carro seja 1:1. 8 O pressuposto IIA implica que as chances continuarão 1:1 entre estas duas alternativas, mesmo se chegue à cidade uma nova companhia de ônibus azul, a qual é idêntica à companhia de ônibus vermelho (exceto pela cor). Esse pressuposto não é realístico, já que a chance de pegar um ônibus vermelho, comparado a um carro, reduziria a 1:2, já que metade daqueles que pegariam o ônibus vermelho agora tomarão o ônibus azul.

VOLTANDO À CIÊNCIA POLÍTICA Vamos retirar uma das categorias da nossa escala governista-independente-oposicionista: 9 Ao retirar a categoria governista, os congressistas teriam que se distribuir entre independentes e oposicionistas de tal modo que a razão entre estes dois últimos grupos não apresentasse mudança. Glasgow (2001: 1): Models which assume IIA, such as multinomial logit (MNL), assume that the ratio of the probability of voting for party A over the probability of voting for party B remains unchanged when party C enters or leaves the election. Esses são pressupostos razoáveis na Ciência Política?

KIEWIET E ZENG (1993) O modelo empregado por Kiewiet e Zeng (1993) foi o mother logit model, elaborado para relaxar o pressuposto de IIA e mantendo a forma de logito para as probabilidades. 10 Estes autores estimaram o modelo com a introdução de fatores que influenciariam a utilidade de concorrer a cargos superiores nas funções de utilidade de decidir pela aposentadoria e concorrer à reeleição. Portanto, as variáveis que influenciariam a escolha entre concorrer a cargos superiores ou concorrer à reeleição foram usadas na estimação da escolha entre decidir pela aposentadoria ou concorrer à reeleição. Eles também testaram o nested logit que não toma o IIA como pressuposto, mas as probabilidades estimadas não foram adequadas, em comparação ao mother logit.

GLASGOW (2001): CORRELAÇÃO COM O TEMPO Glasgow reestimou o modelo descrito por Kiewiet e Zeng, usando o modelo mixed logit (MXL), o qual apresenta avanços em relação ao mother logit por dois aspectos. 11 Primeiro, Kiewiet e Zeng tomaram como pressuposto que as escolhas individuais não são correlacionadas com tempo. MXL não utiliza esse pressuposto, ao permitir que as escolhas feitas por indivíduos esteja correlacionada com o tempo. Portanto, o MXL permite correlação entre alternativas (relaxando a propriedade de IIA) e permite correlação no decorrer do tempo.

GLASGOW (2001): COMPORTAMENTO INDIVIDUAL Segundo, modelos mother logit podem aproximar as probabilidades de escolha de qualquer modelo de escolha discreta com a forma logística, mas não são consistentes com a maximização da utilidade aleatória ( random utility maximization ). 12 No mother logit, os atributos de cada alternativa podem entrar nas funções de utilidade das outras alternativas. Por exemplo, componentes da função de utilidade de concorrer a cargo superior entram na escolha entre aposentadoria ou concorrer à reeleição, embora esta escolha deveria depender somente da utilidade da aposentadoria ou da utilidade de concorrer à reeleição. No mixed logit, além de não haver pressuposto de IIA, há consistência com teorias do comportamento individual ( random utility maximization ).

GLASGOW (2001): PRESSUPOSTOS Modelos mixed logit são também conhecidos como random parameters logit, mixed multinomial logit, random coefficients logit e error components logit. 13 Estes modelos se baseiam no pressuposto de que as preferências do eleitor frente às alternativas é uma escolha que pode ser descrita como uma função de utilidade. Essa função depende de atributos das alternativas e de características do indivíduo. Ao escolher uma alternativa, indivíduos selecionam aquela que gera maior utilidade. A função de utilidade representa a soma: (1) do componente sistemático que depende de atributos observados das alternativas e de características individuais; e (2) do componente estocástico que representa a influência de fatores não-observados na escolha individual.

GLASGOW (2001): ALGUMAS OBSERVAÇÕES O termo genérico de multinomial logit foi utilizado por Glasgow (2001) se referindo ao: 14 Logito multinomial ( multinomial logit ): que possui variáveis específicas para os indivíduos; e Logito condicional ( conditional logit ): que possui variáveis específicas para as alternativas e, possivelmente, para os indivíduos. A forma geral dos dois modelos é idêntica, com a diferença de escolha das variáveis incluídas. Ao se referir a esta classe de modelos como multinomial logit, Glasgow (2001) utiliza a mesma terminologia do modelo multinomial probit, que é chamado desta forma independente das variáveis incluídas: Assim como o mixed logit, o multinomial probit (MNP) também não utiliza o pressuposto de IIA.

MODELO HIERÁRQUICO O modelo de logit hierárquico (valor extremo generalizado - GEV) permite violações do pressuposto IIA na decisão entre os grupos de alternativas, mas exige que o pressuposto seja válido dentro dos grupos. Esse modelo exige a especificação de quais variáveis afetam cada nível de decisão. Em Leoni et al. (2003), a variável dependente é a escolha do legislador no final do seu mandato. É possível então estimar modelo em que: Algumas variáveis influenciam na decisão entre aposentar-se, concorrer a cargo mais alto ou reeleição. Algumas variáveis influenciam apenas sobre a decisão entre concorrer a cargo mais alto e reeleição. 15

EXEMPLIFICAÇÃO DE MODELO HIERÁRQUICO Primeiro nível: 16 Y = β 0 + β 1 x 1 + β 2 x 2 + r Segundo nível: β 1 = γ 10 + γ 11 z 1 + u 1 β 2 = γ 20 + γ 21 z 1 + γ 22 z 2 + u 1

REFERÊNCIAS Glasgow, G. 2001. Mixed logit models in political science. Presented at the Eighteenth Annual Political Methodology Conference. Emory University, July 19. Kiewiet, D.R., e L. Zeng. 1993. An analysis of congressional career decisions, 1947-1986. American Political Science Review, 87(4): 928-941. Leoni, E., C. Pereira, e L. Rennó. 2003. Estratégias para sobreviver politicamente: escolhas de carreiras na Câmara de Deputados do Brasil. Opinião Pública 9(1): 44-67. Long, J.S., e J. Freese. 2001. Regression models for categorical dependent variables using Stata. College Station, Texas: Stata Press Publication. Powers, D.A., e Y. Xie. 2000. Statistical methods for categorical data analysis. San Diego: Academic Press. Triola, M.F. 2008. Introdução à estatística. Rio de Janeiro: LTC. 17