Análise Multivariada

Documentos relacionados
Disciplina: Análise Multivariada I Prof. Dr. Admir Antonio Betarelli Junior AULA 6.2

Notas de aula: Cálculo e Matemática Aplicados às Notas de aula: Ciências dos Alimentos

Aula 2 Uma breve revisão sobre modelos lineares

variável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência

Metodologia de Investigação Educacional

Como primeira e indispensável parte da Lógica Matemática temos o Cálculo Proporcional ou Cálculo Sentencial ou ainda Cálculo das Sentenças.

. f3 = 4 e 1 3 e 2. f2 = e 1 e 3, g 1 = e 1 + e 2 + e 3, 2 g 2 = e 1 + e 2,

Análise Multivariada Aplicada à Contabilidade

Métodos Quantitativos para Ciência da Computação Experimental. Jussara Almeida DCC-UFMG 2013

Apostila de Sistemas Digitais e Computadores MÓDULOS I & II: REVISÃO ÁLGEBRA DE BOOLE.

3. Portas Lógicas. Objetivos. Objetivos. Introdução. Circuitos Digitais 31/08/2014

Universidade Federal Fluminense ICEx Volta Redonda Introdução a Matemática Superior Professora: Marina Sequeiros

Equação fundamental da reta

Sumário. 2 Índice Remissivo 9

MAT2457 ÁLGEBRA LINEAR PARA ENGENHARIA I Gabarito da 2 a Prova - 1 o semestre de 2015

Métodos Quantitativos para Ciência da Computação Experimental. Jussara Almeida DCC-UFMG 2016

PERFIL DOS AUTORES... XVII PREFÁCIO... XIX INTRODUÇÃO... XXI


Métodos de Pesquisa Operacional

OPERAÇÕES - LEIS DE COMPOSIÇÃO INTERNA

Estudo de Validade feito por Spectrum Assessments Avaliação de Índice Comportamental

Pesquisa Científica. Atividade da Aula Passada... Pesquisa Científica. Pesquisa Científica...

Conceitos básicos de Geometria:

Princípios de Modelagem Matemática Aula 08

Algoritmos geométricos

3) O ponto P(a, 2) é equidistante dos pontos A(3, 1) e B(2, 4). Calcular a abscissa a do ponto P.

Prof. Dr. Lucas Barboza Sarno da Silva

Teoria Elementar dos Conjuntos

Estatística. Correlação e Regressão

Revisões de Matemática e Estatística

Definições de Algoritmos. Algoritmos e Programação I. Conceitos Básicos de Algoritmos. Relação entre Algoritmos e Programação

Conceitos Básicos. Vocabulário Cadeias Linguagens Expressões Regulares Problema X Linguagem

Álgebra de Boole. Este material é uma adaptação das notas de aula dos professores Edino Fernandes, Juliano Maia, Ricardo Martins e Luciana Guedes

Modelos de Regressão Linear Simples parte I

ÁLGEBRA LINEAR. Subespaços Vetoriais. Prof. Susie C. Keller

Aula 4: Álgebra booleana

PESQUISA CAUSAL: Experimentação

Valores e vectores próprios

Elementos de Matemática Finita

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Álgebra Linear e Geometria Anaĺıtica. Espaços Vetoriais Reais

Teoria dos conjuntos difusos

4 Implementação Computacional

Aula 2 Regressão e Correlação Linear

Planificação anual 2018/19

Prof. Leonardo Augusto Casillo

Teoria Elementar dos Conjuntos

Slides de apoio: Fundamentos

(x 1, y 1 ) (x 2, y 2 ) = (x 1 x 2, y 1 y 2 ); e α (x, y) = (x α, y α ), α R.

Professora: Cira Souza Pitombo. Disciplina: Aplicações de técnicas de análise de dados

Sistemas Digitais Módulo 4 Álgebra Booleana e Circuitos Lógicos

Tecnologia dos Computadores 2002/2003. Exercícios

Planejamento de Experimentos. 7 Blocagem e Confundimento(Superposição) nos Planos 2 k

PORTUGUÊS ESTRUTURADO: INTRODUÇÃO INTRODUÇÃO À PROGRAMAÇÃO PROF. ALEXANDRO DOS SANTOS SILVA

CORRELAÇÃO E REGRESSÃO. Modelos Probabilísticos para a Computação Professora: Andréa Rocha. UNIVERSIDADE FEDERAL DA PARAÍBA Dezembro, 2011

CÁLCULO I. 1 Número Reais. Objetivos da Aula

Métodos Quantitativos para Avaliação de Políticas Públicas

Estatística Descritiva

Lógica Computacional

Conceitos Básicos. Vocabulário Cadeias Linguagens Problema

Carga Horária: 80 horas (correspondem a aulas e atividades extra-classe)

étodos uméricos AJUSTE DE FUNÇÕES Prof. Erivelton Geraldo Nepomuceno PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA

Teoria de Linguagens 1 o semestre de 2018 Professor: Newton José Vieira Primeira Lista de Exercícios Data de entrega: 17/4/2018 Valor: 10 pontos

Ministério da Educação Secretaria de Educação Profissional e Tecnológica Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul

Renato Martins Assunção

4 Resultados. 4.1 Resultados das Regressões Estruturais

Álgebra Linear 1 ō Teste - 16/ 11/ 02 Cursos: Eng. Ambiente, Eng. Biológica, Eng. Química, Lic. Química

M l u t l i t c i oli l n i e n arid i a d de

2 Medida de Incertezas: Fundamentos

Probabilidade. É o conjunto de todos os possíveis resultados de um experimento aleatório.

Prova tipo A. Gabarito. Data: 8 de outubro de ) Decida se cada afirmação a seguir é verdadeira ou falsa. 1.a) Considere os vetores de R 3

Capítulo 2. Distribuições de Probabilidade Estimativas de parâmetros e tempos-atéfalha. Flávio Fogliatto

Processamento de sinais digitais

1). Tipos de equações. 3). Etapas na resolução algébrica de equações numéricas. 4). Os dois grandes cuidados na resolução de equações

MINICURSO. Uso da Calculadora Científica Casio Fx. Prof. Ms. Renato Francisco Merli

GEOMETRIA ANALÍTICA. 2) Obtenha o ponto P do eixo das ordenadas que dista 10 unidades do ponto Q (6, -5).

Processos Hidrológicos CST 318 / SER 456. Tema 9 -Métodos estatísticos aplicados à hidrologia ANO 2016

Metodologia da Pesquisa Científica Profa. Elizabeth Abrantes

Material Teórico - Módulo: Vetores em R 2 e R 3. Módulo e Produto Escalar - Parte 2. Terceiro Ano - Médio

Verificação e Validação. Ian Sommerville 2006 Engenharia de Software, 8ª. edição. Capítulo 22 Slide 1

Aulas práticas de Álgebra Linear

Agrupamento de Escolas António Correia de Oliveira PLANIFICAÇÃO ANUAL DE MATEMÁTICA 7.º ANO ANO LETIVO 2018/19

ÁLGEBRA. AULA 1 _ Conjuntos Professor Luciano Nóbrega. Maria Auxiliadora

MAT Resumo Teórico e Lista de

Correlação e Regressão Linear

CONTEÚDO LÓGICA FUZZY LÓGICA FUZZY LÓGICA FUZZY. Um dos componentes mais importantes de um sistema fuzzy é o Módulo de Regras.

Já falamos que, na Matemática, tudo se baseia em axiomas. Já estudamos os números inteiros partindo dos seus axiomas.

Resolução Exe 2.12 Monolítico Recursivo

Transcrição:

Análise Multivariada Aula 6.2: Análise Comparativa Qualitativa (QCA) Prof. Admir Antonio Betarelli Junior Juiz de Fora

QCA É uma abordagem analítica para dados multivariados. Procura tratar qualitativamente as causalidades complexas de um fenômeno (+ ciências sociais). multicausalidade e equifinalidade. Essa abordagem sugere diferentes caminhos teóricos. Detalhada análise de dentro dos casos com as comparações entre os casos. AF e AA.

QCA É apropriada para testar modelos que envolvem um grande número de interação dos fatores. Regressão x QCA. Os resultados não "provam" as relações causais. E sim, eles revelam padrões de associações entre os conjuntos, um apoio para a existência de tais relações causais. Avalia se as combinações ou condições são suficientes e necessárias.

USO DA QCA Depende dos esforços dos usuários para refletir sobre se os padrões identificados que poderiam descrever um vínculo de causalidade (teoria e trabalhos empíricos).

OBJETIVOS DA QCA Resumir os dados. Checar se os dados são coerentes com as alegadas relações entre os conjuntos. Testar hipóteses. Rápida visão global sobre as suposições básicas da análise. Desenvolver novos argumentos teóricos. Criar tipologias empíricas.

USO DA QCA Tamanhos pequenos encontram-se entre 10 e 15 casos. Já uma situação intermediaria situa-se entre 50 e 100 casos. Causalidade complexa O conjunto X é uma condição causal para um determinado fenômeno ou evento Y? Quais são as combinações de condições que produzem um determinado fenômeno ou evento? Os grupos dos casos compartilham uma dada combinação de condições? As comparações sistemáticas e formalizadas entre os casos.

CONCEITOS DA QCA Por definição, a QCA trata de objetos que podem ser entendidos a partir da teoria dos conjuntos em que as observações têm natureza qualitativa e podem ser separadas em grupos com características distintivas. Os testes lógicos que seguem os princípios da álgebra booleana. Buscar encontrar condições necessárias e suficientes que produzem o fenômeno de causalidade complexa a partir da teoria dos conjuntos.

CONCEITOS DA QCA Para tanto, é preciso apresentar : as noções de conjuntos; as relações de necessidade e suficiência; os parâmetros de ajustes (consistência e cobertura); a Tabela Verdade como ferramenta central de análise dos dados; o processo de minimização; Gráfico xy.

CONCEITOS DA QCA Técnicas estatísticas tradicionais Variável dependente Variáveis explicativas Observações Equação Análise dos coeficientes QCA Resultado Conjuntos ou Condições causais Casos Termo de solução ou formula de solução Configurações específicas Os conjuntos são rotulados de acordo com a convenção: em letras maiúsculas e minúsculas.

CONCEITOS DA QCA Dois tipos básicos de QCA: Conjuntos crisp (crisp set - csqca): traz consigo uma noção dicotômica, i.e., pertencer (1) ou não pertencer (0). 1 (e.g., plenamente em A => A) e 0 (totalmente fora de A=> a). A*B Y a*b Y

CONCEITOS DA QCA Dois tipos básicos de QCA: Conjuntos fuzzy (fuzzy set - fsqca): fornece associações parciais ou completas. A adesão em um conjunto pode assumir qualquer valor entre 0 e 1. Três pontos de ancoragem definem um conjunto: a adesão plena (indicada por um escore de pertencimento 1); nenhuma adesão (escore 0); um ponto de corte (escore 0,5). A atribuição das âncoras qualitativas é denominada de método de calibragem.

ÁLGEBRA BOOLEANA NA QCA Interseção de conjuntos (lógica E) refere-se à parte compartilhada de A e B. denotada por A*B ou AB. A*B=min(A;B);i.e., se A=0,33 e B=1, então A*B=min(0,33;1)=0,33. Principal uso em QCA: combinações das condições que formam a condição suficiente para um resultado: A*B Y.

ÁLGEBRA BOOLEANA NA QCA União de conjuntos (lógica OU) refere-se à combinação de A e B. denotada por A+B. A+B=max(A,B); i.e., se A=0,33 e B=1, então A+B=max(0,33,1)=1. Principal uso em QCA: alternativos caminhos (i.e., combinações de condições) para um resultado: A+B Y.

ÁLGEBRA BOOLEANA NA QCA União de conjuntos (lógica NÃO) refere-se à parte excluída de um conjunto. denotada ~A ou a. ~A=1-A; i.e., se A=0,33, então ~A=1-A =1-0,33 = 0,67. Principal uso em QCA: mostra como a ausência ou oposto de um conjunto funciona como uma condição ou resultado.

Relações necessárias e suficientes A condição A é necessária, mas não suficiente, se existir combinações vinculadas com o resultado (Y), que não permite somente a condição A produzi-lo: A*R + A*p = A*(R + p) Y Em cada caso o grau de pertencimento em Y é inferior a ou igual ao grau de adesão em A (Y A).

Relações necessárias e suficientes

Relações necessárias e suficientes A condição A é suficiente, mas não necessária, se tal condição é capaz de produzir o resultado, mas ao mesmo tempo existem outras combinações também vinculadas com o resultado A + R*p Y Todos os casos o grau de adesão na condição A ou combinação de condições é consistentemente inferior ou igual ao grau de pertencimento no resultado Y (A Y).

Relações necessárias e suficientes

Relações necessárias e suficientes Se os casos estiverem exatamente sobre a diagonal principal, então a condição A é necessária e suficiente. A Y A condição A não é suficiente e nem necessária para o resultado: A*p + R*P + a*r Y

Tabela Verdade Detectar semelhanças analíticas e diferenças entre casos. Revelam linhas contraditórias, isto é, combinações idênticas de condições revelam resultado distinto. O grau de diversidade nos dados, i.e., que possíveis combinações de condições são e não observadas empiricamente. Em suma, serve para identificar padrões causais da suficiência. Sua análise representa, pois, uma forma distinta de representar os casos em um conjunto de configurações de condições de dados.

Tabela Verdade Detectar semelhanças analíticas e diferenças entre casos. Revelam linhas contraditórias, isto é, combinações idênticas de condições revelam resultado distinto. O grau de diversidade nos dados, i.e., que possíveis combinações de condições são e não observadas empiricamente. Em suma, serve para identificar padrões causais da suficiência. Sua análise representa, pois, uma forma distinta de representar os casos em um conjunto de configurações de condições de dados. Existem 2 k =4 = 16 (k é número de condições) possíveis de combinações lógicas.

Tabela Verdade Exemplo: Tabela de informação - bem-estar (W) - forte partido de esquerda (P) - sindicatos fortes (U) - sistema corporativista industrial (C) - homogeneidade sócio-cultural (S) cinco casos Áustria, Dinamarca, Finlândia, Noruega, Suécia estão dentro de todos os conjuntos. Eles estão mais próximos do tipo ideal de uma sociedade descrita como PUCS

Tabela Verdade - bem-estar (W) - forte partido de esquerda (P) - sindicatos fortes (U) - sistema corporativista industrial (C) - homogeneidade sócio-cultural (S) - 3 combinações -> W = 1. - 4 combinações -> não ocorrência (W = 0). Nem todas as possíveis combinações entre P, U, C e S são empiricamente observadas. Diversidade limitada (remanescentes lógicos): algumas linhas estão vazias,isto é, não há casos empíricos. Linhas contraditórias (*).

Tabela Verdade CUIDADOS Pequenas diferenças nas combinações não podem ser negligenciadas. As diferenças entre as combinações lógicas é uma diferença no tipo, e não no grau. Para mentes estatisticamente treinadas, é difícil aceitar que a pequena frequência de certas combinações seja relevante para a representação de dados, incluindo em formato de tabela verdade. Em QCA não importa se uma linha contém 1 ou 100 casos. Prestar a atenção nas linhas com no. de casos =0.

Parâmetros de ajuste Medidas de "consistência" : avalia a participação do número de casos presente simultaneamente entre a combinação x e o resultado y sobre o total de casos em x [0,1]. min( xi, yi ) I XY xi Mais próximo de 1, maior a consistência dos dados com a afirmação de que X é um subconjunto de Y, ou, em termos lógicos, com a declaração "se X, então Y (x y).

Parâmetros de ajuste Medidas de cobertura" : cobertura avalia a parcela dos casos presentes simultaneamente em x e y em relação ao total de casos em y [0,1]. min( xi, yi ) C XY yi Uma alta cobertura denota que a configuração específica tem relevância empírica quanto ao resultado (Y). Quando há vários caminhos (maneiras) para um mesmo resultado, a cobertura de uma configuração específica pode ser pequena.

Parâmetros de ajuste A cobertura tem um aspecto diferente da consistência. Exemplo: o conjunto de falhas de paraquedismo seria um subconjunto quase perfeito (i.e., alta consistência) do conjunto de mortes. Entretanto, esta combinação pode não ser muito útil (i.e., baixa cobertura) para determinar os caminhos mais comuns ou significativos para a mortalidade em uma determinada população. As duas medidas (consistência e cobertura) frequentemente são forças opostas.

Parâmetros de ajuste Tipos de cobertura: cobertura global: todas de ambas as combinações em uma fórmula de solução. cobertura única: é a cobertura de cada combinação suficiente em relação ao resultado, descontadas a parcela de casos coincidentes entre as combinações. cobertura linha: é cobertura de cada combinação no resultado, considerando os caos coincidentes entre as combinações.

Parâmetros de ajuste PUC + UCS W cobertura global: 1 PUC + UCS (7 casos) / W=1 (7 casos); Cobertura linha: 6/7 PUC (6 casos) UCS (6 casos) cobertura única: PUC = 1- C UCS = 7/7-6/7 = 1/7

Fuzzy: Parâmetros de ajuste

Parâmetros de ajuste O termo de solução PUC + UCS é 100% consistente, que abrange cerca de 60% dos escores 50%, mas as suas coberturas únicas são bastante baixas (PUC 7% e UCS 10%)

Minimização Procura-se identificar as configurações básicas de condições que são suficientes para o resultado, os chamados "expressões primitivas." a*b*c + A*B*C Y Aplica-se o algoritmo Quine-McCluskey. Dessa forma, pode-se obter uma descrição lógica das condições suficientes para produzir (probabilisticamente) um determinado resultado." B*C Y

Gráfico xy

Gráfico xy Indica que estes casos não estão bem cobertos pela PUC. Por exemplo, a Itália e a Irlanda são dois casos com escores bastante elevados de adesão em y (0,64 e 0,67, respectivamente), mas com escores muito baixos na PUC (0,1 e 0,11, respectivamente). O Japão, com um escore de y = 0,52, não apresenta qualquer filiação parcial na PUC.

Gráfico xy Novamente, a consistência é 100% e a cobertura é inferior a 100% (0,53). A Itália e a Irlanda mudaram para a direita e, portanto, muito mais perto da diagonal principal. Isso mostra que a UCS é o caminho para W que os cobre melhor do que PUC. Até mesmo o Japão apresenta algum grau de pertencimento na combinação UCS.

Recomendações A QCA deve ser aplicada: a) para propósitos originais; b) em conjunto com outras técnicas de análise de dados; c) com justificativa explícita e detalhada da seleção dos casos; d) com um número moderado de condições; e) com Condições e Resultado conceituados por teoria ou pesquisa empírica; f) com descrição da calibração dos scores de pertencimento aos conjuntos; g) com a utilização apropriada das terminologias; h) as condições necessárias e suficientes em etapas separadas; i) com níveis apropriados de Consistência (>0,75) e Cobertura; j) com Tabelas Verdade minimizadas.