Análise Multivariada Aula 6.2: Análise Comparativa Qualitativa (QCA) Prof. Admir Antonio Betarelli Junior Juiz de Fora
QCA É uma abordagem analítica para dados multivariados. Procura tratar qualitativamente as causalidades complexas de um fenômeno (+ ciências sociais). multicausalidade e equifinalidade. Essa abordagem sugere diferentes caminhos teóricos. Detalhada análise de dentro dos casos com as comparações entre os casos. AF e AA.
QCA É apropriada para testar modelos que envolvem um grande número de interação dos fatores. Regressão x QCA. Os resultados não "provam" as relações causais. E sim, eles revelam padrões de associações entre os conjuntos, um apoio para a existência de tais relações causais. Avalia se as combinações ou condições são suficientes e necessárias.
USO DA QCA Depende dos esforços dos usuários para refletir sobre se os padrões identificados que poderiam descrever um vínculo de causalidade (teoria e trabalhos empíricos).
OBJETIVOS DA QCA Resumir os dados. Checar se os dados são coerentes com as alegadas relações entre os conjuntos. Testar hipóteses. Rápida visão global sobre as suposições básicas da análise. Desenvolver novos argumentos teóricos. Criar tipologias empíricas.
USO DA QCA Tamanhos pequenos encontram-se entre 10 e 15 casos. Já uma situação intermediaria situa-se entre 50 e 100 casos. Causalidade complexa O conjunto X é uma condição causal para um determinado fenômeno ou evento Y? Quais são as combinações de condições que produzem um determinado fenômeno ou evento? Os grupos dos casos compartilham uma dada combinação de condições? As comparações sistemáticas e formalizadas entre os casos.
CONCEITOS DA QCA Por definição, a QCA trata de objetos que podem ser entendidos a partir da teoria dos conjuntos em que as observações têm natureza qualitativa e podem ser separadas em grupos com características distintivas. Os testes lógicos que seguem os princípios da álgebra booleana. Buscar encontrar condições necessárias e suficientes que produzem o fenômeno de causalidade complexa a partir da teoria dos conjuntos.
CONCEITOS DA QCA Para tanto, é preciso apresentar : as noções de conjuntos; as relações de necessidade e suficiência; os parâmetros de ajustes (consistência e cobertura); a Tabela Verdade como ferramenta central de análise dos dados; o processo de minimização; Gráfico xy.
CONCEITOS DA QCA Técnicas estatísticas tradicionais Variável dependente Variáveis explicativas Observações Equação Análise dos coeficientes QCA Resultado Conjuntos ou Condições causais Casos Termo de solução ou formula de solução Configurações específicas Os conjuntos são rotulados de acordo com a convenção: em letras maiúsculas e minúsculas.
CONCEITOS DA QCA Dois tipos básicos de QCA: Conjuntos crisp (crisp set - csqca): traz consigo uma noção dicotômica, i.e., pertencer (1) ou não pertencer (0). 1 (e.g., plenamente em A => A) e 0 (totalmente fora de A=> a). A*B Y a*b Y
CONCEITOS DA QCA Dois tipos básicos de QCA: Conjuntos fuzzy (fuzzy set - fsqca): fornece associações parciais ou completas. A adesão em um conjunto pode assumir qualquer valor entre 0 e 1. Três pontos de ancoragem definem um conjunto: a adesão plena (indicada por um escore de pertencimento 1); nenhuma adesão (escore 0); um ponto de corte (escore 0,5). A atribuição das âncoras qualitativas é denominada de método de calibragem.
ÁLGEBRA BOOLEANA NA QCA Interseção de conjuntos (lógica E) refere-se à parte compartilhada de A e B. denotada por A*B ou AB. A*B=min(A;B);i.e., se A=0,33 e B=1, então A*B=min(0,33;1)=0,33. Principal uso em QCA: combinações das condições que formam a condição suficiente para um resultado: A*B Y.
ÁLGEBRA BOOLEANA NA QCA União de conjuntos (lógica OU) refere-se à combinação de A e B. denotada por A+B. A+B=max(A,B); i.e., se A=0,33 e B=1, então A+B=max(0,33,1)=1. Principal uso em QCA: alternativos caminhos (i.e., combinações de condições) para um resultado: A+B Y.
ÁLGEBRA BOOLEANA NA QCA União de conjuntos (lógica NÃO) refere-se à parte excluída de um conjunto. denotada ~A ou a. ~A=1-A; i.e., se A=0,33, então ~A=1-A =1-0,33 = 0,67. Principal uso em QCA: mostra como a ausência ou oposto de um conjunto funciona como uma condição ou resultado.
Relações necessárias e suficientes A condição A é necessária, mas não suficiente, se existir combinações vinculadas com o resultado (Y), que não permite somente a condição A produzi-lo: A*R + A*p = A*(R + p) Y Em cada caso o grau de pertencimento em Y é inferior a ou igual ao grau de adesão em A (Y A).
Relações necessárias e suficientes
Relações necessárias e suficientes A condição A é suficiente, mas não necessária, se tal condição é capaz de produzir o resultado, mas ao mesmo tempo existem outras combinações também vinculadas com o resultado A + R*p Y Todos os casos o grau de adesão na condição A ou combinação de condições é consistentemente inferior ou igual ao grau de pertencimento no resultado Y (A Y).
Relações necessárias e suficientes
Relações necessárias e suficientes Se os casos estiverem exatamente sobre a diagonal principal, então a condição A é necessária e suficiente. A Y A condição A não é suficiente e nem necessária para o resultado: A*p + R*P + a*r Y
Tabela Verdade Detectar semelhanças analíticas e diferenças entre casos. Revelam linhas contraditórias, isto é, combinações idênticas de condições revelam resultado distinto. O grau de diversidade nos dados, i.e., que possíveis combinações de condições são e não observadas empiricamente. Em suma, serve para identificar padrões causais da suficiência. Sua análise representa, pois, uma forma distinta de representar os casos em um conjunto de configurações de condições de dados.
Tabela Verdade Detectar semelhanças analíticas e diferenças entre casos. Revelam linhas contraditórias, isto é, combinações idênticas de condições revelam resultado distinto. O grau de diversidade nos dados, i.e., que possíveis combinações de condições são e não observadas empiricamente. Em suma, serve para identificar padrões causais da suficiência. Sua análise representa, pois, uma forma distinta de representar os casos em um conjunto de configurações de condições de dados. Existem 2 k =4 = 16 (k é número de condições) possíveis de combinações lógicas.
Tabela Verdade Exemplo: Tabela de informação - bem-estar (W) - forte partido de esquerda (P) - sindicatos fortes (U) - sistema corporativista industrial (C) - homogeneidade sócio-cultural (S) cinco casos Áustria, Dinamarca, Finlândia, Noruega, Suécia estão dentro de todos os conjuntos. Eles estão mais próximos do tipo ideal de uma sociedade descrita como PUCS
Tabela Verdade - bem-estar (W) - forte partido de esquerda (P) - sindicatos fortes (U) - sistema corporativista industrial (C) - homogeneidade sócio-cultural (S) - 3 combinações -> W = 1. - 4 combinações -> não ocorrência (W = 0). Nem todas as possíveis combinações entre P, U, C e S são empiricamente observadas. Diversidade limitada (remanescentes lógicos): algumas linhas estão vazias,isto é, não há casos empíricos. Linhas contraditórias (*).
Tabela Verdade CUIDADOS Pequenas diferenças nas combinações não podem ser negligenciadas. As diferenças entre as combinações lógicas é uma diferença no tipo, e não no grau. Para mentes estatisticamente treinadas, é difícil aceitar que a pequena frequência de certas combinações seja relevante para a representação de dados, incluindo em formato de tabela verdade. Em QCA não importa se uma linha contém 1 ou 100 casos. Prestar a atenção nas linhas com no. de casos =0.
Parâmetros de ajuste Medidas de "consistência" : avalia a participação do número de casos presente simultaneamente entre a combinação x e o resultado y sobre o total de casos em x [0,1]. min( xi, yi ) I XY xi Mais próximo de 1, maior a consistência dos dados com a afirmação de que X é um subconjunto de Y, ou, em termos lógicos, com a declaração "se X, então Y (x y).
Parâmetros de ajuste Medidas de cobertura" : cobertura avalia a parcela dos casos presentes simultaneamente em x e y em relação ao total de casos em y [0,1]. min( xi, yi ) C XY yi Uma alta cobertura denota que a configuração específica tem relevância empírica quanto ao resultado (Y). Quando há vários caminhos (maneiras) para um mesmo resultado, a cobertura de uma configuração específica pode ser pequena.
Parâmetros de ajuste A cobertura tem um aspecto diferente da consistência. Exemplo: o conjunto de falhas de paraquedismo seria um subconjunto quase perfeito (i.e., alta consistência) do conjunto de mortes. Entretanto, esta combinação pode não ser muito útil (i.e., baixa cobertura) para determinar os caminhos mais comuns ou significativos para a mortalidade em uma determinada população. As duas medidas (consistência e cobertura) frequentemente são forças opostas.
Parâmetros de ajuste Tipos de cobertura: cobertura global: todas de ambas as combinações em uma fórmula de solução. cobertura única: é a cobertura de cada combinação suficiente em relação ao resultado, descontadas a parcela de casos coincidentes entre as combinações. cobertura linha: é cobertura de cada combinação no resultado, considerando os caos coincidentes entre as combinações.
Parâmetros de ajuste PUC + UCS W cobertura global: 1 PUC + UCS (7 casos) / W=1 (7 casos); Cobertura linha: 6/7 PUC (6 casos) UCS (6 casos) cobertura única: PUC = 1- C UCS = 7/7-6/7 = 1/7
Fuzzy: Parâmetros de ajuste
Parâmetros de ajuste O termo de solução PUC + UCS é 100% consistente, que abrange cerca de 60% dos escores 50%, mas as suas coberturas únicas são bastante baixas (PUC 7% e UCS 10%)
Minimização Procura-se identificar as configurações básicas de condições que são suficientes para o resultado, os chamados "expressões primitivas." a*b*c + A*B*C Y Aplica-se o algoritmo Quine-McCluskey. Dessa forma, pode-se obter uma descrição lógica das condições suficientes para produzir (probabilisticamente) um determinado resultado." B*C Y
Gráfico xy
Gráfico xy Indica que estes casos não estão bem cobertos pela PUC. Por exemplo, a Itália e a Irlanda são dois casos com escores bastante elevados de adesão em y (0,64 e 0,67, respectivamente), mas com escores muito baixos na PUC (0,1 e 0,11, respectivamente). O Japão, com um escore de y = 0,52, não apresenta qualquer filiação parcial na PUC.
Gráfico xy Novamente, a consistência é 100% e a cobertura é inferior a 100% (0,53). A Itália e a Irlanda mudaram para a direita e, portanto, muito mais perto da diagonal principal. Isso mostra que a UCS é o caminho para W que os cobre melhor do que PUC. Até mesmo o Japão apresenta algum grau de pertencimento na combinação UCS.
Recomendações A QCA deve ser aplicada: a) para propósitos originais; b) em conjunto com outras técnicas de análise de dados; c) com justificativa explícita e detalhada da seleção dos casos; d) com um número moderado de condições; e) com Condições e Resultado conceituados por teoria ou pesquisa empírica; f) com descrição da calibração dos scores de pertencimento aos conjuntos; g) com a utilização apropriada das terminologias; h) as condições necessárias e suficientes em etapas separadas; i) com níveis apropriados de Consistência (>0,75) e Cobertura; j) com Tabelas Verdade minimizadas.