Exemplo (tabela um) distribuições marginais enquanto que. Distribuição Conjunta

Documentos relacionados
Prof. Lorí Viali, Dr.

Cruzamento de Dados. Lorí Viali, Dr. DESTAT/FAMAT/PUCRS

Prof. Lorí Viali, Dr.

Distribuições Conjuntas (Tabelas de Contingência)

SÉRIE: Estatística Básica Texto: ANÁLISE BIDIMENSIONAL SUMÁRIO 3. EXERCÍCIOS APÊNDICE REFERÊNCIAS...21

Estatística Descritiva (III) Associação entre Variáveis

ESTATÍSTICA. Ana Paula Fernandes - FAMAT/UFU

Stela Adami Vayego DEST/UFPR

Teste Qui-quadrado. Dr. Stenio Fernando Pimentel Duarte

DISCIPLINA: Metodologia Científica e Tecnológica Exatas: Engenharia de Produção SUMÁRIO

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Estatística Aplicada I. } Análise Bidimensional

Espaços, tempos, quantidades, relações e transformações

Métodos Empíricos de Pesquisa I. } Análise Bidimensional

Estatística para Geografia. Rio, 30/08/2017

AULA 8 Experimentos multinomiais e tabelas de contingência

Universidade de São Paulo

Testes de Aderência, Homogeneidade e Independência

Testes de Aderência, Homogeneidade e Independência

de uma variável em função da outra, por exemplo: Quantas TV Philips são vendidas na região Norte? Quantos homens são fumantes?

Testes de Aderência, Homogeneidade e Independência

2. Testes de Independência

Análise Exploratória de Dados

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

Métodos Quantitativos Aplicados

16/6/2014. Teste Qui-quadrado de independência

Análise de correspondência

Capítulo 6 Estatística não-paramétrica

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

Teste do Qui2. O tamanho de amígdala está associado com a presença da bactéria Streptoccocus pyogenes?

- Testes Qui-quadrado - Aderência e Independência

Introdução à análise estatística com SPSS. Guião nº6: Medidas de associação

Análise de Aderência e de Associação

Testes de Aderência, Homogeneidade e Independência. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Aula 16: Análise de Aderência e Associação

Unidade III Medidas Descritivas

Estatística 1 - Lista de Exercícios 4-21/06/ Professor José Carlos Fogo

Medidas de associação para variáveis categóricas em tabelas de dupla entrada

Estatística 1 - Lista de Exercícios 4 Professore José Carlos Fogo

Testes não paramétricos. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Variáveis bidimensionais

ANÁLISE EXPLORATÓRIA DE DADOS

ESTATÍSTICA INFERENCIAL. Prof. Dr. Guanis de Barros Vilela Junior

Estatística para Geografia. Rio, 13/09/2017

- Testes Qui-quadrado - Aderência e Independência

Intervalos de Confiança

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Estatística descritiva básica: Porcentagens, proporções, razões e taxas. ACH2021 Tratamento e Análise de Dados e Informações

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

4. Medidas de associação entre variáveis categóricas em tabelas de dupla entrada

HEP0138 BIOESTATÍSTICA

Capítulo 6 Estatística não-paramétrica

Associação entre Variáveis Qualitativas. Análises de Correlação e Regressão

AULA 10 RELACIONAMENTOS ENTRE DUAS VARIÁVEIS

Coeficiente de Assimetria

i j i i Y X X X i j i i i

Estatística para Geografia. Rio, 21/09/2018

Análise Bidimensional

Tabela Taxa de desocupação na semana de referência por grupos de idade. Unidade Territorial - Total das áreas

9. Medidas de associação entre variáveis categóricas em tabelas de dupla entrada

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

ESTATÍSTICA NÃO-PARAMÉTRICA Aula 5

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

5 Agregação das Reservas das Entidades

Inferência Estatística:

LISTA DE EXERCÍCIOS 2 INE 7001 PROF. MARCELO MENEZES REIS ANÁLISE BIDIMENSIONAL GABARITO

PARTE 3- MEDIDAS DE DISPERSÃO VERSÃO: MARÇO DE 2017

Stela Adami Vayego Estatística II CE003/DEST/UFPR

COMPARAÇÃO DE SISTEMAS USANDO DADOS DE AMOSTRAS. Capítulo 13 do livro: The Art of Computer Systems Performance Analysis

Apontamentos de Introdução às Probabilidades e à Estatística

Teste Chi-Quadrado de Independência. Prof. David Prata Novembro de 2016

6. Medidas de associação entre variáveis categóricas em tabelas de dupla entrada

Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA

Medidas de Semelhança

Estatística Descritiva

Mais Informações sobre Itens do Relatório

Resultados. Grupo SK/aids

Associação entre variáveis qualitativas. Tabelas de Contigência

PROVA DE QUI-QUADRADO QUADRADO. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM -

1 Introdução. 2 Variáveis Aleatórias Discretas (VAD)

AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO

- Testes Qui-quadrado - Aderência e Independência

i j i i Y X X X i j 1 i 2 i i

MÉTODOS DE CALIBRAÇÃO

Estatística Descritiva (III) Associação entre Variáveis

Prof. Lorí Viali, Dr.

Podemos construir tabelas de frequências. duas ou mais variáveis qualitativas.

Estatística Descritiva (I)

Métodos Quantitativos II

Grupo A - 1 semestre de 2012 Lista de exercícios 2 - Estatística Descritiva II C A S A (gabarito)

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

TESTES NÃO-PARAMÉTRICOS

Variáveis bidimensionais

Estatística e Probabilidade. Aula 11 Cap 06

Os testes. Objetivos. O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos)

Intervalos de conança

Estatística Descritiva (I)

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó

Transcrição:

Distribuição Conjunta Suponha que se queira analisar o comportamento conjunto das variáveis = de Instrução e = Região de procedência. Neste caso, a distribuição de freqüências é apresentada como uma tabela de dupla entrada, que esta apresentada na tabela seguinte: Exemplo (tabela um) Capital Interior Outra Primeiro 4 11 17 Segundo 5 4 3 1 Superior 6 3 11 15 18 7 Cada elemento da tabela fornece a freqüência observada da realização simultânea das variáveis e. Neste caso, foram observados 4 moradores da capital com primeiro grau, 6 com instrução superior, 7 moradores do interior com instrução do segundo grau e assim por diante. A linha dos totais fornece a distribuição da variável (grau de instrução) enquanto que o total das colunas fornece a distribuição da variável (região de procedência). As distribuições separadas (das margens) são chamadas de distribuições marginais enquanto que a tabela um forma a distribuição conjunta das variáveis e. 1

Ao invés de se trabalhar com as freqüências absolutas, pode-se obter as freqüências relativas (proporções), como foi feito no caso de uma única variável. Mas agora existem três possibilidades de expressarmos a proporção de cada célula da tabela: (1) em relação ao total geral; () em relação ao total de cada linha; (3) em relação ao total de cada coluna. Exemplo (tabela dois) A tabela apresenta a distribuição conjunta das freqüências relativas expressas como proporções do total geral. Capital Interior Outra Primeiro 10,0 7,5 5,0 4,5 Segundo 1,5 10,0 7,5 30,0 Superior 15,0 7,5 5,0 7,5 37,5 45,0 17,5 Neste caso pode-se afirmar que 10% dos empregados vem da capital e tem instrução de primeiro grau. Os totais das margens fornecem as distribuições (em %) de cada uma das variáveis, consideradas individualmente. Assim 37,5% dos pais vem da capital e, por exemplo, 30% possuem segundo grau. A tabela três apresenta a distribuição das proporções (em percentual) em relação ao total das colunas.

Exemplo (tabela três) Capital Interior Outra Primeiro 3,53 64,71 11,76,0 Segundo 41,67 33,33 5,00,0 Superior 54,55 7,7 18,18,0 37,5 45,0 17,5 Assim, pode-se ver que 5,53% dos pais com instrução de primeiro grau vem da capital, 64,71% vem do interior etc. Quantos aos pais com grau superior 54,55% vem da capital, 7,7% do interior etc. Esta distribuição serve para comparar a distribuição da procedência das pessoas conforme o grau de instrução. Independência de variáveis De forma análoga, pode-se construir a distribuição das proporções em relação ao total de linhas. Um dos principais objetivos de se determinar a distribuição conjunta é descrever a associação existente entre as variáveis, isto é, quer-se conhecer o grau de dependência existente entre elas, de modo que se possa prever melhor o resultado de uma delas quando se conhece o resultado da outra. Exemplo Se fosse desejado estimar qual a renda média de uma família de Porto Alegre, a informação adicional sobre a classe social que essa família pertence permitirá que a estimativa seja mais precisa, pois se sabe que existe dependência entre os dois tipos de variáveis. Exemplo Quer-se identificar se existe ou não dependência entre sexo e curso escolhido, baseado em uma amostra de 00 alunos de Economia e Administração. Estes dados estão agrupados na tabela 4. 3

Exemplo (tabela quatro) Economia Administração 85 35 55 5 1 60 10 80 00 De início pode-se perceber que não é fácil tirar alguma conclusão, devido a diferença nos totais marginais. Desta forma, deve-se construir proporções segundo as linhas (ou colunas) para se poder fazer comparações. Exemplo (tabela cinco) Economia Administração 61 55 58 5 60 Desta tabela pode-se observar que, independentemente de sexo, 60% dos alunos preferem Economia e % Administração (Pode-se ver pela coluna do total). Não havendo dependência entre as variáveis, seria esperado as mesmas proporções para cada sexo. Observando a tabela, pode-se ver que as proporções são bem próximos do que seria esperado, isto é, do sexo masculino 61% preferem Economia e 39% Administração, enquanto que do sexo feminino estas proporções são 58% e 4% respectivamente. Estes resultados parecem indicar que não existe dependência entre as variáveis sexo e curso escolhido (pelo menos para estes dois cursos). 4

Exemplo Exemplo (tabela seis) Suponha agora um mesmo tipo de exemplo, só que envolvendo alunos dos cursos de Física e Serviço Social, cuja distribuição conjunta está na tabela 6. Física Serviço Social 1 0 60 10 80 00 Exemplo (tabela sete) Física Serviço Social 71 9 33 67 60 Comparando agora a distribuição das proporções pelos cursos, parece haver uma maior concentração de homens no curso de Física e de mulheres no de Serviço Social. Portanto, neste caso, as variáveis sexo e curso escolhido parecem ser dependentes. Dependência entre variáveis nominais Observe-se que se teria chegado as mesmas conclusões se tivesse sido utilizado o total de linhas ao invés do total de colunas. Quando existe dependência entre variáveis, sempre é conveniente quantificar esta dependência. De um modo geral, a quantificação do grau de dependência entre duas variáveis é realizada pelos chamados coeficientes de correlação ou associação. Estas medidas descrevem através de um único número a dependência entre duas variáveis. 5

Para que a interpretação se torne mais fácil e intuitiva estes coeficientes normalmente variam de zero a um (ou de 1 a +1), e a proximidade de zero indica que as variáveis são independentes. Existem várias formas de medir a dependência entre duas variáveis nominais. Uma delas é o denominado coeficiente de contingência, devido a Karl Pearson. Exemplo (tabela oito) A análise da tabela sete mostrou que existe dependência entre as variáveis. Se houvesse independência o número esperado de estudantes masculinos de Física seria: (1.10)/00 = 84. Calculando os demais valores esperados poderíamos formar a tabela oito. Física Serviço Social 84 56 1 36 4 60 10 80 00 Exemplo (tabela nove) Pode-se comparar as duas tabelas, isto é, os valores esperados com os observados, determinando-se os desvios existentes entre eles. Os resultados estão tabela nove. Física Serviço Social 16-16 -16 16 6

Uma vez obtidos os desvios de cada célula da tabela, pode-se obter os desvios relativos de cada célula. Para isto eleva-se cada resultado ao quadrado (para eliminar os valores negativos) e divide-se o resultado pelo valor esperado, isto é: (O i E i ) / E i Juntando os resultados de cada célula, tem-se uma medida do grau de afastamento, isto é, de dependência entre as duas variáveis. Esta medida é representada por χ e lida qui-quadrado. Esta medida é representada por χ e lida qui-quadrado. Para este exemplo, o valor desta medida seria: χ = 3,0476 + 7,1111 + 4,5714 + 10,6667 = 5,. No entanto, julgar a associação pelo expressão acima não é fácil, porque não se tem um padrão de comparação, para saber se este valor é alto ou não. Por isto, utiliza-se uma outra medida, devida a Karl Pearson, e denominada de Coeficiente de Contingência C, definida por: χ C = χ + n Onde n é o número de observações (tamanho da amostra). 7

Para o exemplo acima o coeficiente de Pearson será: C = χ χ + n = 5,3968 5,3968 + 00 = 0,34 8