Análise Exploratória de Dados
|
|
- Brenda Galvão Candal
- 6 Há anos
- Visualizações:
Transcrição
1 Análise Exploratória de Dados
2 Objetivos Análise de duas variáveis qualitativas: obter a tabela de contingência entre duas variáveis qualitativas; calcular tabelas derivadas da tabela de freqüências absolutas (freqüências relativas, perfis-linha e perfis coluna); calcular (definir) medida de associação entre duas variáveis qualitativas.
3 Exemplo: pesquisa de mercado Dados de telemarketing da AT&T (companhia de telefonia americana) Fonte: James W. Watson (1986) (Splus). dados=read.table( marina/telemark.txt,header=t) Esta base de dados contém informação sobre 1000 domicílios (linhas). As 10 variáveis (colunas) incluem informações demográficas e informação específica sobre os serviços de telefonia no domicílio.
4 Exemplo (continuação) Nome, descrição e código das variáveis: 1) cia fator indicando se o domicílio usa os serviços de longa distância da companhia AT&T (ATT) ou de outras companhias (OCC). 2) renda fator ordenado indicando o nível de renda do domicílio. Os níveis são: <7.5, , 15-25, 25-35, 35-45, 45-75, >=75.
5 Nome, descrição e código das variáveis (cont.): 3) mudancas fator ordenado indicando o número de vezes que o dono do domicílio mudou-se nos 10 anos precedentes. Os níveis são: 0, 1, 2, 3, 4, 5, 7 e 10. 4) idade fator ordenado indicando a faixa etária do entrevistado. Os níveis são: 18-24, 25-34, 35-44, 45-54, 55-64, 65+.
6 Nome, descrição e código das variáveis (cont.): 5) instrucao fator ordenado indicando o nível de escolaridade do entrevistado. Os níveis são: <HS(ensino fundamental), HS(ensino médio), Voc, Coll, BA e >BA(Pós-graduação). 6) emprego fator indicando o tipo de emprego do entrevistado. Os níveis são: F, P, R, S, H, U e D. 7) uso vetor numérico fornecendo o uso médio mensal de telefone do domicílio.
7 Nome, descrição e código das variáveis (cont.): 8) nonpub fator indicando se o domicílio possui um número de telefone não listado. 9) plano fator indicando se o domicílio participou de um plano especial da AT&T, antes da atual política de serviços de telefonia. 10) cartao fator indicando se o domicílio possuiu um serviço de cartão da AT&T, antes da atual política de serviços de telefonia.
8 Nome, descrição e código das variáveis (cont.): Os níveis das variáveis nonpub, plano e cartao são Y(Sim), N(Não) e NA(Não disponível). Os dados estão disponíveis no arquivo telemark.txt.
9 Atividade 1 Obter a tabela de dupla entrada das variáveis cia e plano. Vimos que para obter os totais marginais das respostas por variável, podemos usar o comando table: > table(dados$cia) ATT OCC >table(dados$plano) N Y
10 Tabela de contingência Para obter a tabela de dupla entrada, também usamos o comando table: table(dados$cia,dados$plano) N Y ATT OCC Obs.: Dados não disponíveis não são levados em consideração.
11 Freqüências relativas Para dispor as freqüências relativas em relação ao total, basta pedir round(table(dados$cia,dados$plano)/sum(table(dados$cia, dados$plano)),digits=3) N Y ATT OCC
12 Perfis-linha Para obter a distribuição relativa ao total de cada linha, podemos definir uma matriz x com uma coluna e uma linha a mais que a tabela obtida, para representar a linha e a coluna de totais. Neste exemplo, podemos definir x=matrix(0,3,3) #x recebe uma matriz nula 3 por 3.
13 Perfis-linha (cont.) x[1:2,1:2]=table(dados$cia,dados$plano) for (i in 1:2) {x[i,3]=sum(x[i,])} for (i in 1:2) {x[3,i]=sum(x[,i])} x[3,3]=sum(x[1:2,1:2]) N Y total ATT OCC total
14 Perfis-linha Para obter os perfis-linha, basta pedir pl=x e for (i in 1:3) {for (j in 1:3) { pl[i,j]=pl[i,j]/pl[i,3]}} round(pl,digits=2) N Y total ATT OCC Total
15 Comentário Observe que independentemente da companhia, 94% não tinham o plano especial da AT&T e 6% tinham. Quando olhamos por companhia temos 90% e 10% para a AT&T e 97% e 3% para outras companhias. N Y total ATT OCC Total
16 Atividade 2 Obtenha os perfis-coluna para estas variáveis. pc=x for (i in 1:3) {for (j in 1:3) { pc[j,i]=pc[j,i]/pc[3,i]}} e round(pc,digits=2)
17 Perfis-coluna N Y total ATT OCC total Volta para exercício. Percebe-se que o perfil-coluna de totais (51%- ATT e 49%-OCC) para as companhias é parecido com o perfil de quem não possuiu o tal plano (49%-ATT e 51%-OCC) Mas o perfil de totais é bem diferente do perfil de quem possuiu o plano (77%-ATT e 23%-OTT).
18 COMENTÁRIO Desta última observação podemos concluir que há uma associação entre estas variáveis (cia e plano): o fato de ter possuído o plano da AT&T parece favorecer o domicílio a usar o serviço de longa distância da companhia AT&T(77%) e caso contrário, não há prevalência da AT&T(49%).
19 Problema Como quantificar a associação entre duas variáveis qualitativas? Antes de responder essa pergunta, obtenha a tabela de contingência para cia e idade. Depois, obtenha os perfis-linha e coluna da tabela obtida.
20 Companhia versus idade ATT OCC x=matrix(0,3,7) x[1:2,1:6]=table(dados$cia,dados$idade) for (i in 1:2) {x[i,7]=sum(x[i,])} for (i in 1:7) {x[3,i]=sum(x[,i])}
21 Companhia versus idade > x total ATT OCC total
22 Perfis-linha Distribuição das idades por companhia: pl=x for (i in 1:7) {for (j in 1:3) {pl[j,i]=pl[j,i]/pl[j,7]}} total ATT OCC total Obs.: Podemos perceber que entre os clientes da AT&T, 54% estão entre os mais jovens e entre os de outras companhias (OCC), 55% estão entre os mais velhos. Isto indica alguma associação entre estas variáveis.
23 Perfis-coluna Distribuição das companhias (ATT e OCC) por faixa de idade: pc=x for (i in 1:3) {for (j in 1:7) {pc[i,j]=pc[i,j]/pc[3,j]}} total ATT OCC total
24 Medida de associação Se as duas variáveis em estudo são independentes, espera-se que a distribuição marginal de uma delas (sem discriminar por valores da outra) seja igual às distribuições condicionadas por valores da outra. A partir dessa idéia, podemos construir uma medida de associação entre duas variáveis qualitativas, conhecida como Qui-quadrado.
25 Exemplo: Suponha a seguinte tabela de contingência Ao examinar 400 estudantes de certa Instituição distribuídos pelos cursos de Estatística e Engenharia, obteve-se: sexo Curso 1 Estatística Curso 2 Engenharia total Homens Mulheres total
26 Curso versus sexo Se sexo e matrículas nos cursos de Engenharia e Estatística fossem independentes, esperaria-se ter os seguintes perfis-coluna: sexo Curso 1 Estatística Curso 2 Engenharia total Homens 60% 60% 60% Mulheres 40% 40% 40% total 100% 100% 100%
27 Valores esperados sob independência Como são 100 alunos em Estatística e 300 alunos em Engenharia, (240 do sexo masculino e 160 do sexo feminino) esperaria-se, em caso de independência, ter a seguinte tabela de contingência: sexo Curso 1 Estatística Curso 2 Engenharia total Homens Mulheres total
28 Tabela com as freqüências observadas: sexo Curso 1 Estatística Curso 2 Engenharia total Homens Mulheres total Tabela com as freqüências esperadas no caso de não associação: sexo Curso 1 Estatística Curso 2 Engenharia total Homens Mulheres total
29 Qui-quadrado O qui-quadrado é uma medida que baseia-se na comparação entre os valores observados, que aqui denotaremos por n ij e os valores esperados que denotaremos por e ij. Para cada cela da tabela de contingência calculamos ( n e ij e ij ij 2 )
30 Tabela com as freqüências observadas: sexo Curso 1 Estatística Curso 2 Engenharia total Homens Mulheres total ( ) Tabela com as freqüências esperadas no caso de não associação: (40 60) 60 2 sexo Curso 1 Estatística Curso 2 Engenharia total Homens Mulheres total
31 Qui-quadrado O qui-quadrado é, então, l c ( n ij e 2 ij ) e i 1 j 1 ij 2 onde l representa o número de categorias de resposta da primeira variável e c, representa o número de categorias de resposta da segunda variável.
32 Cálculo do qui-quadrado do exemplo dos estudantes de Estatística e Engenharia 2 (40 60) 60 2 ( ) (60 40) 40 2 ( ) ,22
33 Cálculo do Qui-quadrado usando o R Há no R, uma função específica que calcula o qui-quadrado de uma tabela de contingência. Interpretação: se a hipótese de nãoassociação entre as variáveis for verdadeira, o valor do qui-quadrado deve estar próximo de zero. Quanto maior for o valor do quiquadrado, mais forte é a associação entre as variáveis.
34 Cálculo do qui-quadrado usando o R Suponha que x seja a matriz contendo os dados da tabela dos estudantes: x=matrix(0,2,2) x[1,1]=40 x[1,2]=200 x[2,1]=60 x[2,2]=100
35 Cálculo do Qui-quadrado usando o R Qui=chisq.test(x,correct=F) Pearson's Chi-squared test data: x X-squared = (qui-quadrado), df = 1, (graus de liberdade) p-value = 2.428e-06 (P-valor) Notação científica para 0, Pode ser usado como uma medida de avaliação da magnitude do qui-quadrado: - p-value<=0,05, indica que o qui-quadrado é grande, ou seja, indica uma possível associação entre as variáveis.
36 Comentários do exemplo De acordo com o slide anterior, verifica-se que o Qui-quadrado obtido é alto, o que indica a presença de associação entre curso e sexo. Mais ainda, pela análise das tabelas verificamos que essa associação ocorre de tal modo que no curso de Estatística a maioria (60%) dos estudantes tende a ser do sexo feminino e na Engenharia, a maioria (67%) tende a ser do sexo masculino.
37 Medidas derivadas do qui-quadrado Pearson definiu uma medida de associação, baseada no quiquadrado, chamada coeficiente de contingência, dado por C 2 2 n onde n é o tamanho da amostra.
38 Medidas derivadas do qui-quadrado Interpreta-se o coeficiente de contingência de maneira análoga ao coeficiente de correlação. Porém, o coeficiente de contingência, apesar de estar entre 0 e 1 nunca atinge o valor 1. O valor máximo de C depende de l (número de categorias de resposta da primeira variável), de c (número de categorias de resposta da segunda variável) e de n, o tamanho da amostra.
39 Medidas derivadas do qui-quadrado Outro coeficiente é dado por T ( l 2 / n 1)( c 1) que pode atingir o máximo igual a 1, quando l=c.
40 Coeficientes para os dados do exemplo curso versus sexo qui= CP=sqrt(qui/(qui+sum(x))) CP [1] TC=sqrt((qui/sum(x))/(1*1)) TC [1]
41 Atividade 3: Calcule o qui-quadrado, e os coeficientes C e T, das seguintes tabelas de contingência: 1) cia e plano; 2) cia e idade; 3) cia e cartao; 4) cia e nonpub; 5) cia e renda; 6) cia e instrucao; 7) cia e emprego.
42 3.1) cia versus plano x=table(dados$cia,dados$plano) N Y ATT OCC chisq.test(table(dados$cia,dados$plano),correct=f) Pearson's Chi-squared test data: table(dados$cia, dados$plano) X-squared = , df = 1, p-value = 1.940e-05 qui= CP=sqrt(qui/(qui+sum(x))) TC=sqrt((qui/sum(x))/(1*1)) CP [1] TC [1]
43 Companhia versus plano Como o valor de Qui-quadrado foi 18,2476, com um P-valor de 0, (bem menor do que 0,05), isso indica presença de associação entre as variáveis Companhia e Plano Vimos que entre os que participaram do plano, a maioria (77%) já usou os serviços de longa distância da AT&T. Entre os que não participaram do plano a distribuição fica mais equilibrada com 49% para AT&T e 51% para outras companhias. Ver tabela.
44 3.2) cia versus idade x=table(dados$cia,dados$idade) ATT OCC chisq.test(table(dados$cia,dados$idade),correct=f) Pearson's Chi-squared test data: table(dados$cia, dados$idade) X-squared = , df = 5, p-value = > qui= > CP=sqrt(qui/(qui+sum(x))) > TC=sqrt((qui/sum(x))/(1*5)) > CP [1] > TC [1]
45 3.2) cia versus idade Como o valor de Qui-quadrado foi 17,4135, com um P-valor de 0, (bem menor do que 0,05), isso indica presença de associação entre as variáveis Companhia e Idade Vimos que entre os clientes da AT&T, 54% estão nas faixas mais jovens. Entre os clientes de OCC, 55% estão nas faixas mais velhas.
46 3.3) cia versus cartao x=table(dados$cia,dados$cartao) N Y ATT OCC chisq.test(table(dados$cia,dados$cartao),correct=f) Pearson's Chi-squared test with Yates' continuity correction data: table(dados$cia, dados$cartao) X-squared = , df = 1, p-value = 1.255e-05 > qui= > CP=sqrt(qui/(qui+sum(x))) > TC=sqrt((qui/sum(x))/(1*1)) > CP [1] > TC [1]
47 3.4) cia versus nonpub x=table(dados$cia,dados$nonpub) chisq.test(table(dados$cia,dados$nonpub),correct=f) Pearson's Chi-squared test data: table(dados$cia, dados$nonpub) X-squared = , df = 1, p-value = 9.777e-05 > qui= > x N Y ATT OCC > CP=sqrt(qui/(qui+sum(x))) > TC=sqrt((qui/sum(x))/(1*1)) > CP [1] > TC [1]
48 3.5 Companhia versus renda chisq.test(table(dados$cia,dados$renda),correct=f) Pearson's Chi-squared test data: table(dados$cia, dados$renda) Qui-quadrado = 11,1541, df = 6, P-valor = 0,08373 > 0,05 Logo, não parece haver associação entre companhia e renda.
49 3.6 Companhia e Instrução chisq.test(table(dados$cia,dados$in strucao),correct=f) Pearson's Chi-squared test data: table(dados$cia, dados$instrucao) Qui-quadrado = 28,623, df = 5, p-valor = 0,
50 3.7 Companhia e emprego chisq.test(table(dados$cia,dados$e mprego),correct=f) Pearson's Chi-squared test data: table(dados$cia, dados$emprego) Qui-quadrado = 13,4602, df = 6, p-valor = 0,03628
Medidas de associação para variáveis categóricas em tabelas de dupla entrada
Medidas de associação para variáveis categóricas em tabelas de dupla entrada a) Quiquadrado de Pearson: mede a associação de tabelas de dupla entrada, sendo definida por: c ( e e ij ij n ) ij, em que é
Leia maisTópicos em Gestão da Informação II
Tópicos em Gestão da Informação II Aula 05 Variabilidade estatística Prof. Dalton Martins dmartins@gmail.com Gestão da Informação Faculdade de Informação e Comunicação Universidade Federal de Goiás Exercício
Leia maisAPONTAMENTOS DE SPSS
Instituto de Ciências Biomédicas de Abel Salazar APONTAMENTOS DE SPSS Rui Magalhães 2010-1 - - 2 - Menu DATA Opção SPLIT FILE Permite dividir, de uma forma virtual, o ficheiro em diferentes ficheiros com
Leia maisIntrodução. Ou seja, de certo modo esperamos que haja uma certa
UNIVERSIDADE FEDERAL DA PARAÍBA Teste de Independência Luiz Medeiros de Araujo Lima Filho Departamento de Estatística Introdução Um dos principais objetivos de se construir uma tabela de contingência,
Leia maisVimos que é possível sintetizar os dados sob a forma de distribuições de frequência e gráficos. Pode ser de interesse apresentar esses dados através d
UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DE POSIÇÃO E DISPERSÃO Departamento de Estatística Luiz Medeiros Vimos que é possível sintetizar os dados sob a forma de distribuições de frequência e gráficos.
Leia maisIntrodução à Bioestatística. Profº Lucas Neiva-Silva Universidade Federal de Ciências da Saúde de Porto Alegre 2008
Introdução à Bioestatística Profº Lucas Neiva-Silva lucasneiva@yahoo.com.br Universidade Federal de Ciências da Saúde de Porto Alegre 2008 Estatística Do grego statistós, de statízo, que significa estabelecer,
Leia maisMedidas de Dispersão. Introdução Amplitude Variância Desvio Padrão Coeficiente de Variação
Medidas de Dispersão Introdução Amplitude Variância Desvio Padrão Coeficiente de Variação Introdução Estudo de medidas que mostram a dispersão dos dados em torno da tendência central Analisaremos as seguintes
Leia maisLista de Exercícios Algoritmos Vetores. 10) Escreva um algoritmo em PORTUGOL que armazene em um vetor todos os números
Universidade Federal de Minas Gerais - UFMG Instituto de Ciências Eatas - ICE Disciplina: Programação de Computadores Professor: David Menoti (menoti@dcc.ufmg.br) Monitor: João Felipe Kudo (joao.felipe.kudo@terra.com.br)
Leia maisDiretoria de Pesquisas - DPE Coordenação de População e Indicadores Sociais - COPIS Gerência de Indicadores Sociais - GEISO 17/12/2014
2014 Diretoria de Pesquisas - DPE Coordenação de População e Indicadores Sociais - COPIS Gerência de Indicadores Sociais - GEISO 17/12/2014 Indicadores Sociais Construção baseada em observações geralmente
Leia maisConteúdo. 1 Introdução. Histograma do Quarto Sorteio da Nota Fiscal Paraná 032/16. Quarto Sorteio Eletrônico da Nota Fiscal Paraná
Quarto Sorteio Eletrônico da Nota Fiscal Paraná Relatório parcial contendo resultados 1 da análise estatística dos bilhetes premiados Conteúdo 1 Introdução Este documento apresenta a análise dos resultados
Leia maisMedidas e Escalas: Fundamentos e Escalas Comparativas Prentice Hall
Medidas e Escalas: Fundamentos e Escalas Comparativas 1-1 Sumário 1) Visão Geral; 2) Medidas e Escalas; 3) Principais ; i. Escala Nominal ii. Escala Ordinal iii. Escala Intervalar iv. Escala de Razão 1-2
Leia maisAnálise Exploratória de Dados
Análise Exploratória de Dados Objetivos da aula Resolver exercícios do livro-texto com o auxílio do R. 1) Exercício 29 Uma amostra de dez casais e seus respectivos salários anuais (em salários mínimos)
Leia maisÍndice. 1. Metodologia e objetivo. 2. Praticantes de skate: penetração nos lares. 3. Perfil da amostra
1 Índice 2 1. Metodologia e objetivo 2. Praticantes de skate: penetração nos lares 3. Perfil da amostra Objetivo 3 A pesquisa tem como objetivo medir a penetração e conhecer o perfil de praticantes de
Leia maisANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:
ANÁLISE DOS RESÍDUOS Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos: seguem uma distribuição normal; têm média zero; têm variância σ 2 constante
Leia maisDistribuições Conjuntas (Tabelas de Contingência)
Cruzamento de Dados Distribuições Conjuntas (Tabelas de Contingência) Lorí Viali, Dr. DESTAT/FAMAT/PUCRS viali@pucrs.br http://www.pucrs.br/famat/viali Distribuição Conjunta Exemplo (tabela um) Suponha
Leia maisElementos de Estatística
Elementos de Estatística Lupércio F. Bessegato & Marcel T. Vieira UFJF Departamento de Estatística 2013 Medidas Resumo Medidas Resumo Medidas que sintetizam informações contidas nas variáveis em um único
Leia maisUNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS
UNIVERSIDADE FEDERAL DA PARAÍBA MEDIDAS DESCRITIVAS Departamento de Estatística Tarciana Liberal Vimos que é possível sintetizar os dados sob a forma de distribuições de freqüências e gráficos. Pode ser
Leia maisquadrado testa conjuntamente se existe uma associação entre a variável resposta e uma variável preditora. No Assistente, é possível realizar um Teste
Este artigo é parte de uma série de artigos que explicam a pesquisa conduzida pelos estatísticos do Minitab para desenvolver os métodos e verificações de dados usados no Assistente no Software Estatístico
Leia maisEstudo sobre o Consumo de leite na Cidade de Monte Carmelo
Estudo sobre o Consumo de leite na Cidade de Monte Carmelo Vânia de Fátima Lemes de Miranda 1 Luciano Dias Cabral Neto 2 Luciano Mateus Luiz Rodrigues 3 Marcelo Rodrigues da Silva 4 Raynner Lage Cordeiro
Leia maisUniversidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA
Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA Estatística Geral I Prof: Jony Arrais Pinto Junior Lista 08 1. Utilizando os dados da Tabela 01 da Lista
Leia maisTeste Qui-quadrado de aderência Rinaldo Artes Insper Instituto de Ensino e Pesquisa 2014
Teste Qui-quadrado de aderência Rinaldo Artes Insper Instituto de Ensino e Pesquisa 2014 Objetivo: Decidir se um conjunto de dados segue uma determinada distribuição de probabilidades. Exemplo 1: Uma emissora
Leia mais[ ] EXEMPLOS: Muitas vezes precisamos montar uma Matriz a partir de uma lei geral. Analise os exemplos a seguir:
MATRIZES CONCEITO: Um conjunto de elementos algébricos dispostos em uma tabela retangular com linhas e colunas é uma Matriz. A seguir, vemos um exemplo de Matriz de 3 linhas e 4 colunas, e que representaremos
Leia mais1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.
1 1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. Modelo de Resultados Potenciais e Aleatorização (Cap. 2 e 3
Leia maisSignificância do Coeficiente de Correlação
Significância do Coeficiente de Correlação A primeira coisa que vamos tentar fazer nesta aula é apresentar o conceito de significância do coeficiente de correlação. Uma vez entendido este conceito, vocês
Leia maisEstatística Aplicada ao Serviço Social
Estatística Aplicada ao Serviço Social Módulo 7: Correlação e Regressão Linear Simples Introdução Coeficientes de Correlação entre duas Variáveis Coeficiente de Correlação Linear Introdução. Regressão
Leia maisProbabilidade e Estatística I Antonio Roque Aula 2. Tabelas e Diagramas de Freqüência
Tabelas e Diagramas de Freqüência Probabilidade e Estatística I Antonio Roque Aula 2 O primeiro passo na análise e interpretação dos dados de uma amostra consiste na descrição (apresentação) dos dados
Leia maisAULA 1 - CONCEITOS BÁSICOS E APRESENTAÇÃO DE DADOS PARTE 1
AULA 1 - CONCEITOS BÁSICOS E APRESENTAÇÃO DE DADOS PARTE 1 INFORMAÇÕES Professor: Roberto C. Leoni BLOG: http://aedbest.wordpress.com Apostilas com exercícios e gabaritos Software R http://cran.r-project.org/
Leia maisEsteróides Anabolizantes
Anabolizantes Brasil faixa etária e sexo. (Brasil) Tabela 1 - Anabolizantes distribuído segundo o sexo e a faixa etária. Observado % Intervalo de confiança 95% 12-17 0,4 (*) Masculino 1,0 (*) Feminino
Leia maisDeterminação de medidas de posição a partir de dados agrupados
Determinação de medidas de posição a partir de dados agrupados Rinaldo Artes Em algumas situações, o acesso aos microdados de uma pesquisa é restrito ou tecnicamente difícil. Em seu lugar, são divulgados
Leia maisUnidade III ESTATÍSTICA. Prof. Fernando Rodrigues
Unidade III ESTATÍSTICA Prof. Fernando Rodrigues Medidas de dispersão Estudamos na unidade anterior as medidas de tendência central, que fornecem importantes informações sobre uma sequência numérica. Entretanto,
Leia maisDistribuição de frequências:
Distribuição de frequências: Uma distribuição de frequências é uma tabela que reúne o conjunto de dados conforme as frequências ou as repetições de seus valores. Esta tabela pode representar os dados em
Leia maisIntrodução a elaboração de questionário
Introdução a elaboração de questionário Pré-requisitos: Lista das questões Criar uma nova pesquisa Para criar uma nova pesquisa, estando na tela inicial do sistema, clique em Nova pesquisa. No início da
Leia maisPESQUISA SOBRE A COMPRA E VENDA NO DIA DOS PAIS JUNTO AO COMÉRCIO CURITIBANO Agosto/2016
PESQUISA SOBRE A COMPRA E VENDA NO DIA DOS PAIS JUNTO AO COMÉRCIO CURITIBANO 2016 Agosto/2016 Introdução Objetivo Geral O estudo tem como objetivo geral avaliar o desempenho das vendas e compras no Dia
Leia maisESTATÍSTICA E. Prof Paulo Renato A. Firmino. Aulas
ESTATÍSTICA E Prof Paulo Renato A. Firmino praf62@gmail.com Aulas 05-06 Descritiva Medidas de Posição Mediana: É o valor que se localiza no centro de uma amostra ordenada Se o número de observações (n)
Leia mais9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla
9 Correlação e Regressão 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla 1 9-1 Aspectos Gerais Dados Emparelhados há uma relação? se há, qual
Leia maisPlanejamento Anual. Componente Curricular: Matemática Ano: 7º ano Ano Letivo: Professor(s): Eni e Patrícia
Planejamento Anual Componente Curricular: Matemática Ano: 7º ano Ano Letivo: 2016 Professor(s): Eni e Patrícia OBJETIVO GERAL Desenvolver e aprimorar estruturas cognitivas de interpretação, análise, síntese,
Leia maisSumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47
CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................
Leia maisCoeficiente de Assimetria
Coeficiente de Assimetria Rinaldo Artes Insper Nesta etapa do curso estudaremos medidas associadas à forma de uma distribuição de dados, em particular, os coeficientes de assimetria e curtose. Tais medidas
Leia maisDENSIDADE E DISSEMINAÇÃO ATUARIAL: PERSPECTIVAS PARA A PROFISSÃO C R I S T I N A M A N O MICHAEL SMITH
DENSIDADE E DISSEMINAÇÃO ATUARIAL: PERSPECTIVAS PARA A PROFISSÃO C R I S T I N A M A N O MICHAEL SMITH A G E N D A Introdução Contexto Dados Análise Resultados & Considerações Conclusão Introdução Os conceitos
Leia maisAgrupamento de Escolas de Águeda Escola Básica Fernando Caldeira
Agrupamento de Escolas de Águeda Escola Básica Fernando Caldeira Currículo da disciplina de Matemática - 7ºano Unidade 1 Números inteiros Propriedades da adição de números racionais Multiplicação de números
Leia maisMétodos Estatísticos Módulo 2 1 o. Semestre de 2008 ExercícioProgramado5 VersãoparaoTutor Profa. Ana Maria Farias (UFF)
Métodos Estatísticos Módulo 2 1 o. Semestre de 08 ExercícioProgramado5 VersãoparaoTutor Profa. Ana Maria Farias (UFF) 1. Um dado é viciado de tal forma que um número par é duas vezes mais provável que
Leia maisCapítulo 2 Probabilidades
Capítulo 2 Probabilidades Slide 1 Definições Slide 2 Acontecimento Qualquer colecção de resultados de uma experiência. Acontecimento elementar Um resultado que não pode ser simplificado ou reduzido. Espaço
Leia maisPesquisa Mensal de Emprego - PME
Pesquisa Mensal de Emprego - PME Dia Internacional da Mulher 08 de março de 2010 MULHER NO MERCADO DE TRABALHO: PERGUNTAS E RESPOSTAS A Pesquisa Mensal de Emprego PME, implantada em 1980, produz indicadores
Leia maisESTUDOS DE COORTE. Baixo Peso Peso Normal Total Mãe usuária de cocaína
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO CENTRO DE CIÊNCIAS DA SAÚDE FACULDADE DE MEDICINA DEPARTAMENTO DE MEDICINA PREVENTIVA DISCIPLINA DE EPIDEMIOLOGIA ESTUDOS DE COORTE 1) Com o objetivo de investigar
Leia maisDocentes da Rede Estadual do Paraná I - Perfil do profissional em sala de aula
Docentes da Rede Estadual do Paraná I - Perfil do profissional em sala de aula Com base nos resultados do Censo Escolar da Educação Básica 2013, este informativo apresenta um perfil dos 50.798 profissionais
Leia mais- identificar operadores ortogonais e unitários e conhecer as suas propriedades;
DISCIPLINA: ELEMENTOS DE MATEMÁTICA AVANÇADA UNIDADE 3: ÁLGEBRA LINEAR. OPERADORES OBJETIVOS: Ao final desta unidade você deverá: - identificar operadores ortogonais e unitários e conhecer as suas propriedades;
Leia maisEstatística Básica MEDIDAS RESUMO
Estatística Básica MEDIDAS RESUMO Renato Dourado Maia Instituto de Ciências Agrárias Universidade Federal de Minas Gerais Motivação Básica Se você estivesse num ponto de ônibus e alguém perguntasse sobre
Leia maisProva Resolvida Raciocínio Lógico Quantitativo e Estatística (ANAC/2016) Prof. Guilherme Neves
Prova Resolvida Raciocínio Lógico Quantitativo e Estatística (ANAC/2016) 31- (ANAC 2016/ESAF) A negação da proposição se choveu, então o voo vai atrasar pode ser logicamente descrita por a) não choveu
Leia maisPerfil do Empreendedor
2015/2016 Perfil do Empreendedor de Caxias do Sul Descrição da pesquisa O empreendedorismo é um tema bastante presente no cotidiano político e econômico do país. Você pode ser um empreendedor corporativo
Leia maisDescoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters
Universidade Técnica de Lisboa INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Informática e Sistemas de Informação Aplicados em Economia Descoberta de Conhecimento em Bases de Dados. Pesquisa de Clusters Descoberta
Leia maisGabarito da 1 a Lista de Exercícios de Econometria II
Gabarito da 1 a Lista de Exercícios de Econometria II Professor: Rogério Silva Mattos Monitor: Delano H. A. Cortez Questão 1 Considerando que o modelo verdadeiro inicialmente seja o seguinte: C = a + 2Y
Leia maisNotas em Álgebra Linear
Notas em Álgebra Linear 1 Pedro Rafael Lopes Fernandes Definições básicas Uma equação linear, nas variáveis é uma equação que pode ser escrita na forma: onde e os coeficientes são números reais ou complexos,
Leia maisAnexo I Ofícios Ministérios da Educação e SENAD
ANEXOS Anexo I Ofícios Ministérios da Educação e SENAD 383 384 Anexo II Secretaria da Educação (exemplo) Anexos 385 386 UNIFESP Anexos 387 388 Anexo III Questionário Anexos 389 390 Anexos 391 392 Anexos
Leia maisAULA 19 Análise de Variância
1 AULA 19 Análise de Variância Ernesto F. L. Amaral 18 de outubro de 2012 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de Janeiro: LTC. Capítulo
Leia mais2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média.
1) Inicializar um vetor de inteiros com números de 0 a 99 2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média 3)
Leia maisEstimativas e Tamanhos de Amostras
Estimativas e Tamanhos de Amostras 1 Aspectos Gerais 2 Estimativa de uma Média Populacional: Grandes Amostras 3 Estimativa de uma Média Populacional: Pequenas Amostras 4 Tamanho Amostral Necessário para
Leia maisVariáveis, Tipos de Dados e Operadores
! Variáveis, Tipos de Dados e Operadores Engenharias Informática Aplicada 2.o sem/2013 Profa Suely (e-mail: smaoki@yahoo.com) VARIÁVEL VARIÁVEL É um local lógico, ligado a um endereço físico da memória
Leia maisUma livraria vende a seguinte a quantidade de livros de literatura durante uma certa semana:
Medidas de Tendência Central. Depois de se fazer a coleta e a representação dos dados de uma pesquisa, é comum analisarmos as tendências que essa pesquisa revela. Assim, se a pesquisa envolve muitos dados,
Leia maisESTATÍSTICA BÁSICA AULA 05
ESTATÍSTICA BÁSICA AULA 05 TÁ NA MÉDIA! FILIPE S. MARTINS ESTATÍSTICA - ROTEIRO DISTRIBUIÇÃO DE FREQUÊNCIAS TABELA PRIMITIVA E ROL DISTRIBUIÇÃO DE FREQUENCIA ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
Leia maisPesquisa de Opinião Manaus Eleições Majoritárias 2º Turno
Pesquisa de Opinião Manaus Eleições Majoritárias 2º Turno - 2016 Número de Registro da Pesquisa Pesquisa registrada no TRE-AM sob o Nº AM-06440/2016 em 03/10/2016 Estatístico Responsável João Caldas do
Leia maisPROGRAMA e Metas Curriculares Matemática A. Estatística. António Bivar, Carlos Grosso, Filipe Oliveira, Luísa Loura e Maria Clementina Timóteo
PROGRAMA e Metas Curriculares Matemática A Estatística António Bivar, Carlos Grosso, Filipe Oliveira, Luísa Loura e Maria Clementina Timóteo O tema da Estatística nos Cursos Científico-Humanísticos de
Leia maisConceitos básicos, probabilidade, distribuição normal e uso de tabelas padronizadas
Conceitos básicos, probabilidade, distribuição normal e uso de tabelas padronizadas Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais Alguns conceitos População: é o conjunto de todos
Leia maisGrupo A - I semestre de 2014 Lista de exercícios 1 - Introdução à Estatística Descritiva C A S A (gabarito)
Grupo A - I semestre de 014 Exercício 1. (0,9 pontos). Classifique cada uma das variáveis nas situações abaixo: (a) (0, pontos). Uma empresa de cartões rastreou todas as compras efetuadas com crédito ou
Leia maisPesquisa em. propaganda. Faccat Profª Me. Taís Vieira
Pesquisa em propaganda Faccat Profª Me. Taís Vieira Tipos de pesquisa - Na escolha da melhor metodologia para uma investigação, tudo depende do que se deseja conhecer: o que e quanto ou como e por quê?
Leia maisEstatística Analítica
Teste de Hipótese Testes Estatísticos 2 Teste de Hipótese Testes Estatísticos 3 1 Teste de Hipótese Testes Estatísticos 4 Principais Testes: Teste Qui-quadrado Teste T de Student Teste ANOVA Teste de Correlação
Leia maisAT = Maior valor Menor valor
UNIVERSIDADE FEDERAL DA PARAÍBA TABELAS E GRÁFICOS Departamento de Estatística Luiz Medeiros DISTRIBUIÇÃO DE FREQUÊNCIA Quando se estuda uma massa de dados é de frequente interesse resumir as informações
Leia maisPESQUISA CIENTÍFICA -Aula 4-
PESQUISA CIENTÍFICA -Aula 4- Prof. Alexandre Paiva da Silva Pombal PB SUMÁRIO Pesquisa Conceitos Características Objetivos Finalidades Requisitos Qualidades do pesquisador Tipos de pesquisa científica
Leia mais22/02/2014. AEA Leitura e tratamento de dados estatísticos apoiado pela tecnologia da informação. Medidas Estatísticas. Medidas Estatísticas
Universidade Estadual de Goiás Unidade Universitária de Ciências Socioeconômicas e Humanas de Anápolis AEA Leitura e tratamento de dados estatísticos apoiado pela tecnologia da informação Prof. Elisabete
Leia maisModelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste
Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste Erica Castilho Rodrigues 2 de Setembro de 2014 Erro Puro 3 Existem dois motivos pelos quais os pontos observados podem não cair na reta
Leia maisÁLGEBRA LINEAR AULA 4
ÁLGEBRA LINEAR AULA 4 Luís Felipe Kiesow de Macedo Universidade Federal de Pelotas - UFPel 1 / 14 1 Introdução 2 Desenvolvimento de Laplace 3 Matriz Adjunta 4 Matriz Inversa 5 Regra de Cramer 6 Posto da
Leia maisPopulação e Amostra. População: O conjunto de todas as coisas que se pretende estudar. Representada por tudo o que está no interior do desenho.
População e Amostra De importância fundamental para toda a análise estatística é a relação entre amostra e população. Praticamente todas as técnicas a serem discutidas neste curso consistem de métodos
Leia mais4. AS FUNÇÕES EXPONENCIAL E LOGARÍTMICA
43 4. AS FUNÇÕES EXPONENCIAL E LOGARÍTMICA 4.1. A FUNÇÃO EXPONENCIAL Vimos no capítulo anterior que dado a R +, a potência a pode ser definida para qualquer número R. Portanto, fiando a R +, podemos definir
Leia maisINTRODUÇÃO À CIÊNCIA DA COMPUTAÇÃO. Lista de Exercícios de Linguagem C
INTODUÇÃO À CIÊNCIA DA COMPUTAÇÃO 1. Elabore um programa, em linguagem C, para ler o raio de um círculo e imprimir a sua área. 2. Elabore um programa, em linguagem C, para ler as coordenadas (x 1,y 1 )
Leia maisTeste de hipótese de variância e Análise de Variância (ANOVA)
Teste de hipótese de variância e Análise de Variância (ANOVA) Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais Testes sobre variâncias Problema: queremos saber se há diferenças estatisticamente
Leia maisExame de Acesso ACFES Maiores de 23; Acesso Específico. Matemática. PROVA MODELO - proposta de resolução
Ministério da Ciência, Tecnologia e Ensino Superior Exame de Acesso ACFES Maiores de 23; Acesso Específico Matemática PROVA MODELO - proposta de resolução - INSTRUÇÕES - Deverá responder à prova na folha
Leia maisCategorias Freq. absolutas Freq. relativas Categoria 1 n 1 f 1 = n 1 / n
1. Representação de dados qualitativos em tabelas e gráficos Para a representação de dados qualitativos em tabelas e gráficos vamos precisar definir algumas quantidades: n = tamanho da amostra ou frequência
Leia maisNov/2016. José Roberto Motta Garcia
José Roberto Motta Garcia garcia.cptec@gmail.com Fases da análise de dados Tratamento de dados Resumo estatístico dos dados - comandos Resumo estatístico dos dados - resultados Agrupamento pela soma (via
Leia maisAULA 11 Experimentos Multinomiais e Tabelas de Contingência
1 AULA 11 Experimentos Multinomiais e Tabelas de Contingência Ernesto F. L. Amaral 24 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG)
Leia mais16/10/2008-1ª pesquisa/2º turno
Pesquisa de Intenção de Voto Sucessão Municipal Canoas 16/10/2008-1ª pesquisa/2º turno Porto Alegre, 17 de outubro de 2008. 1 Sumário Apresentação e Metodologia... 3 Intenção de Voto... 5 Avaliação dos
Leia maisEstatística Descritiva
C E N T R O D E M A T E M Á T I C A, C O M P U T A Ç Ã O E C O G N I Ç Ã O UFABC Estatística Descritiva Centro de Matemática, Computação e Cognição March 17, 2013 Slide 1/52 1 Definições Básicas Estatística
Leia maisNOTA TÉCNICA. Metodologia utilizada para o estabelecimento das metas intermediárias para a trajetória do Ideb no Brasil, Estados, Municípios e Escolas
NOTA TÉCNICA Metodologia utilizada para o estabelecimento das metas intermediárias para a trajetória do Ideb no Brasil, Estados, Municípios e Escolas Nesta nota técnica será apresentada a metodologia utilizada
Leia maisÀ caraterística de um indivíduo ou objeto à qual se pode atribuir um número ou uma categoria,
MATEMÁTICA 3º CICLO FICHA Organização e Tratamento de Dados 11 População e amostra. Variável estatística. Organização e tratamento de dados Nome: N.ª: Ano: Turma: Data: / / 20 Para a realização desta ficha
Leia maisANÁLISE DE RISCO E RETORNO DE INVESTIMENTO USO DAS MEDIDAS DE DISPERSÃO
ANÁLISE DE RISCO E RETORNO DE INVESTIMENTO USO DAS MEDIDAS DE DISPERSÃO Luiz Fernando Stringhini 1 Na tentativa de mostrar as possibilidades de uso das ferramentas da estatística dentro da contabilidade,
Leia maisIndicadores confeccionados com dados do IBGE
Indicadores confeccionados com dados do IBGE IBGE Instituto Brasileiro de Geografia e Estatística (IBGE) Pesquisas domiciliares Pesquisa Nacional por Amostra de Domicílios (PNAD) Censo Demográfico Taxa
Leia maisUniversidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA
Universidade Federal Fluminense INSTITUTO DE MATEMÁTICA E ESTATÍSTICA DEPARTAMENTO DE ESTATÍSTICA Métodos Computacionais para Estatística II Prof: Jony Arrais Pinto Junior Lista 05 1. Leia o banco de dados
Leia maisQUÍMICA. A Ciência Central 9ª Edição. Capítulo 3 Estequiometria: cálculos com fórmulas e equações químicas. Prof. Kleber Bergamaski.
QUÍMICA A Ciência Central 9ª Edição Capítulo 3 Estequiometria: cálculos com fórmulas e equações químicas Prof. Kleber Bergamaski Equações químicas 1789, lei da conservação da massa A massa total de uma
Leia mais9. Comando de repetição com variável de controle (para.. de.. até.. faça)
9. Comando de repetição com variável de controle (para.. de.. até.. faça) Com o uso das estruturas enquanto e repita é possível elaborar rotinas que efetuam a execução de um looping um determinado número
Leia maisDesenho e Projeto de Tubulação Industrial Nível II
Desenho e Projeto de Tubulação Industrial Nível II Módulo I Aula 02 EQUAÇÕES Pense no seguinte problema: Uma mulher de 25 anos é casada com um homem 5 anos mais velho que ela. Qual é a soma das idades
Leia maisALGORITMOS COM SELEÇÃO 1 - ESTRUTURA CONDICIONAL (ESTRUTURAS DE CONTROLE)
Algoritmos e Estruturas de Dados 1 Prof. Eduardo 1 ALGORITMOS COM SELEÇÃO 1 - ESTRUTURA CONDICIONAL (ESTRUTURAS DE CONTROLE) Até o momento da disciplina vimos comandos de entrada, processamento e saída
Leia maisCaracterísticas. Em 2014, foram visitados 151 mil domicílios e entrevistadas 363 mil pessoas. Abrangência nacional
Rio de Janeiro, 13/11/2015 Abrangência nacional Características Temas investigados no questionário básico Características gerais dos moradores Educação Migração Trabalho e rendimento Trabalho infantil
Leia maisVimos que a todo o argumento corresponde uma estrutura. Por exemplo ao argumento. Se a Lua é cúbica, então os humanos voam.
Matemática Discreta ESTiG\IPB 2012/13 Cap1 Lógica pg 10 Lógica formal (continuação) Vamos a partir de agora falar de lógica formal, em particular da Lógica Proposicional e da Lógica de Predicados. Todos
Leia mais5 Experimentos Conjunto de Dados
Experimentos 48 5 Experimentos Este capítulo apresenta o ambiente experimental utilizado para validar o método de predição do CTR proposto neste trabalho. Na seção 5.1, descrevemos a geração do conjunto
Leia maisMatrizes. matriz de 2 linhas e 2 colunas. matriz de 3 linhas e 3 colunas. matriz de 3 linhas e 1 coluna. matriz de 1 linha e 4 colunas.
Definição Uma matriz do tipo m n (lê-se m por n), com m e n, sendo m e n números inteiros, é uma tabela formada por m n elementos dispostos em m linhas e n colunas. Estes elementos podem estar entre parênteses
Leia maisUsos do nome de terceiros. Abril de 2016
Usos do nome de terceiros Abril de 2016 OBJETIVOS DO ESTUDO Mapear o perfil e investigar o comportamento relacionado ao pedido de empréstimo de nome de terceiros para fazer compras parceladas. METODOLOGIA
Leia maisUniversidade Federal de Pelotas Cálculo com Geometria Analítica I Prof a : Msc. Merhy Heli Rodrigues Aplicações da Derivada
1) Velocidade e Aceleração 1.1 Velocidade Universidade Federal de Pelotas Cálculo com Geometria Analítica I Prof a : Msc. Merhy Heli Rodrigues Aplicações da Derivada Suponhamos que um corpo se move em
Leia maisCorpo da Dissertação ou Tese
PROGRAMA DE PÓS GRADUAÇÃO EM CIÊNCIA E ENGENHARIA DOS MATERIAIS PGCEM DEPARTAMENTO DE ENGENHARIA MECÂNICA UNIVERSIDADE DO ESTADO DE SANTA CATARINA SEMINÁRIOS Corpo da Dissertação ou Tese 2015/02 Corpo
Leia maisApostila de Matemática 10 Matriz
Apostila de Matemática 10 Matriz 1.0 Definição m e n são números inteiros maiores que zero. Matriz mxn é uma tabela retangular formada por m.n números reais, dispostos é m linhas e n colunas. A tabela
Leia maisFernando de Pol Mayer
Fernando de Pol Mayer Laboratório de Estatística e Geoinformação (LEG) Departamento de Estatística (DEST) Universidade Federal do Paraná (UFPR) Este conteúdo está disponível por meio da Licença Creative
Leia maisPlano da Apresentação. Medidas de localização central. Medidas de localização central. Média. Média. Exemplo nota média em Metodologias
Metodologia de Diagnóstico e Elaboração de Relatório FASHT Plano da Apresentação Mediana Moda Outras médias: a média geométrica Profª Cesaltina Pires cpires@uevora.pt Metodologias de Diagnóstico Profª
Leia maisLISTA DE EXERCÍCIOS I. Faça os seguintes exercícios do Apêndice D do livro do Wooldridge:
UNIVERSIDADE FEDERAL FLUMINENSE FACULDADE DE ECONOMIA ECONOMETRIA II Prof.ª Danielle Carusi Machado LISTA DE EXERCÍCIOS I REVISÃO DE ÁLGEBRA MATRICIAL Faça os seguintes exercícios do Apêndice D do livro
Leia mais