Tendência Central É um valor que representa uma entrada típica, ou central, de um conjunto de dados. média mediana moda
Análise exploratória de dados Histograma Simétrico Uniforme Média = Mediana Assimétrico à direita Assimétrico à esquerda Fonte: Larson cap. 2 Média > Mediana Média < Mediana
Exemplo Durante uma verificação de qualidade no conteúdo de seis recipientes de café instantâneo, foram obtidas as seguintes quantidades de café: 6,03 5,59 6,40 6,00 5,99 6,02 Qual a quantidade média e mediana encontrada? Média aritmética: x = n i= 1 n x i x = 6,03 + 5,59 + 6,40 + 6,00 + 5,99 + 6,02 6 x = 6,00
Exemplo Durante uma verificação de qualidade no conteúdo de seis recipientes de café instantâneo, foram obtidas as seguintes quantidades de café: 6,03 5,59 6,40 6,00 5,99 6,02 Qual a quantidade média e mediana encontrada? Mediana: 5,59 5,99 6,00 6,02 6,03 6,40 mediana = 6,00 + 6,02 2 = 6,01
Exemplo Durante uma verificação de qualidade no conteúdo de seis recipientes de café instantâneo, foram obtidas as seguintes quantidades de café: 6,03 5,59 6,40 6,00 5,99 6,02 Qual a quantidade média e mediana encontrada? x = 6,00 mediana = 6, 01 Suponha que o terceiro valor tenha sido incorretamente medido e que na verdade seja de 6,04. Determine novamente a quantidade média e Mediana. 6,03 + 5,59 + 6,04 + 6,00 + 5,99 + 6,02 x = = 5,95 6 5,59 5,99 6,00 6,02 6,03 6,04 6,00 + 6,02 mediana = 2 = 6,01
Exemplo 1 Durante uma verificação de qualidade no conteúdo de seis recipientes de café instantâneo, foram obtidas as seguintes quantidades de café: 6,03 5,59 6,40 6,00 5,99 6,02 Qual a quantidade média e mediana encontrada? x = 6,00 mediana = 6, 01 Suponha que o terceiro valor tenha sido incorretamente medido e que na verdade seja de 6,04. Determine novamente a quantidade média e Mediana. x = 5,95 mediana = 6, 01 Qual a medida mais afetada pela entrada incorreta: a média ou a mediana? Média
Exemplo 2 Considere o número de internações (X) de um hospital, observado para os trinta dias do mês de abril de 2003. Os dados são listados abaixo, por ordem cronológica. N = 30 dias amplitude: ( 0 =< X <=9 ) DIA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X = número 3 0 5 2 0 1 7 4 0 0 1 9 1 3 2 de internações DIA 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 X = número 5 2 7 5 1 0 4 6 4 0 3 5 8 5 6 de internações
Exemplo 2 Tabela 1 Distribuição de freqüências do número de internações (X) X F 0 6 1 4 2 3 3 3 4 3 5 5 6 2 7 2 8 1 9 1 total 30 Qual o número médio de internações diária?
Exemplo 2 Tabela 2 - Procedimento para cálculo. X F X. f 0 6 0 1 4 4 2 3 6 3 3 9 4 3 12 5 5 25 6 2 12 7 2 14 8 1 8 9 1 9 Total 30 99 Usando os dados da terceira coluna, X.f 99 X = = = 3, 3 Internações N 30 por dia
Exemplo 2 Qual o número mediano de internações diária? Tabela 3 - Mesma distribuição -Procedimento para cálculo. X F % % acumulada 0 6 20,0 20,0 1 4 13,3 33,3 2 3 10,0 43,3 3 3 10,0 53,3 4 3 10,0 63,3 5 5 16,7 80,0 6 2 6,7 86,7 7 2 6,7 93,4 8 1 3,3 96,7 9 1 3,3 100,0 total 30 100,0 Mediana=3 internações por dia
Exemplo 2 Qual o número mediano de internações diária? Tabela 1 Distribuição de freqüências do número de internações (X) (1) Número de vendas (2) f (3) Ponto Médio (X) (4) X. f (5) f acumulada (6) % (7) % acumulada 0 ------3 13 1,5 19,5 13 43,3 43,3 3 ------6 11 4,5 49,5 24 36,7 80,0 6 ------ 9 6 7,5 45,0 30 20,0 100,0 Total 30 114 100,0 ( N / 2) Md = L fac i +. h med fmed Onde: Li = é o limite inferior da classe que contém a mediana ( 3 ---- 6 ) N = 30.f ac = freqüência acumulada até a classe anterior à que contém a mediana (13).f med = freqüência da classe que contem a mediana (11).h med = amplitude da classe que contem a mediana (3) Md = 3 + [(15 13) / 11]. 3 = 3 + 0,54 = 3,54 internações por dia
Comparação entre Média, Mediana e Moda Média Mediana Moda Vantagens Limitações Tipo de Variáveis Reflete todos os valores Menos sensível à valores É influenciada por valores Mais difícil de ser determinada da amostra extremos que a média extremos para grande quantidade de dados Contínua e Discreta Contínua e Discreta Representa um valor típico Não tem função em certos conjunto de dados Contínua, Discreta, Nominal e Ordinal
Propriedades da média artimética 1. A média de qualquer conjunto pode ser sempre calculada. 2. Para um dado conjunto de números a média é única. 3. A média é afetada por todos os valores do conjunto. 4. Somando-se, subtraindo-se, multiplicando ou dividindo cada elemento do conjunto por uma constante a média também será acrescida, diminuída, multiplicada ou dividida por esta constante, respectivamente.
Medidas de Dispersão Indicam o grau de homogeneidade dos valores, até que ponto eles se encontram concentrados ou dispersos da média. O quanto os pontos estão distantes da média? Exemplo: Frequên ncia absoluta 10 8 6 4 A: 4, 4, 4, 4, 4, 4, 4,4 2 B: 3, 3, 3, 3, 5, 5, 5, 5 C: 1, 1, 3, 3, 5, 5, 7, 7 Frequência absoluta Frequência absoluta 0 10 8 6 4 2 0 10 8 6 4 2 0 0 1 2 3 4 5 6 7 Ocorrências 0 1 2 3 4 5 6 7 Ocorrências 0 1 2 3 4 5 6 7 Média Ocorrências
Medidas de Dispersão Variância e Desvio-Padrão Exemplo C X Média (X-Média) (X-Média) 2 1 4-3 9 1 4-3 9 3 4-1 1 3 4-1 1 5 4 1 1 5 4 1 1 7 4 3 9 7 4 3 9 Soma - 0 40 2 40 σ = 8 = 5 σ = σ 2 = 5 = 2.24
Medidas de Dispersão Indicam o grau de homogeneidade dos valores, até que ponto eles se encontram concentrados ou dispersos da média. Exemplo: Frequên ncia absoluta 10 8 6 4 A: 4, 4, 4, 4, 4, 4, 4,4 2 B: 3, 3, 3, 3, 5, 5, 5, 5 C: 1, 1, 3, 3, 5, 5, 7, 7 Frequência absoluta Frequência absoluta 0 10 8 6 4 2 0 10 8 6 4 2 0 0 1 2 3 4 5 6 7 Ocorrências 0 1 2 3 4 5 6 7 Ocorrências 0 1 2 3 4 5 6 7 σ = 0 σ =1 σ = 2.24 Média Ocorrências
Medidas de Dispersão Voltando a Tabela 1: Qual o desvio-padrão? X F X-MEDIA (X-MEDIA) 2 (X-MEDIA) 2. F 0 6 0-3,3= - 3,3 10,89 10,89 X 6= 65,34 1 4 1-3,3= - 2,3 5,29 5,29 X 4 = 21,16 2 3 2-3,3= - 1,3 1,69 1,69 X 3 = 5,07 3 3 3-3,3= - 0,3 0,O9 0,09 X 3 = 0,27 4 3 4-3,3= 0,7 0,49 0,49 X 3 = 1,47 5 5 5-3,3= 1,7 2,89 2,89 X 5 = 14,45 6 2 6-3,3= 2,7 7,29 7,29 X 2 = 14,58 7 2 7-3,3= 3,7 13,69 13,69 X 2 = 27,38 8 1 8-3,3= 4,7 22,09 22,09 X 1 = 22,09 9 1 9-3,3= 5,7 32,49 32,49 X 1 = 32,49 30 204,30 2 204,30 σ = = 6.81 internações 2 σ = 6.81 = 2. 61 30 internações
Exemplo 2 Qual o número médio de internações diária? Tabela 1 Distribuição de freqüências do número de internações (X) (1) Número de vendas (2) f (3) Ponto Médio (X) (4) X. f 0 ------3 13 1,5 19,5 3 ------6 11 4,5 49,5 6 ------ 9 6 7,5 45,0 Total 30 114 x 114 = = 30 3,8 Internações por dia
Medidas de Dispersão Coeficiente de Variação É o quociente entre o desvio-padrão e a média. CV = σ x Vantagem: caracterizar a dispersão dos dados em termos relativos a seu valor médio.
Medidas de Dispersão Exemplo: A: 4, 4, 4, 4, 4, 4, 4,4 B: 3, 3, 3, 3, 5, 5, 5, 5 C: 1, 1, 3, 3, 5, 5, 7, 7 Frequência absoluta Frequê ência absoluta Frequência absoluta 10 8 6 4 2 0 10 8 6 4 2 0 10 8 6 4 2 0 0 1 2 3 4 5 6 7 Ocorrências σ = 0 σ =1 0 1 2 3 4 5 6 7 Ocorrências σ = 2.24 CV CV CV = 0 = 4 0 1 = = 0.25 4 ou 25% = 2.24 4 = 0.56 0 1 2 3 4 5 6 7 Ocorrências ou 56% Média
e Dispersão Ambos os conjuntos de dados representados a seguir têm média igual a 50. Um deles tem desvio-padrão de 3,8 e outro, de 5,8. Qual é qual? 35 30 25 35 30 25 % 20 20 % 15 15 10 10 5 5 0 39 42 45 48 51 54 57 60 valor 0 39 42 45 48 51 54 57 60 valor (a) (b) Desvio-padrão: 3,8 5,8 Coeficiente de Variação: 8% 12%
Número de acessos de telefonia móvel por grupo de 100 habitantes (teledensidade) Fonte: Relatório Anual da Anatel, 2006.
Acidentes com Terceiros Fonte: ESTATÍSTICAS DE ACIDENTES NO SETOR DE ENERGIA ELÉTRICA BRASILEIRO, 2002
Decisão pela média A tabela a seguir resume todos os negócios com CDB com o mesmo prazo de vencimento em uma data qualquer: Taxa anual negociada(%) x i FR% 19.2 2 19.3 3 19.5 6 19.6 7 19.8 10 19.9 13 20.1 16 20.2 14 20.4 11 20.5 8 20.7 5 20.8 4 21.0 1 Total 100 Fonte: Securato, JR. Crédito Análise e Avaliação do Risco f i
Decisão pela média Fonte: Securato, JR. Crédito Análise e Avaliação do Risco