Estatística Descritiva

Documentos relacionados
Bioestatística. Luiz Ricardo Nakamura Cristiane Mariana Rodrigues da Silva. Ciências biológicas a USP ESALQ. Estatística

Prof.Letícia Garcia Polac. 28 de agosto de 2017

Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística

Estatística Descritiva

ESTATÍSTICA DESCRITIVA. Aula 07 Estatística Descritiva

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

MAE116 Farmácia Estatística Descritiva (I)

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Estatística Descritiva (I)

Estatística Aplicada

Estatística Descritiva (I)

Estatística Descritiva (I)

Adilson Cunha Rusteiko

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Métodos Quantitativos

Conceito de Estatística

Tutorial para o desenvolvimento das Oficinas

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de

Medidas-Resumo. Tipos de Variáveis

Variáveis estatísticas ou variáveis: Os atributos (modalidades) ou magnitudes (valores) que se observam nos indivíduos de uma população.

Unidade I ESTATÍSTICA APLICADA. Prof. Luiz Felix

Introdução à Probabilidade e Estatística I

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes

1 Estatística Descritiva

Unidade I ESTATÍSTICA. Prof. Celso Ribeiro Campos

Estatística Descritiva

Elementos de Estatística

ESTATÍSTICA DESCRITIVA

ESTATÍSTICA DESCRITIVA

CAPÍTULO 4 DESCRIÇÃO E EXPLORAÇÃO DOS DADOS 2ª parte

Capítulo 1. Análise Exploratória de Dados

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

6EMA Lucas Santana da Cunha 17 e 19 de abril de Universidade Estadual de Londrina

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Fernando de Pol Mayer

INTRODUÇÃO A ESTATISTICA PROF. RANILDO LOPES

Medidas de Posição ou Tendência Central

CE001 Bioestatística. Prof. Cesar Augusto Taconeli. Curitiba-PR 2015

Métodos Experimentais em Ciências Mecânicas

CC-226 Introdução à Análise de Padrões

Bioestatística. October 28, UFOP October 28, / 57

Estatística Descritiva

ESTATÍSTICA. Estatística é o conjunto de métodos para a obtenção, organização, resumo, análise e interpretação dos dados.

TRATAMENTO DA INFORMAÇÃO

Bioestatística Aula 2

AULA 2 UNIDADE 1 DISTRIBUIÇÃO DE FREQUÊNCIAS 1.1 INTRODUÇÃO

Química e Estatística

BIOESTATÍSTICA AULA 2. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

CONCEITOS BASICOS, ORGANIZAÇÃO E APRESENTAÇÃO DOS RESULTADOS, DISTRIBUIÇÃO DE FREQUÊNCIA

Cálculo das Probabilidades e Estatística I

Capítulo 3 Estatísticas para Descrição, Exploração e Comparação de Dados. Seção 3-1 Visão Geral. Visão Geral. Estatísticas Descritivas

Análise descritiva de Dados. A todo instante do nosso dia-a-dia nos deparamos com dados.

Unidade III Medidas Descritivas

Bioestatística. Parte I. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011

INTRODUÇÃO À ESTATÍSTICA

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

Estatítica Descritiva e Exploratória

Probabilidade e Estatística Prof. Dr. Narciso Gonçalves da Silva

SS714 - Bioestatística

Estatística

Estatística Descritiva

Professora Ana Hermínia Andrade. Período

6EMA Lucas Santana da Cunha 19 de abril de Universidade Estadual de Londrina

Estatística descritiva

Profa. Lidia Rodella UFPE-CAA

Eng a. Morgana Pizzolato, Dr a. Aula 02 Revisão de Estatística DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

Estatística Descritiva (I)

X = j=1 X j n. X j. Número de abortos Local TOTAL Rio Vermelho Costa da Lagoa TOTAL

Noções de Estatística Airlane P. Alencar LANE

3.1 - Medidas de Posição Medidas de Dispersão Quantis Empiricos Box-plots Graficos de simetria 3.

Estatística Aplicada

Estatística Descritiva II

GRÁFICOS ESTATÍSTICOS

Prof. Dr. Engenharia Ambiental, UNESP

Estatística 1. Resumo Teórico

12/06/14. Estatística Descritiva. Estatística Descritiva. Estatística Descritiva. Estatística Analítica (Inferência estatística/estatística indutiva)

ESTATÍSTICA PROFESSOR: ALEXSANDRO DE SOUSA

Esta%s&ca Descri&va I Ciências Contábeis - FEA - Diurno 2º Semestre 2016

Stela Adami Vayego DEST/UFPR

CAPÍTULO 3 POPULAÇÃO E AMOSTRA

Estatística Descritiva II

Estatística. 1 Introdução 2 Tabelas Estatísticas 3 População, Amostra e Variáveis 4 Gráficos e Distribuição de Freqüências.

ESTATÍSTICA: UMA RÁPIDA ABORDAGEM Prof. David B.

ESTATÍSTICA ECONÔMICA A 6EMA

Introdução à Estatística Estatística Descritiva 22

PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA

Medidas de dispersão. 23 de agosto de 2018

Análise Exploratória e Estatistica Descritiva

Estatística Aplicada. UNIVERSIDADE ESTÁCIO DE SÁ-RECIFE 2013 Prof: Wildson Cruz

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Engenharia da Qualidade. Profa. Luciana Rosa Leite

CURSO DE SPSS AULA 2 MEDIDAS DESCRITIVAS. UFBA/FACED José Albertino Lordello Sheila Regina Pereira

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos.

Estatística descritiva básica: Tabelas e Gráficos

Distribuição de frequências:

Centro Universitário Maurício de Nassau Disciplina de Bioestatística Noções Básicas de Bioestatística

Estatística Descritiva. Objetivos de Aprendizagem. 6.1 Sumário de Dados. Cap. 6 - Estatística Descritiva 1. UFMG-ICEx-EST. Média da amostra: Exemplo:

CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I

Ensino de Estatística. Tratamento da Informação. Ensino de Estatística Profs. L. Bessegato e R. Bastos Estatística/ UFJF 1.

Transcrição:

Flávio B. Gonçalves Baseado no material do Prof. Marcos Prates 2018/01

1 Introdução O que é Estatística População e Amostra O papel da Inferência Estatística 2 Tipos de Variáveis Gráficos e Tabelas Sintese Numérica 3 Média Aritmética Média Ponderada Mediana Moda 4 Variância Desvio Padrão Coeficiente de Variação 5 Percentis Escore Padronizado Boxplot

O que é Estatística População e Amostra O papel da Inferência Estatística Definição Estatística: ciência que se preocupa com a descrição, análise e interpretação de dados experimentais. A Estatística está dividida em duas grandes áreas: : que se preocupa com a organização e descrição de dados; Inferência Estatística: que trata da análise e interpretação dos dados.

O que é Estatística População e Amostra O papel da Inferência Estatística A Estatística é aplicável a qualquer ramo do conhecimento onde se manipulem dados experimentais, como por exemplo: Medicina; Ciências Biológicas; Engenharia; Economia; Ciências Sociais, Ciência da Computação (Machine Learning), Administração,...

O que é Estatística População e Amostra O papel da Inferência Estatística Definição População: é um conjunto de elementos com pelo menos uma característica comum. Essa característica comum deve delimitar inequivocamente quais os elementos que pertencem a população e quais os que não pertencem. Uma vez perfeitamente caracterizada a população, o passo seguinte é o levantamento de dados acerca da característica (ou características) de interesse do estudo em questão. Na maioria das vezes não é conveniente, ou mesmo possível, realizar o levantamento dos dados referentes a todos os elementos da população.

O que é Estatística População e Amostra O papel da Inferência Estatística Devemos, então, limitar nossas observações a uma parcela da população, isto é, uma amostra proveniente desta população.

O que é Estatística População e Amostra O papel da Inferência Estatística Definição Amostra: Uma amostra é qualquer subconjunto (finito) da população. Para que as conclusões sobre o fenômeno em estudo sejam válidas, a amostra deve ser representativa da população. A escolha "subjetiva"das observações que irão compor a amostra, em geral, produz uma amostra tendenciosa, e pode levar conclusões completamente equivocadas. Amostras tendenciosas podem ser evitadas se o processo de amostragem for aleatório;

O que é Estatística População e Amostra O papel da Inferência Estatística Uma amostra aleatória pode ser obtida de duas formas: 1 com reposição; 2 sem reposição; Obervação O processo de amostragem é de fundamental importância na teoria Estatística!!!

O que é Estatística População e Amostra O papel da Inferência Estatística O objetivo da Inferência Estatística é tirar conclusões sobre a população com base nos resultados observados em amostras extraídas dessas populações. A Inferência Estatística baseia-se num processo de indução, isto é, um processo de raciocínio em que, partindo do conhecimento de uma parte, procura-se tirar conclusões sobre a realidade, no todo. É importante notar que o processo de indução (ou inferência) não é exato, pois o mesmo sempre estará sujeito a erros. A Inferência Estatística nos diz até que ponto poderemos estar errando em nossas induções, e com que probabilidade!!!

O que é Estatística População e Amostra O papel da Inferência Estatística Em suma, a Inferência Estatística busca obter resultados sobre as populações a partir de amostras, dizendo também qual a precisão desses resultados, e com que probabilidade se pode confiar nas conclusões obtidas. Evidentemente, a forma como as inferências serão realizadas irá depender de cada tipo de problema. É intuitivo pensar que, quanto maior a amostra, mais precisas e confiáveis serão as inferências realizadas sobre a população. Neste contexto, resultados mais perfeitos seriam obtidos pelo exame completo de toda a população, ao qual se costuma denominar censo ou recenseamento. Em muitos casos, porém, tal afirmação pode não ser válida!!!

O que é Estatística População e Amostra O papel da Inferência Estatística Amostras podem ser coletadas/examinadas por uma equipe de alto nível, fornecendo resultados confiáveis, ao passo que, para fazer o censo, deveríamos recorrer a uma equipe bem maior, cujo nível médio seria mais baixo, diminuindo a confiabilidade dos dados obtidos. Na maioria dos casos é possível determinar o tamanho necessário para uma amostra de tal forma a garantir inferências suficientemente precisas e confiáveis.

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Obervação Para os conceitos apresentados a seguir será irrelevante se o conjunto de elementos observados constitui uma amostra ou toda a população. Uma vez dispondo-se dos resultados observados, o passo seguinte deverá ser, necessariamente, extrair as informações contidas nesses resultados. É necessário que se tenham bem definidas quais características de interesse deverão ser verificadas. Se houver n elementos fisicamente considerados no estudo, estes elementos fornecerão n valores associados a uma dada característica de interesse.

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Desta forma, iremos sempre trabalhar com os valores de alguma variável de interesse, e não com os elementos originalmente considerados. Tipos de variáveis: Variáveis Qualitativas Nominais; Ordinais; Variáveis Quantitativas Discretas; Contínuas;

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Definição Variáveis Qualitativas: Uma variável será qualitativa quando resultar em uma classificação por tipos ou atributos. Definição Variáveis Quantitativas: Uma variável será quantitativa quando seus valores forem expressos em números que representam contagens ou medidas. Definição Variáveis Qualitativas Nominais: não existe nenhuma ordenação natural dos atributos (ou qualidades) da variável;

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Exemplos População: moradores de uma cidade. 1 Variável: sexo (masculino, feminino). 2 Variável: cor dos olhos (pretos, castanhos, verdes ou azuis). Definição Variáveis Qualitativas Ordinais: existe uma ordenação natural dos atributos (ou qualidades) da variável; Exemplo População: eleitores de uma cidade. Variável: desempenho do atual prefeito (ótimo, bom, regular, ruim, péssimo).

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Definição Variáveis Qualitativas Discretas: os possíveis valores da variável formam um conjunto finito ou infinito enumerável. Variáveis quantitativas discretas são, em geral, resultados de contagens. Exemplos 1 População: casais residentes em uma cidade. Variável: número de filhos. 2 População: as jogadas possíveis de um dado. Variável: valor obtido em cada jogada. 3 População: aparelhos produzidos em uma linha de montagem. Variável: número de defeitos.

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Definição Variáveis Qualitativas Contínuas: os possíveis valores da variável formam um intervalo de números reais. Variáveis quantiativas contínuas são, em geral, resultados de mensurações (sujeitas a erros!!!). Exemplos 1 População: casais residentes em uma cidade. Variável: altura. 2 População: sabonetes de certa marca e tipo. Variável: peso líquido. 3 População: aparelhos produzidos em uma linha de montagem. Variável: diâmetro externo.

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica O primeiro passo para se descrever graficamente um conjunto de dados observados é verificar as frequências dos diversos valores existentes da variável. Definição Frequência simples (ou absoluta): definimos a frequência de um dado valor de uma variável (qualitativa ou quantitativa) como o número de vezes que esse valor foi observado. Denotaremos a frequência do i-ésimo valor observado por f i.

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Sendo n o número total de elementos observados, verifica-se imediatamente que k f i = n, (1) i=1 onde k é o número de diferente valores existentes da variável. Definição Distribuição de frequências: é a associação das respectivas frequências a todos os distintos valores observados da variável em estudo. Alternativamente, poderemos usar as frequências relativas.

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Definição Frequência relativa: definimos a frequência relativa (denotaremos p i ), ou proporção de um dado valor de uma variável (qualitativa ou quantitativa) como o quociente de sua frequência pelo número total de elemntos observados, isto é, p i = f i n. (2) Evidentemente, temos que k p i = 1. i=1

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Exemplo Considere a distribuição dos fundos relativos a cada região do Brasil, de acordo com o Anuário da Bolsa de Valores de São Paulo de 1970. Tabela: Distribuição dos fundos relativos às regiões do Brasil. Número de Estabelecimentos Estado Unidades % São Paulo 38 28,1 Rio de Janeiro 30 22,2 Rio Grande do Sul 35 25,9 Minas Gerais 15 11,1 Demais Estados 17 12,7 Total 135 100

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Variáveis qualitativas (categóricas) podem ser representadas de diversas formas.

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Figura: Gráfico de setores (pizza) (a) e gráfico de barras (b).

O gráfico de barras também é adequado para representar a distribuição de frequências de variáveis quantitativas discretas. Exemplo Considere o conjunto de dados a seguir, constituído hipoteticamente por 20 valores da variável "número de defeitos por unidade", obtidos a partir de aparelhos retirados de uma linha de montagem. Tabela: Distribuição do número de defeitos por unidade. 2 4 2 1 2 3 1 0 5 1 0 1 1 2 0 1 3 0 1 2 x i f i p i 0 4 0,20 1 7 0,35 2 5 0,25 3 2 0,10 4 1 0,05 5 1 0,05

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Exemplo Tabela: Distribuição do número de defeitos por unidade. x i f i p i 0 4 0,20 1 7 0,35 2 5 0,25 3 2 0,10 4 1 0,05 5 1 0,05 Figura: Gráfico de barras - distribuição do número de defeitos por unidade.

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Quando tratamos de variáveis quantitativas, uma outra forma de representação gráfica baseada nas frequências acumuladas pode ser de interesse. Definição Frequência acumulada: a frequência acumulada (denotaremos F i ) em qualquer ponto do eixo das abscissas é definida como a soma das frequências de todos os valores menores ou iguais ao valor correspondente a esse ponto. Analogamente, teríamos as frequências relativas acumuladas (denotada neste caso por P i ).

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Exemplo Tabela: Distribuição do número de defeitos por unidade. x i f i F i p i P i 0 4 4 0,20 0,20 1 7 11 0,35 0,55 2 5 16 0,25 0,80 3 2 18 0,10 0,90 4 1 19 0,05 0,95 5 1 20 0,05 1,00

Exemplo Quando a variável de interesse é contínua o gráfico de barras não é mais adequado para a representação da distribuição de frequências da variável devido à característica contínua da mesma. O nível de albumina no sangue, um indicador do estado nutricional, foi medido em um grupo de n = 60 pacientes, obtendo-se os resultados apresentados na tabela abaixo. Tabela: Nível de albumina no sangue (g/dl). 4.44 4.47 4.48 4.51 4.54 4.54 4.61 4.64 4.66 4.68 4.68 4.69 4.71 4.73 4.76 4.76 4.76 4.81 4.86 4.86 4.87 4.88 4.90 4.90 4.95 4.95 4.96 4.97 4.98 4.98 4.99 5.00 5.01 5.01 5.01 5.02 5.04 5.05 5.08 5.09 5.09 5.10 5.11 5.11 5.16 5.17 5.18 5.18 5.19 5.24 5.24 5.26 5.27 5.27 5.29 5.32 5.35 5.46 5.50 5.85

A representação adequada de variáveis quantitativas contínuas dá-se através da construção de classes de frequências. Note que ao agruparmos os dados em classes de frequências para facilitar a visualização dos dados, alguma informação é perdida. Tabela: Distribuição de frequências do nível de albumina no sangue (g/dl). frequência absoluta frequência relativa Classe simples acumulada simples acumulada [4.20, 4.44) 1 1 0.02 0.02 [4.44, 4.68) 10 11 0.17 0.2 [4.68, 4.92) 13 24 0.23 0.41 [4.92, 5.16) 21 45 0.35 0.77 [5.16, 5.40) 12 57 0.18 0.95 [5.40, 5.64) 2 59 0.03 0.98 [5.64, 5.88) 1 60 0.02 1 Total 60-1 -

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Como construir as classes de frequências? n - número total de observações disponíveis; k - número classes; h - amplitude das classes; R - amplitude do conjunto de dados (diferença entre o maior e o menor valores observados); Temos que h R k ; (3) Emm geral, aceita-se como razoáveis valores de k variando de 5 a 15. Algumas regras para a escolha de k: 1 k = n; 2 k = 1 + 3.3 log 10 (n);

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Figura: Histograma (a) e gráfico das frequências acumuladas (ogiva) (b) para a variável nível de albumina no sangue (g/dl)

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica O histograma também pode ser usado em algumas situações para representar a distribuição de frequências de uma variável quantitativa discreta. Exemplo Considere o conjunto de dados a seguir, constituído hipoteticamente por 40 valores da variável "número diário de furtos"corridos em uma determinada cidade. 0 0 0 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 4 4 4 4 4 5 5 6 7 7 8 9 9 11 13 17 18 25

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Exemplo Tabela: Distribuição do número de pessoas com AIDS segundo o sexo, no período 1983 à 1996. ano homens mulheres 1983 100 100 1984 200 80 1985 400 80 1986 1000 120 1987 2000 300 1988 3000 1600 1989 5000 3000 1990 20000 13000 1991 50000 18000 1992 100000 25000 1993 100000 29000 1994 120000 38500 1995 110000 40000 1996 100000 45000

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica Exemplo Figura: Número de pessoas com AIDS segundo o sexo, no período 1983 à 1996.

Tipos de Variáveis Gráficos e Tabelas Sintese Numérica A sintese numérica de um conjunto de observações pode ser dividida em: medidas de tendência central; medidas de variabilidade; medidas de posição;

Média Aritmética Média Ponderada Mediana Moda Média aritmética (populational): µ = 1 N em que N x i (4) i=1 N é o tamanho da população em estudo; Média aritmética (amostral): x = 1 n em que n x i (5) i=1 n é o tamanho da amostra (parcela da população);

Média Aritmética Média Ponderada Mediana Moda A média ponderada é definada como em que X = n w i x i (6) i=1 n é o número de elementos observados; w i é tal que 0 w i 1 e n i=1 w i = 1; Para dados em classes de frequência, temos X n i=1 p i x i (7) em que x i denota o ponto médio da i-ésima classe.

Média Aritmética Média Ponderada Mediana Moda A mediana é definada como aquele valor que divide o conjunto de observações em duas partes de igual tamanho, ou seja, a mediana é o valor md tal que 50% da observações se encontram abaixo (acima) deste valor; Cálculo da mediana: ordenamos os dados (em ordem crescente); Caso 1: n é ímpar md = x n+1 ; (8) 2 Caso 1: n é par md = 1 2 (x n 2 + x n 2 +1 ); (9)

Média Aritmética Média Ponderada Mediana Moda A moda (denotaremos mo) é definada como o valor observado com mais frequência; Exemplo: Os dados a seguir representam as idades, em anos completos, de todas as crianças atendidas em um certo dia por um posto de saúde. 1, 4, 0, 1, 1, 7, 3, 2, 0, 0, 1, 4, 0, 5, 2, 1, 3, 3 Tabela: Distribuição de frequência da idade das crianças atendidas. idade 0 1 2 3 4 5 7 freq 4 5 2 3 2 1 1 neste caso, temos que mo = 1;

Média Aritmética Média Ponderada Mediana Moda Cálculo da moda (variáveis contínuas): em que mo = LI mo + 1 1 + 2 h (10) LI mo - limite inferior da classe modal; h - amplitude das classes; 1 = f mo f ant 2 = f mo f post f mo - freq. da classe modal; f ant - freq. da classe anterior à classe modal; f post - freq. da classe posterior à classe modal; Observação: Este procedimento só é válido para distribuições unimodais!

Variância Desvio Padrão Coeficiente de Variação A amplitude total (AT) de um conjunto de dados é definida é definida como a diferença entre o maior e o menor valor observado, isto é, AT = max min, (11) em que max - denota o maior valor observado; min - denota o menor valor observado;

Variância Desvio Padrão Coeficiente de Variação A variância populacional é definida como σ 2 = 1 N N (x i µ) 2 ; (12) i=1 A variância amostral é definida como em que S 2 = 1 n 1 n (x i x) 2, (13) i=1 N é o tamanho da população em estudo; µ é a média populacional; n é o tamanho da amostra (parcela da população); x é a média amostral;

Variância Desvio Padrão Coeficiente de Variação O desvio padrão populacional é definida como σ = 1 N (x i µ) N 2 ; (14) i=1 O desvio padrão amostral é definida como S = 1 n (x i x) n 1 2 ; (15) i=1

Variância Desvio Padrão Coeficiente de Variação O coeficiente de variação é definida como em que S é o desvio padrão amostral; x é a média amostral; CV =, (16) S x se estivermos trabalhando com dados referentes a toda a população, substituímos S e x por σ e µ em (16), respectivamente;

Variância Desvio Padrão Coeficiente de Variação Observações quanto menor é o CV, menor é o grau de dispersão (ou variabilidade) associado ao conjunto de dados; o CV é uma medida adimensional, isto é, não depende da unidade de medida utilizada; bastante útil para comparar a variabilidade entre conjuntos de dados medidos em escalas diferentes (como por exemplo, peso e altura); possibilita a comparação da variabilidade de uma variável entre diferentes grupos (por exemplo, o peso de homens e mulheres); valores do CV inferiores a 0.25 indicam que o conjunto de dados é razoavelmente homogêneo;

Percentis Escore Padronizado Boxplot O percentil de ordem k (onde k é qualquer valor entre 0 e 100), denotado por P k, é o valor tal que k% dos valores observados são menores ou iguais a P k. Cálculo de P k : ordene os dados (em ordem crescente); obtenha L = (k/100) n, em que n denota o número de observações, e k é a ordem do percentil; se L não é inteiro arredonte L para o maior inteiro mais próximo (L L) e tome se L é inteiro, tome P k = x L (17) P k = 1 2 (x L + x L+1 ) (18)

Percentis Escore Padronizado Boxplot definimos Q 1 - primeiro quantil (Q 1 = P 25 ); Q 2 - segundo quantil (Q 2 = P 50 = m o ); Q 3 - terceiro quantil (Q 3 = P 75 ); a distância interquartílica (DI) é definida da seguinte forma DI = Q 3 Q 1 ; (19)

Percentis Escore Padronizado Boxplot Os escores padronizados (EP) são medidas que, calculadas para cada observação do conjunto de dados, nos permitem fazer comparações entre valores de variáveis medidas em escalas diferentes; O EP associado a i-ésima observação é definido como EP i = x i x S (20) se estivermos trabalhando com dados referentes a toda a população, substituímos S e x por σ e µ em (20);

Percentis Escore Padronizado Boxplot Passos para a construção do Boxplot 1 obtenha Q 1, Q 2, Q 3 e DI; 2 calcule LI = Q 1 1.5 DI - limite inferior; LS = Q 3 + 1.5 DI - limite superior; 3 numa reta são marcados Q 1, Q 2 e Q 3 ; 4 acima dessa reta, constrói-se um retângulo com limites iguais as posições de Q 1 e Q 3, e cortado por um segmento de reta na posição relativa a mediana (Q 2 ); 5 a partir dos limetes do retângulo, traçam-se linhas até: encontrar um valor extremo (mínimo/máximo); caso o mínimo ou máximo ou ambos se encontrarem fora dos limites (LI e LS), traça-se linhas até o limite correspondente; Observação: Observações fora do intervalo [LI, LS] são consideradas observações discrepantes (outliers);

Percentis Escore Padronizado Boxplot Figura: Boxplot do nível de albumina no sangue (g/dl) medido em um grupo de n = 60 pacientes.

Percentis Escore Padronizado Boxplot Exemplo: Contagem de linfócitos T CD 4 doença de Hodgkin: corresponde a um dos vários tipos de câncer do sistema linfático. 20 pacientes em remissão de doença de Hodgkin; 20 pacientes em remissão de malignidades disseminadas não doença de Hodgkin;

Percentis Escore Padronizado Boxplot Tabela: Número de células T4/mm 3 em amostras de sangue. Número Hodgkin Não Hodgkin 1 171 116 2 257 151 3 288 192 4 295 208 5 396 315 6 397 375 7 431 375 8 435 377 9 554 410 10 568 426 11 795 440 12 902 503 13 958 675 14 1004 688 15 1104 700 16 1212 736 17 1283 752 18 1378 771 19 1621 979 20 2415 1252

Percentis Escore Padronizado Boxplot Figura: Boxplot do número de células T4/mm 3 em amostras de sangue.

Percentis Escore Padronizado Boxplot Figura: Histograma do número de células T4/mm 3 em amostras de sangue: doença de Hodgkin (a) e não doença de Hodgkin (b).