Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística

Documentos relacionados
1 Estatística Descritiva

Teoria de probabilidade - objetiva descrever e prever as características de populações infinitas

Centro de Ciências e Tecnologia Agroalimentar - Campus Pombal Disciplina: Estatística Básica Aula 1 Professor: Carlos Sérgio

Prof.Letícia Garcia Polac. 28 de agosto de 2017

Unidade I ESTATÍSTICA. Prof. Celso Ribeiro Campos

CONTROLE ESTATÍSTICO DE PROCESSOS

Universidade Federal de Mato Grosso Instituto de Ciências Exatas e da Terra Departamento de Estatística. Notas de aula de Probabilidade e Estatística

Estatística. August 19, Mestrado em Educação Matemática UFOP August 19, / 54

Estatística. October 28, UFOP October 28, / 54

ESTATÍSTICA DESCRITIVA. Aula 07 Estatística Descritiva

Análise Descritiva de Dados

Estatística Aplicada. UNIVERSIDADE ESTÁCIO DE SÁ-RECIFE 2013 Prof: Wildson Cruz

PARTE 1- INTRODUÇÃO VERSÃO: JANEIRO DE 2017

Estatística Descritiva

Introdução. Quem nunca ouviu a palavra estatística referindo-se a um número ou conjunto de números?

Variáveis estatísticas ou variáveis: Os atributos (modalidades) ou magnitudes (valores) que se observam nos indivíduos de uma população.

um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos Aplicações em quase todas as áreas de

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

Estatística Descritiva: organização dos dados. 1 - Distribuição de frequências

20 Sidia M. Callegari-Jacques

Bioestatística. Luiz Ricardo Nakamura Cristiane Mariana Rodrigues da Silva. Ciências biológicas a USP ESALQ. Estatística

Estatística e Probabilidade Curso: Tecnólogo em Gestão Ambiental Semestre 2012/2

CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I

12/06/14. Estatística Descritiva. Estatística Descritiva. Estatística Descritiva. Estatística Analítica (Inferência estatística/estatística indutiva)

Adilson Cunha Rusteiko

Profa. Lidia Rodella UFPE-CAA

Estatística Computacional Profª Karine Sato da Silva

Probabilidade e Estatística Prof. Dr. Narciso Gonçalves da Silva

CURSO DE SPSS AULA 1. UFBA/FACED José Albertino Lordello Sheila Regina Pereira

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Estatística Descritiva

ESTATÍSTICA. Aula 1 Introdução, Tipos de Variáveis, Tipos de Dados e Tabela de Frequência. Fernando Arbache

Unidade I. Profa. Ana Carolina Bueno

Distribuição de Frequência de Variáveis Quantitativas Contínuas (Tabelas e Gráficos)

Cálculo das Probabilidades e Estatística I

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Aula 2: Resumo de Dados

Conceito de Estatística

UNIVERSIDADE FEDERAL DA PARAÍBA CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I

Estatística descritiva básica: Tabelas e Gráficos

Após essa disciplina você vai ficar convencido que a estatística tem enorme aplicação em diversas áreas.

Definição de estatística: fornece vários métodos para organizar e resumir um conjunto de dados e, com base nestas informações, tirar conclusões

Resumo de Dados. Tipos de Variáveis

ESTATÍSTICA COMPUTACIONAL AULA 1 RESUMO DE DADOS

Estatística Descritiva (aula 2) Curso de Farmácia Prof. Hemílio Fernandes

Tutorial para o desenvolvimento das Oficinas

Métodos Quantitativos

ESTATÍSTICA PROFESSOR: ALEXSANDRO DE SOUSA

Estatística. Professor Jair Vieira Silva Júnior.

Bioestatística Aula 2

BIOESTATÍSTICA AULA 2. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

Estatística Descritiva (I)

Estatística Básica. Profa. Andreza Palma

TIPOS DE VARIÁVEIS E RESUMO DE DADOS

Introdução à Estatística para Turismo

CURSO DE ESTATÍSTICA STICA DESCRITIVA Adriano Mendonça Souza Departamento de Estatística - UFSM -

Estatística Descritiva: organização dos dados. 1 - Distribuição de frequências

TIPOS DE VARIÁVEIS E RESUMO DE DADOS

Estatística Descritiva (I)

6EMA Lucas Santana da Cunha 17 e 19 de abril de Universidade Estadual de Londrina

A Estatística é aplicada como auxílio nas tomadas de decisão diante de incertezas para justificar cientificamente as decisões

Estatística Descritiva (I)

1 Medidas de dispersão

Estatística. Professor Jair Vieira Silva Júnior.

CENTRO UNIVERSITÁRIO LEONARDO DA VINCI CURSO: ENGENHARIAS DISCIPLINA: ESTATÍSTICA E PROBABILIDADE ESTATÍSTICA APRESENTAÇÃO DOS DADOS

Elementos de Estatística. Michel H. Montoril Departamento de Estatística - UFJF

UNIVERSIDADE FEDERAL DA PARAÍBA ESTATÍSTICA VITAL

ESTATÍSTICA- I 3- POPULAÇÃO E AMOSTRA Variáveis A cada fenômeno corresponde um número de resultados possíveis. Assim, por exemplo:

Estatística Descritiva

CONCEITOS BASICOS, ORGANIZAÇÃO E APRESENTAÇÃO DOS RESULTADOS, DISTRIBUIÇÃO DE FREQUÊNCIA

2EMA007 ESTATÍSTICA A

Capítulo 1. Análise Exploratória de Dados

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos.

ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

3. Análise Descritiva (ou Análise Exploratória)

Sintetizando dados qualitativos e quantitativos

RESUMO DE DADOS. Lucas Santana da Cunha Universidade Estadual de Londrina. 24 de abril de 2017

INTRODUÇÃO A ESTATISTICA PROF. RANILDO LOPES

Estatística Descritiva

Estatística I Aula 2. Prof.: Patricia Maria Bortolon, D. Sc.

Estatística: Conceitos e Organização de Dados

Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Departamento de Estatística

RANILDO LOPES. Estatística

Estatística Descritiva: organização dos dados 1 SÉRIES ESTATÍSTICAS

Unidade I ESTATÍSTICA. Prof. Celso Guidugli

VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DE PROBABILIDADE

Distribuição de Frequência de Variáveis Qualitativas e Quantitativas Discretas (Tabelas e Gráficos)

Unidade I ESTATÍSTICA APLICADA. Prof. Luiz Felix

Centro Universitário Maurício de Nassau Disciplina de Bioestatística Noções Básicas de Bioestatística

8/20/2010 MEDIDAS DE POSIÇÃO

Método Estatístico Tabelas e Gráficos. Prof.: Joni Fusinato

Unidade I ESTATÍSTICA DESCRITIVA. Profa. Isabel Espinosa

Módulo IV Sumarização dos Dados ESTATÍSTICA

SINTETIZANDO DADOS QUALITATIVOS E QUANTITATIVOS

Estatística. 1 Introdução 2 Tabelas Estatísticas 3 População, Amostra e Variáveis 4 Gráficos e Distribuição de Freqüências.

MAE116 Farmácia Estatística Descritiva (I)

CAPÍTULO 3 POPULAÇÃO E AMOSTRA

TRATAMENTO DA INFORMAÇÃO

Seção 1.1 Uma visão geral da estatística

Transcrição:

Universidade Federal de Mato Grosso - UFMT Probabilidade e Estatística 1 Introdução Definição: Estatística é um conjunto de conceitos e métodos científicos para coleta, organização, descrição, análise e interpretação de dados experimentais, que permitem tirar conclusões válidas e tomar decisões razoáveis. Classificação: Usualmente, a estatística se divide em: Estatística descritiva - é a parte que tem por objetivo organizar, apresentar e sintetizar dados observados de determinada população, sem pretenções de tirar conclusões de caráter extensivo. Teoria de probabilidade - objetiva descrever e prever as características de populações infinitas Inferência Estatística é a parte que, baseando-se em estudos realizados sobre os dados de uma amostra, procura inferir, induzir ou verificar leis de comportamento da população da qual a amostra foi retirada. A estatística inferencial tem sua estrutura fundamentada na teoria matemática das probabilidades. É, também definida como um conjunto de métodos para a tomada de decisões. No estudo da estatística alguns conceitos são importantes: População (N) - Conjunto de todos os elementos relativos a um determinado fenômeno que possuem pelo menos uma característica em comum, a população é o conjunto Universo. Exemplos: Todos os clientes de uma determinada empresa; Todos os produtos fabricados em uma determinada empresa; Amostra (n) - um subconjunto da população e deverá ser considerada finita, a amostra deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas as características da população como se fosse uma fotografia desta. Pesquisa Estatística: É qualquer informação retirada de uma população ou amostra, podendo ser através de Censo ou Amostragem Censo - atividade de inspecionar (observar) todos os elementos de uma população, objetivando conhecer, com certeza suas características; Amostragem - É o processo de retirada de informações dos n elementos amostrais, no qual deve seguir um método criterioso e adequado (tipos de amostragem). Dados estatísticos: é qualquer característica que possa ser observada ou medida de alguma maneira. As matérias-primas da estatística são os dados observáveis.

Figura 1: Representação de População Amostra Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão, geralmente as variáveis para estudo são selecionadas por processos de amostragem. Os símbolos utilizados para representar as variáveis são as letras maiúsculas do alfabeto, tais como X, Y, Z,... que pode assumir qualquer valor de um conjunto de dados. 1.1 Método Estatístico O Método Estatístico pode ser descrito pelas etapas a seguir: Definição do problema - Consiste na: formulação correta do problema; examinar outros levantamentos realizados no mesmo campo (revisão da literatura); saber exatamente o que se pretende pesquisar definindo o problema corretamente (variáveis, população, hipóteses, etc.) Planejamento -Determinar o procedimento necessário para resolver o problema: Como levantar informações; Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial). Cronograma, Custos, etc. Coleta da dados - Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer.; A coleta pode ser: Direta - diretamente da fonte ou Indireta - feita através de outras fontes. Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no registro de terceiros (secundários). Apuração dos dados - Consiste em resumir os dados, através de uma contagem e agrupamento. É um trabalho de coordenação e de tabulação.

Apresentação dos dados -É a fase em que vamos mostrar os resultados obtidos na coleta e na organização. Esta apresentação pode ser: Tabular (apresentação numérica) Gráfica (apresentação geométrica) Análise e interpretação dos dados - É a fase mais importante e também a mais delicada. Tira conclusões que auxiliam o pesquisador a resolver seu problema. 2 Estatística Descritiva A estatística descritiva é parte da estatística que lida com a organização, resumo e apresentação de dados. Esta é feita por meio de: Tabelas; Gráficos; Medidas Descritivas (média, variância, entre outras). 2.1 Tipo de Variáveis As variáveis podem ter valores numéricos ou não numéricos. Variáveis Qualitativas (ou categóricas) - são as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1 o, 2 o, 3 o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro). Variáveis Quantitativas - são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos Variáveis discretas: são aquelas variáveis que pode assumir somente valores inteiros num conjunto de valores. É gerada pelo processo de contagem Exemplos: número de filhos, número de empregados, número de processos. Variáveis contínuas: são aquelas variáveis que podem assumir um valor dentro de um intervalo de valores. É gerada pelo processo de medição Exemplos: pressão arterial, idade, salário, atraso de transmissão de bytes por uma rede de internet.

2.2 Variáveis Qualitativas Para resumir dados qualitativos, utiliza-se contagens, proporções, porcentagens, taxas por 1000, taxas por 1.000.000, etc, dependendo da escala apropriada. Por exemplo, se encontrarmos que 7 empresas com faturamento mensal acima de R$20.000,00 em uma amostra de 500 propriedades, poderíamos expressar isto como uma proporção (0,014) ou percentual (1,4%). Freqüentemente o primeiro passo da descrição de dados é criar uma tabela de freqüências. Antes de montar a tabela de distribuição de freqüências temos algumas definições: Freqüência - medida que quantifica a ocorrência dos valores de uma variável a um dado conjunto de dados. As freqüências podem ser: Absoluta (fa) - contagem das observações de uma variável; Relativa (fr) - divisão da freqüência absoluta pelo total de observações fr = fa n Percentual (fp) - é a freqüência relativa multiplicada por 100 fp = 100 fr Exemplo: Para adequar os produtos às preferências dos clientes, um provedor fez uma pesquisa sobre os provedores a qualidade dos serviços prestados utilizando uma amostra de 20 clientes, obtendo as seguintes variáveis: Tabela 1: Variáveis observadas de 20 clientes de um provedor. Amostra Sexo Qualidade Amostra Sexo Qualidade 1 feminino Boa 11 feminino Ruim 2 feminino Boa 12 feminino Ruim 3 feminino Boa 13 masculino Boa 4 feminino Boa 14 masculino Boa 5 feminino Boa 15 masculino Ótimo 6 feminino Ótimo 16 masculino Regular 7 feminino Ótimo 17 masculino Regular 8 feminino Regular 18 masculino Ruim 9 feminino Regular 19 masculino Ruim 10 feminino Ruim 20 masculino Ruim Neste é apresentado duas variáveis qualitativas sendo: Sexo - variável qualitativa nominal; Qualidade - variável qualitativa ordinal; Para resumir separadamente cada variável podemos utilizar a tabelas simples, que são na maioria das vezes suficientes para descrever dados qualitativos especialmente quando existem poucas categorias. Para a variável sexo, podemos utilizar as freqüências apresentadas na tabela 2:

Tabela 2: Distribuição de freqüência do sexo de 20 clientes de um provedor. Sexo Freqüência Freqüência Freqüência Absoluta Relativa Percentual (fa) (fr) (fp) feminino 12 0,60 60% masculino 8 0,40 40% 20 1,00 100% Para a variável qualidade no atendimento, além das freqüências utilizadas para a variável sexo, podemos utilizar mais duas freqüências: Freqüência Acumulada (FA)- obtida pelo soma das freqüências absolutas; Freqüência Percentual Acumulada (FP) - obtida pela soma das freqüências percentuais. Tabela 3: Distribuição de freqüência qualidade no atendimento de um provedor de acordo com 20 clientes Qualidade no Freqüência Freqüência Freqüência Freqüência Freqüência Atendimento Absoluta Relativa Percentual Acumulada Percentual (fa) (fr) (fp) (FA) Acumulada (FP) Ótima 3 0,15 15% 3 15% Boa 7 0,35 35% 10 50% Regular 4 0,20 20% 14 70% Ruim 6 0,30 30% 20 100% Total 20 1,00 100% - - Dados qualitativos são usualmente bem ilustrados num simples gráfico de barras onde a altura da barra é igual à freqüência. O gráfico na Figura?? apresenta as freqüências percentuais da Tabela 3. Figura 2: Qualidade no atendimento de um provedor de acordo com 20 clientes

Em alguns casos podemos estar interessados em resumir duas variáveis qualitativas ao mesmo tempo, neste caso vamos estudar a relação entre duas variáveis qualitativas que pode ser representada em uma tabulação cruzada. Nesta tabela conta-se quantos valores correspondem a cada par de possíveis resultados, para as duas variáveis. O resultado pode ser apresentado como freqüência absoluta ou relativa, em relação as colunas ou as linhas (nunca ambas). Tabela 4: Distribuição de freqüência absoluta de 20 clientes de um provador de acordo com a qualidade de atendimento e o sexo Qualidade Sexo Total Feminino Masculino Boa 5 2 7 Ótimo 2 1 3 Regular 2 2 4 Ruim 3 3 6 Total 12 8 20 O gráfico de barras, com barras justapostas de acordo com categorias diferentes, pode ser usado para apresentar a relação entre duas variáveis qualitativas. Figura 3: Distribuição de freqüência absoluta de 20 clientes de um provador de acordo com a qualidade de atendimento e o sexo 2.3 Variáveis Quantitativas Da mesma forma que as variáveis qualitativas, podemos resumir dados quantitativos por meio de tabelas de freqüências, entretanto a distinção entre as variáveis quantitativas discretas e contínuas na forma de preparação destas tabelas. A tabela de distribuição de freqüências de uma variável discreta é, em geral bastante semelhante à das variáveis qualitativas ordinais, pois os valores inteiros que a variável assume podem ser considerados como categorias, ou classes naturais.

Exemplo: Sejam dados referentes a um levantamento onde observou-se o numero de peças defeituosas em 25 maquinas de uma empresas. Tabela 5: Número de peças defeituosas em 25 maquinas de uma empresa 3 5 7 1 3 6 5 5 5 3 8 5 2 6 2 4 4 4 3 5 6 2 2 4 5 Observa-se que a disposição da variável número de de peças defeituosas é semelhante a de uma variável qualitativa ordinal com 8 categorias e sua distribuição de freqüência pode ser vista na tabela 6. A representação gráfica pode ser feita por meio de um gráfico de barras conforme figura 5. Figura 4: Número número de peças defeituosas de 25 maquinas de uma empresa A construção de tabelas de distribuição de freqüências para variáveis quantitativas contínuas é feita agrupando os dados em classes e obtendo as freqüências observadas em cada classe. É importante notar que ao resumir dados referentes a uma variável contínua sempre se perde alguma informação já que não temos idéia de como se distribuem as observações dentro de cada classe. Para isso temos duas definições: Amplitude (A) - corresponde a diferença enter o maior valor e o menor valor de um conjunto de dados; Amplitude da classe (c) - consiste na diferença entre o limite superior e o limite inferior de uma classe em uma distribuição de freqüência. O procedimento para construir tabelas de distribuição freqüências para variáveis quantitativas contínuas envolve os seguintes passos (algoritmo):

Tabela 6: Distribuição de freqüências do número de peças defeituosas de 25 maquinas de uma empresa Número de Freqüência Freqüência Freqüência Freqüência Freqüência Minerais Absoluta Relativa Percentual Acumulada Percentual (fa) (fr) (fp) (FA) Acumulada (FP) 1 1 0,04 4% 1 4% 2 4 0,16 16% 5 20% 3 4 0,16 16% 9 36% 4 4 0,16 16% 13 52% 5 7 0,28 28% 20 80% 6 3 0,12 12% 23 92% 7 1 0,04 4% 24 96% 8 1 0,04 4% 25 100% Total 25 1 100% Decidir sobre o numero de classes k, entre 5 e 20. Para que a decisão não seja totalmente arbitrária pode-se usar a raiz quadrada do total de valores como o número de classes, ou seja, k = n Determinar a amplitude dos dados: A = Max - Min. Determinar a amplitude de classe c: c = A k 1 Determinar o limite inferior da primeira classe LI 1 : LI 1 = Min c 2 Determinar o limite superior da primeira classe LS 1 : LS 1 = LI 1 + c sendo que o limite inferior da segunda classe LI 2 é igual ao LS 1, e assim LS 2 = LI 2 + c e assim, sucessivamente todas as classes vão sendo construídas. Após a construção das classes, são contados quantos dados estão contidos em cada classe e se obtem as freqüências.

Tabela 7: Dados ordenados, relativos ao tempo em segundos para carga de um aplicativo num sistema compartilhado (30 observações). 6,94 7,27 7,46 7,97 8,03 8,37 8,56 8,66 8,88 8,95 9,30 9,33 9,55 9,76 9,80 9,82 9,98 9,99 10,14 10,19 10,42 10,44 10,66 10,88 10,88 11,16 11,80 11,88 12,25 12,34 k = 30 = 5, 47 5 A = Max Min = 12, 34 6, 94 = 5, 40 c = A 5, 40 = = 1, 35 k 1 4 LI 1 = Min c 1, 35 = 6, 94 = 6, 94 0, 67 = 6, 27 2 2 Tabela 8: Distribuição de freqüências, relativa ao ao tempo em segundos para carga de um aplicativo num sistema compartilhado. Classes Freqüência Freqüência Freqüência Freqüência Freqüência Absoluta Relativa Percentual Acumulada Percentual (fa) (fr) (fp) (FA) Acumulada (FP) 6,27 7,62 3 0,10 10% 3 10% 7,62 8,97 7 0,23 23% 10 33% 8,97 10,32 10 0,33 33% 20 67% 10,32 11,67 6 0,20 20% 26 87% 11,67 13,02 4 0,13 13% 30 100% 30 1,00 100% Uma forma de representar graficamente à distribuição de freqüência das variáveis contínuas é por meio do histograma e do polígono de freqüência. Para elaboração deste gráfico é comum utilizar a chamada densidade de freqüência absoluta (dfa) dfa = fr c O histograma é semelhante ao gráfico de barras verticais, no eixo vertical pode-se utilizar as freqüências ou densidades de freqüências e no eixo horizontal as classes. O polígono de freqüências é um gráfico de linhas em que no eixo vertical pode-se utilizar as freqüências ou densidades de freqüências e no eixo horizontal o ponto médio de cada classe. Muitas vezes, a análise da distribuição de freqüências acumuladas é mais interessante do que a de freqüências simples, representada pelo histograma. O gráfico usado na representação gráfica da distribuição de freqüências acumuladas de uma variável contínua é a ogiva, apresentada na Figura 6. Para a construção da ogiva, são usadas as freqüências acumuladas (absolutas ou percentuais) no eixo vertical e os limites superiores de classe no eixo horizontal. O primeiro ponto da ogiva é formado pelo limite inferior da primeira classe e o valor zero,

Figura 5: Histograma e Polígono de freqüências do relativa ao tempo em segundos para carga de um aplicativo num sistema compartilhado indicando que abaixo do limite inferior da primeira classe não existem observações. Daí por diante, são usados os limites superiores das classes e suas respectivas freqüências acumuladas, até a última classe, que acumula todas as observações. Assim, uma ogiva deve começar no valor zero e, se for construída com as freqüências relativas acumuladas, terminar com o valor 100. Figura 6: Ogiva para o tempo em segundos para carga de um aplicativo num sistema compartilhado