INTRODUÇÃO À ESTATÍSTICA O objecto da estatística Ciência que dispõe de processos apropriados para recolher, organizar, classificar, apresentar e interpretar conjunto de dados. 13-03-2002 Margarida Pocinho 1
A palavra estatística pode ter pelo menos três interpretações: um censo ou sondagem; um estudo; uma ciência. Estas três ideias não são independentes umas das outras mas têm a ver com a evolução histórica da estatística 13-03-2002 Margarida Pocinho 2
O que é a estatística? A estatística é a ciência que consiste na recolha, manipulação e classificação de dados tendo em vista o conhecimento de determinado fenómeno e a possibilidade de, a partir desse conhecimento, inferir possíveis novos resultados. É objectivo da Estatística extrair informação dos dados para obter uma melhor compreensão das situações que representam. 13-03-2002 Margarida Pocinho 3
Qual a importância de um estudo estatístico? Permite conhecer antecipadamente um determinado resultado de um estudo. 13-03-2002 Margarida Pocinho 4
Quais os passos a tomar num estudo estatístico? Definição do problema; Planificação do processo de resolução; Recolha de dados; Organização dos dados; Apresentação dos dados; Análise e interpretação dos dados. 13-03-2002 Margarida Pocinho 5
IMPORTANTE Quando nos referimos à estatística como sendo uma poderosa alfaia científica, pretendemos significar que não se trata de um conjunto de conhecimentos substantivos, mas tão somente de um conjunto de métodos com vista à aquisição de conhecimentos e, consequentemente, ao progresso científico resultante da investigação científica. Num determinado estudo estatístico deve-se planear a experiência, mesmo antes de recolher a amostra. Após a recolha dos dados sob a forma de amostra, faz-se a redução e representação desses dados, através de tabelas e de diferentes tipos de gráficos. Seguidamente o objectivo do estudo pode ser o de estimar uma quantidade ou de testar uma hipótese, utilizando técnicas estatísticas convenientes e baseando-se na amostra de forma a dar-nos uma medida de erro possível. 13-03-2002 Margarida Pocinho 6
População ou Universo Conjunto de indivíduos ou objectos que apresentam uma ou mais características em comum, podendo ser finita ou infinita, dependendo do número de elementos que a compõem. 13-03-2002 Margarida Pocinho 7
Características de uma população: Qualitativas Quantitativas Dicotómicas 13-03-2002 Margarida Pocinho 8
Amostra Subconjunto de uma população da qual são estudadas as características; Deve assegurar representatividade relativamente à população de onde foi retirada. 13-03-2002 Margarida Pocinho 9
Objectivos de recolha de uma amostra: Estimar características desconhecidas de uma população; Testar hipóteses ou afirmações consideradas correctas sobre parâmetros de uma população. 13-03-2002 Margarida Pocinho 10
ESTATÍSTICA- Recenseamento e Sondagem Em ambos os casos é necessário definir previamente e com rigor, a população que se pretende estudar (em estatística aplica-se o termo população a qualquer conjunto de elementos com pelo menos uma característica comum). 13-03-2002 Margarida Pocinho 11
Recenseamento É o estudo científico de um universo de pessoas, instituições ou objectos físicos com o propósito de adquirir conhecimentos, observando todos os seus elementos, a fazer juízos quantitativos acerca de características importantes desse universo (ex.:censos 91). 13-03-2002 Margarida Pocinho 12
Sondagem É o estudo de uma parte de uma população com o objectivo de estudar atitudes, hábitos e preferências da população relativamente a acontecimentos, circunstâncias e assuntos de interesse comum. 13-03-2002 Margarida Pocinho 13
Vantagens das sondagens comparativamente com os censos: A economia de meios e custos; A comodidade; A rapidez; O pequeno número de elementos que pode ser necessário destruir. 13-03-2002 Margarida Pocinho 14
Vantagens dos censos comparativamente com as sondagens: Os resultados obtidos são mais fiáveis; A necessidade de não utilizar amostras representativas da população como nas sondagens, o que nem sempre é fácil de conseguir; Não existe margem de erro como nas sondagens. 13-03-2002 Margarida Pocinho 15
IMPORTANTE Num censo são observados todos os indivíduos de uma população. Numa sondagem o estudo baseia-se numa parte da população a que se dá o nome de AMOSTRA e se supõe representativa dessa população. 13-03-2002 Margarida Pocinho 16
ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INDUTIVA A Estatística Matemática é jovem e em crescimento, e assim ninguém pode dizer em poucas palavras o que é, e talvez ninguém saiba... 13-03-2002 Margarida Pocinho 17
Estatística descritiva Também designada por elaboração estatística; 1ª fase do estudo estatístico; Consiste na recolha, registo e apresentação correcta de um determinado conjunto de dados; Estudo da amostra. 13-03-2002 Margarida Pocinho 18
Estatística indutiva Também designada de estatística dedutiva ou ainda análise estatística; Analisa os dados numéricos Infere conclusões para a população através dos resultados da amostra 13-03-2002 Margarida Pocinho 19
Etapas que definem o método estatístico: Identificação do problema Recolha de dados Crítica dos dados Apresentação dos dados Análise e interpretação 13-03-2002 Margarida Pocinho 20
Campos de Aplicação Os campos de aplicação da Estatística são muitos e os mais variados! 13-03-2002 Margarida Pocinho 21
Apoio à investigação científica A investigação científica tem por fim proporcionar um corpo de informações e conhecimentos que permitam ao homem uma cada vez melhor adaptação e controlo do meio em que vive, assim como um corpo de procedimentos que o habilitem a aumentar as informações e conhecimentos de que dispõe. Nestes objectivos, a Estatística dos nossos dias, que se assume como ciência autónoma, desempenha um papel primordial. 13-03-2002 Margarida Pocinho 22
Outros Conhecimentos da vida da nação nos seus últimos aspectos Confronto entre nações Fundamentação do estabelecimento de políticas Acções de planeamento, a nível nacional, regional e outras Acções de planeamento, contratação e acordos em empresas Acordos entre parceiros sociais Sustentação de tomadas de decisão e gestãode empresas 13-03-2002 Margarida Pocinho 23
Em suma, podemos dizer que a estatística está presente, com maior ou menor intensidade, em todos os actos do ser humano ainda que aplicada com grau de maior ou menor consciência. 13-03-2002 Margarida Pocinho 24
Alguns Exemplos: Exemplo 1 Medicina Pretende-se estudar o efeito de um novo medicamento para curar determinada doença. É seleccionado um grupo de 20 doentes, administrando-se se o novo medicamento a 10 desses doentes escolhidos ao acaso e o medicamento habitual aos restantes. 13-03-2002 Margarida Pocinho 25
População: conjunto de todos os doentes com a doença que o medicamento a estudar pretende tratar. Amostra: conjunto dos 20 doentes seleccionados. Problema: pretende-se, a partir dos resultados obtidos, realizar um teste de hipóteses para tomar uma decisão sobre qual dos medicamentos é melhor. Os campos de aplicação da Estatística são muitos e os mais variados! 13-03-2002 Margarida Pocinho 26
Exemplo 2 Controle de qualidade Os campos de aplicação da Estatística são muitos e os mais variados! O administrador de uma fábrica de parafusos pretende assegurar-se se de que a percentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada encomenda poderia ser rejeitada. 13-03-2002 Margarida Pocinho 27
Alguns Exemplos População: conjunto de todos os parafusos fabricados ou a fabricar pela fábrica, utilizando o mesmo processo. Amostra: conjunto de parafusos escolhidos ao acaso de entre o lote de produzidos. Os campos de aplicação da Estatística são muitos e os mais variados! Problema: pretende-se, a partir da percentagem de parafusos defeituosos presentes na amostra, estimar a percentagem de defeituosos em toda a produção. 13-03-2002 Margarida Pocinho 28
Exemplo 3 Estudo de mercado O gerente de uma fábrica de produtos desportivos pretende lançar uma nova linha de esquis, pelo que encarrega uma empresa especialista em estudos de mercado de estimar a percentagem de potenciais compradores desse produto. 13-03-2002 Margarida Pocinho 29
População: conjunto de todos os praticantes de desportos de neve. Amostra: conjunto de alguns praticantes inquiridos pela empresa. Problema: pretende-se, a partir das respostas afirmativas, de entre os inquiridos sobre a compra do novo produto, obter uma estimativa do número de compradores na População. 13-03-2002 Margarida Pocinho 30
DADOS TABELAS E GRÁFICOS Tipos de dados 13-03-2002 Margarida Pocinho 31
Dados qualitativos São variáveis que apenas podem assumir valores categoriais. Podem ser de natureza nominal ou ordinal. Dizem-se nominais quando entre as categorias possíveis apenas se podem estabelecer relações de igualdade ou diferença. Dizem-se ordinais quando entre as categorias se podem estabelecer relações de ordem. Nominais relação de igualdade ou diferença. Ex.: variável sexo, com duas categorias, masculino e feminino. Ordinais relação de idêntico, maior ou menor. Ex.: variável nível sócio-económico com três categorias baixo, médio e elevado. 13-03-2002 Margarida Pocinho 32
Dados quantitativos São variáveis que assumem valores numéricos. Podem ser de natureza discreta ou contínua, consoante se definam no conjunto dos números inteiros ou reais respectivamente. Discretas domínio N. Ex.: frequência cardíaca (batimentos/minuto) Contínuas domínio R. Ex.: nível de glicémia (mg/100ml). 13-03-2002 Margarida Pocinho 33
Forma Tabular Existem dois tipos de tabelas: Tabelas de distribuição de frequências Tabelas de contingência 13-03-2002 Margarida Pocinho 34
Tabelas de distribuição de frequências Usam-se se quando se tem apenas uma variável Tem que se ter em conta o tipo de variável em causa (qualitativa ou quantitativa) O tamanho da amostra A frequência absoluta A frequência absoluta acumulada A frequência relativa A frequência relativa acumulada 13-03-2002 Margarida Pocinho 35
Tabelas de contingência Usam-se se quando se pretende verificar a existência ou não de associação de variáveis qualitativas 13-03-2002 Margarida Pocinho 36
FORMA GRÁFICA Tal como para a representação tabular, também aqui há que fazer a distinção dos tipos de dados (variáveis) que temos, e ainda, no caso dos dados de natureza quantitativa, verificar se são contínuos ou discretos. 13-03-2002 Margarida Pocinho 37
diagrama de barras simples - É um conjunto de barras horizontais ou verticais, cada uma correspondendo a uma categoria da variável qualitativa em causa e sendo o seu comprimento proporcional à respectiva frequência (f i ou f r ). fi 8 6 4 2 0 barras simples 0 1 2 3 4 5 6 nº de irmãos fi 13-03-2002 Margarida Pocinho 38
diagrama de barras compostas Utilizam-se quando pretendemos representar duas variáveis, correspondendo as diferentes barras às categorias de uma variável e as subdivisões dessas mesmas barras às categorias da outra variável. Os valores são geralmente apresentados em termos percentuais.. 100% 80% 60% 40% 20% 0% Norte Centro Sul Outras D. Infecciosas Acidentes D. Neoplásicas D. Cardiovasculares 13-03-2002 Margarida Pocinho 39
Diagrama de barras múltiplas Permite representar os dados não só em termos percentuais, tal como vimos para os diagramas de barras compostas, mas também em termos absolutos. 50 40 30 20 10 0 termos percentuais Norte Centro Sul D. Cardiovasculares D. Neoplásicas Acidentes D. Infecciosas Outras 13-03-2002 Margarida Pocinho 40
Diagrama de barras duplo Deriva dos anteriores (barras múltiplas) quando intervém uma terceira variável. 13-03-2002 Margarida Pocinho 41
Diagrama de sectores circulares O arco de cada sector circular é proporcional à frequência da categoria que ele representa. O 52% A 22% AB 13% B 13% 13-03-2002 Margarida Pocinho 42
Pictograma Nestes diagramas cada categoria é representada por um círculo ou outra figura, sendo o raio ou tamanho da figura proporcional à respectiva frequência 9 19 19,8 13-03-2002 Margarida Pocinho 43
Dados de Natureza Quantitativa Discreta - barras Nestes diagramas cada categoria é representada por um círculo ou outra figura, sendo o raio ou tamanho da figura proporcional à respectiva frequência 40 35 30 25 20 15 10 5 0 1-2-3 4-5-6 7-8-9 10-11-12 Dias de internamento 13-03-2002 Margarida Pocinho 44
Dados de natureza quantitativa contínua Histograma - 40 35 30 25 20 15 10 5 0 1-2-3 4-5-6 7-8-9 10-11-12 Dias de internamento 13-03-2002 Margarida Pocinho 45
Relação entre duas variáveis quantitativas diagramas de dispersão ou scatergrams Estes gráficos permitem representar a associação entre duas variáveis quantitativas Colester ol (mg/ %) 230 21 0 190 170 150 130 110 20 30 40 50 60 70 idade (anos) 13-03-2002 Margarida Pocinho 46
Gráficos de séries temporais O tempo é representado no eixo horizontal e as frequências no eixo vertical. Os dados que se seguem são fictícios, referindo-se ao número de mortes registadas em Portugal, entre 1955 e 1990 por carcinoma do pulmão. Ainda que fosse provavelmente desejável representar a evolução anual do fenómeno, recorremos aqui, por uma questão de simplificação da apresentação, a médias de períodos de 5 anos. Pretende-se também uma Segunda variável, o sexo. Nº mortes 600 500 400 300 200 100 0 1955 60 1960 65 1965 70 períodos 1970 75 1975 80 1980 85 1985 90 S. Masculino S. Feminino 13-03-2002 Margarida Pocinho 47