Gonçalo X. Silva Alda Carvalho

Documentos relacionados
Grande Conjuntos de Dados. Organização; Resumo; Apresentação. Amostra ou População. Defeitos em uma linha de produção

Escola Secundária de Jácome Ratton

Uma coleção de todos os possíveis elementos, objetos ou medidas de interesse.

sticas Estatística (divisão) População stica: uma definição Estatística:

Capítulo III Medidas Estatísticas

= n. Observando a fórmula para a variância, vemos que ela pode ser escrita como, i 2

Etapas para a construção de uma distribuição de frequências por ponto

13 ESTIMAÇÃO DE PARÂMETROS E DISTRIBUIÇÃO AMOSTRAL

MODELOS DE REGRESSÃO NÃO LINEARES

Estatística Descritiva. Medidas estatísticas: Localização, Dispersão

Estatística - exestatmeddisper.doc 25/02/09

x n = n ESTATÍSTICA STICA DESCRITIVA Conjunto de dados: Organização; Amostra ou Resumo; Apresentação. População

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro RESUMO

1- Qual a diferença entre amostragem probabilística e não-probabilística? Qual é a mais recomendada?

Relatório 2ª Atividade Formativa UC ECS

ESTATÍSTICA APLICADA À ZOOTECNIA

i 2 i= = n Observando a fórmula para a variância, vemos que ela pode ser escrita como, i 2

Revisão de Estatística X = X n

MEDIDAS DE POSIÇÃO: X = soma dos valores observados. Onde: i 72 X = 12

Média. Mediana. Ponto Médio. Moda. Itabira MEDIDAS DE CENTRO. Prof. Msc. Emerson José de Paiva 1 BAC011 - ESTATÍSTICA. BAC Estatística

CAPÍTULO 3 MEDIDAS DE TENDÊNCIA CENTRAL E VARIABILIDADE PPGEP Medidas de Tendência Central Média Aritmética para Dados Agrupados

EAD Métodos Estatísticos de Projeção

PROBABILIDADE E ESTATÍSTICA UNIDADE IV - MEDIDAS DE DISPERSÃO OU VARIAÇÃO

Distribuições Amostrais. Estatística. 8 - Distribuições Amostrais UNESP FEG DPD

Construção e Análise de Gráficos

Professor Mauricio Lutz REGRESSÃO LINEAR SIMPLES. Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das formulas: ö ; ø.

MEDIDAS DE DISPERSÃO:

Para quantificar a variabilidade de um conjunto de dados ou medidas é que se usam medidas de dispersão. Vamos estudar algumas delas nesta aula.

Estatística. 2 - Estatística Descritiva

Organização; Resumo; Apresentação.

Faculdade de Tecnologia de Catanduva CURSO SUPERIOR DE TECNOLOGIA EM AUTOMAÇÃO INDUSTRIAL

Estatística 15 - Comparação entre Duas Populações

ESTATÍSTICA II FORMULÁRIO

? Isso é, d i= ( x i. . Percebeu que

50 Logo, Número de erros de impressão

Tabela 1 Números de acidentes /mês no Cruzamento X em CG/07. N de acidentes / mês fi f

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou. experimental.

Análise da Informação Económica e Empresarial

Capítulo 5: Ajuste de curvas pelo método dos mínimos quadrados

MEDIDAS DE TENDÊNCIA CENTRAL I

Teste Intermédio I (45%)

1. Conceitos básicos de estatística descritiva 1.3. Noção de extracção aleatória e de probabilidade

DISTRIBUIÇÃO HIPERGEOMÉTRICA

PROBABILIDADE ESTATÍTICA

Organização de dados -Dados não agrupados n. Mediana:

Organização de dados -Dados não agrupados n. Mediana:

Regressão Simples. Parte III: Coeficiente de determinação, regressão na origem e método de máxima verossimilhança

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro RESUMO

ESTATÍSTICA MÓDULO 2 OS RAMOS DA ESTATÍSTICA

ANÁLISE DE REGRESSÃO E CORRELAÇÃO

Estatística: uma definição

Medidas Numéricas Descritivas:

(1) no domínio : 0 x < 1 Sujeita às condições de contorno: (2-a) CC1: (2-b) CC2: x dx

Econometria: 3 - Regressão Múltipla

ESTATÍSTICA Exame Final 1ª Época 3 de Junho de 2002 às 14 horas Duração : 3 horas

REGESD Prolic Matemática e Realidade- Profª Suzi Samá Pinto e Profº Alessandro da Silva Saadi

Estatística: uma definição

Estatística Básica - Continuação

UNIDADE IV MEDIDAS DE DISPERSÃO OU VARIAÇÃO

LCE2112 Estatística Aplicada às Ciências Sociais e Ambientais 2010/02. Exemplos de revisão

Estatística: uma definição

ANÁLISE DE ERROS. Todas as medidas das grandezas físicas deverão estar sempre acompanhadas da sua dimensão (unidades)! ERROS

MIEEC Supervisão e Controlo de Sistemas Eléctricos. Despacho Óptimo (incluindo limites de produção e perdas) Introdução

Modelo de Regressão Simples

Universidade Estadual de Londrina

d s F = m dt Trabalho Trabalho

Exame 2ª ÉPoca h00 Parte Prática. GRUPO 1 (3,0 val.)

Estatística: uma definição

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Interpolação. Exemplo de Interpolação Linear. Exemplo de Interpolação Polinomial de grau superior a 1.

Cap. 5. Testes de Hipóteses

Paulo Cabral Erros e Incertezas nas Medições Julho 2004

Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

Sumário. Mecânica. Sistemas de partículas

REGRESSÃO LINEAR 05/10/2016 REPRESENTAÇAO MATRICIAL. Y i = X 1i + 2 X 2i k X ni + i Y = X + INTRODUÇÃO SIMPLES MÚLTIPLA

Introdução à Estatística

INTRODUÇÃO ÀS PROBABILIDADES E ESTATÍSTICA

Análise Exploratória de Dados

Verificação, Validação e Experimentação com Modelos de Simulação

Para quantificar a variabilidade de um conjunto de dados ou medidas é que se usam medidas de dispersão. Vamos estudar algumas delas nesta aula.

Regressão e Correlação

Difusão entre Dois Compartimentos

RACIOCÍNIO LÓGICO / ESTATÍSTICA LISTA 2 RESUMO TEÓRICO

CAP. V AJUSTE DE CURVAS PELO MÉTODO DOS MÍNIMOS QUADRADOS

ESTATÍSTICA Aula 7. Prof. Dr. Marco Antonio Leonel Caetano

CADERNO 1 (É permitido o uso de calculadora gráfica.)

Introdução à Estatística. Júlio Cesar de C. Balieiro 1

Capítulo 1: Erros em cálculo numérico

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

MÓDULO 8 REVISÃO REVISÃO MÓDULO 1

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

9 Medidas Descritivas

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma:

CAP. V AJUSTE DE CURVAS PELO MÉTODO DOS MÍNIMOS QUADRADOS

Estatística: uma definição

Descritiva. Francisco Cysneiros DE - UFPE

Distribuições de Probabilidades

Regressao Simples. Parte II: Anova, Estimação Intervalar e Predição

Tópicos Extras 2ª parte. Análise de Correlação e Regressão

Centro de Ciências Agrárias e Ambientais da UFBA Departamento de Engenharia Agrícola

Transcrição:

Goçalo X. Slva Alda Carvalho

ÍNDICE. ESTATÍSTICA DESCRITIVA..... INTRODUÇÃO..... DEFINIÇÕES..... CLASSIFICAÇÃO DOS DADOS.... CARACTERIZAÇÃO DOS DADOS....5 ESTATÍSTICAS AMOSTRAIS... 0.5.. Medda de localzação... 0.5.. Medda de dperão..... DADOS BIVARIADOS......Regreão lear mple...... Correlação. Coefcete de determação...... Método do mímo quadrado... 5

Capítulo. Etatítca Decrtva.. Itrodução A etatítca é uma dcpla cujo objecto prcpal é a recolha, a complação, a aále e a terpretação de dado. No etdo de clarfcar o que e etede por aále e terpretação do dado vamo dede já etabelecer uma dtção etre etatítca decrtva e ferêca etatítca. No âmbto da etatítca decrtva procura-e tetzar e repreetar de uma forma compreeível a formação cotda um cojuto de dado. Eta tarefa, que adqure mportâca quado o volume de dado for gfcatvo, materalza-e a cotrução de tabela, de gráfco ou o cálculo de medda que repreetem coveetemete a formação cotda o dado. O objectvo da ferêca etatítca é ma ambcoo do que o da etatítca decrtva e, aturalmete, o método e técca utlzado ão ma oftcado. Com bae a aále de um cojuto lmtado de dado (uma amotra), pretede-e caracterzar o todo a partr do qual ta dado foram obtdo (a população). Nete capítulo vamo rever algu coceto e técca utlzada a etatítca decrtva (omeadamete o cálculo da medda ma mportate)... Defçõe População: Cojuto de todo o elemeto que cotêm uma certa caracterítca que etamo tereado em etudar. Sedo comum a todo o elemeto, eta caracterítca vara em quatdade ou qualdade. Uma população pode ter dmeão fta ou fta. Amotra: Subcojuto de dado que pertecem à população. A amotra aleatóra ão ecolhda atravé de proceo (técca de amotragem) que o garatem que o ubcojuto obtdo é repreetatvo da população. Alguma da razõe que o levam a etudar a amotra em vez de etudarmo a população ão a egute:

. População fta.. Cuto em termo de tempo ou de dhero que um etudo a toda a população mplcara.. Recolha de formação atravé de tete detrutvo.. Impobldade de aceder a todo o elemeto da população. Fae do Método de Aále Etatítca No âmbto da Etatítca, o método de abordagem do problema pode er decompoto a cco fae que egudamete e eucam:. Etabelecmeto do objectvo da aále a efectuar (to é, da quetõe que e colocam e que e pretedem ver reolvda) e defção da() população(õe) correpodete().. Cocepção de um procedmeto adequado para a elecção de uma ou ma amotra (ecolha da técca de amotragem a utlzar).. Recolha de dado.. Aále do dado (Etatítca Decrtva). 5. Etabelecmeto de ferêca acerca da população (Iferêca Etatítca)... Clafcação do dado O dado que cottuem uma amotra podem er epreo em quatro ecala dtta: omal, ordal, de tervalo e aboluta. O dado dzem-e epreo uma ecala omal quado cada um dele for detfcado pela atrbução de um ome que dega uma clae. A clae devem er eautva (qualquer dado pertece a uma da clae), mutuamete ecluva (cada dado pertece a uma ó clae) e ão ordeáve (ão ete ehum crtéro relevate que permta etabelecer preferêca por qualquer clae em relação à retate). Eemplo.: Clafcação da peoa pela cor do cabelo: preto, cataho, braco, loro, etc. O que dtgue a ecala ordal da ecala omal é a pobldade de e etabelecer uma ordeação da clae a qua o dado ão clafcado, egudo algum crtéro relevate. Eemplo.: Clafcação de ota em mau, ufcete, bom, ou muto bom.

Como e percebe a ecala omal e ordal dzem repeto a dado qualtatvo (repreetam qualdade). Relatvamete ao dado quattatvo (repreetam quatdade) temo a ecala de tervalo e a ecala aboluta. No cao da ecala de tervalo, o dado ão dferecado e ordeado por úmero epreo uma ordem cuja orgem é arbtrára. Nete cao pode-e atrbur um gfcado à dfereça etre ee úmero, ma ão à razão etre ele. Eemplo.: Temperatura regtada em o C, à 8 hora de da ucevo. Notee que ete cao, e em trê da coecutvo a temperatura atgr 5 o C, 0 o C, e 0 o C, ão faz etdo dzer-e que o tercero da eteve dua veze ma quete do que o egudo. De facto e a temperatura foe eprea outra ecala, a razão etre a temperatura regtada aquele da era dferete. Cotraramete ao que ucede com a ecala de tervalo, a ecala aboluta tem orgem fa. Neta ecala, zero gfca ada (ote-e que, aterormete, dzer que a temperatura era de 0 o C ão gfca que ão hava temperatura). Como coequêca do facto de a orgem er fa, a razão etre dado epreo uma ecala aboluta paa a ter gfcado. Eemplo.: Peo de peoa epreo em kg. Etre o dado quattatvo, ejam ele epreo em ecala de tervalo ou aboluta, é coveete fazer dede já a dtção etre dcreto e cotíuo. O dado ão dcreto quado ão obervaçõe de uma varável aleatóra dcreta e cotíuo quado ão obervaçõe de uma varável aleatóra cotíua (o coceto de varável aleatóra dcreta e varável aleatóra cotíua pode ver-e ma adate capítulo ).. Caracterzação do dado Não há uma etratéga úca para car o etudo decrtvo, embora uma prmera recomedação eja começar por uma eploração vual do dado. Muta veze há regto que ão e ecaam o padrão geral, e por o memo deve er averguado a veracdade do memo. Muta veze tratam-e de erro de obervação ou de regto, como também ão proveete de alteraçõe do feómeo em etudo. Para e ter uma dea ma cocreta acerca da forma do oo dado, recorremo a gráfco como htograma ou dagrama de caule-e-folha. Embora eta aále já e ecotrem dpoíve em váro programa e calculadora, para uma melhor terpretação da mema é coveete cohecer a técca utlzada. Para o, relatvamete a um etudo decrtvo é mportate:

Ordeação do dado - ode e começa a ter uma dea de alguma medda de localzação, como a medaa, quarto ou etremo; Etatítca amotra com alguma medda temo um reumo do oo dado relatvamete à localzação, dperão e forma; Agrupameto do dado e repreetação gráfca revela-o a forma poível para a oa população em etudo e permte-o ecolher a clae de modelo que devemo eplorar em aále ma oftcada. A caracterzação de dado que veremo dz repeto a uma amotra uvarada, ou eja, quado cada um do dado que a tegram, mede uma ecala qualquer, apea um atrbuto. Dado qualtatvo A forma ma comu de decrever amotra uvarada com dado epreo a ecala omal ou ordal evolvem o recuro a tabela de frequêca, a dagrama de barra ou a dagrama crculare. Em todo o cao o objectvo é o de repreetar a forma como o dado e dtrbuem por um cojuto de dferete categora. O úmero de dado cotdo uma categora qualquer ( =,..., k) dega-e por frequêca aboluta da categora. Deotado por tal frequêca e admtdo que a categora epecfcada cotêm todo o dado, o úmero total dete vem dado por : k = = () O úmero total de dado que pertecem a uma categora qualquer, quado epreo como uma proporção do úmero total de dado, dega-e por frequêca relatva da categora e é dada por, f = () A frequêca relatva ão muta veze defda em termo percetua. Eemplo.5: Numa amotra cottuída por 0 peça, cotatou-e que 00 ão tham qualquer defeto, 5 tham defeto ma eram recuperáve e 5 eram rrecuperáve. Na tabela egute repreetam-e a frequêca (aboluta e relatva) do dado que cottuem eta amotra: Categora de peça Frequêca aboluta Frequêca relatva Sem defeto 00 8.% Recuperáve 5.5% Irrecuperáve 5.% TOTAL 0 00%

Dagrama crcular % % Sem defeto Recuperáve Irrecuperáve 8% A formação cotda a tabela de frequêca e o dagrama, que clu a dferete categora a qua o dado da amotra foram clafcado, degae por dtrbução amotral. Dado quattatvo A técca utlzada para decrever amotra uvarada cottuída por dado quattatvo podem er clafcada em trê grupo:. forma de repreetação tabular ou gráfca de dado,. etatítca amotra, e. repreetação gráfca de etatítca. Na repreetação tabular etem ada do tpo de frequêca: a frequêca aboluta acumulada e a frequêca relatva acumulada. Como o ome dcam eta frequêca repreetam para cada categora, a frequêca aboluta (relatva) de dado que pertecem à clae ou a clae aterore. Devdo à ecedade de a categora etarem ordeada ó podemo falar de frequêca acumulada quado o dado etão em ecala orda, de tervalo ou aboluta. Valor da varável ( ) Frequêca aboluta ( ) Frequêca relatva (f ) Frequêca aboluta acumulada (N ) Frequêca relatva acumulada (F ) = N = F = f f f = N = + F = f + f M M M M M f =... N = + + = F = f +... + f = TOTAL - - 5

Eemplo.: No âmbto de um etudo realzado com o objectvo de caracterzar o comportameto do clete de um hpermercado, aalou-e o úmero de ocupate por veículo para 000 veículo que etraram o parque automóvel do referdo hpermercado, um Sábado. O reultado ecotram-e reumdo a tabela egute: Número de ocupate por veículo Frequêca aboluta Frequêca relatva Frequêca aboluta acumulada Frequêca relatva acumulada 0 0.% 0 0.%.% 50 5.0% 8.8% 98 9.8% 9 9.% 95 9.5% 5 5 5.% 8 8.% 00 0.0% 9 9.% 5 5.% 000 00% TOTAL 000 00% DIAGRAMA DE BARRAS 00 50 00 50 00 50 0 5 Nº ocupate/veículo A dtrbuçõe ão agrupada ão a forma ma elemetar de apreetação do dado e cote uma mple eumeração da obervaçõe, que podem ou ão etar ordeada. Quado o úmero de valore dtto obervado é elevado, tora-e muta veze eceáro codear muto ma o quadro etatítco, agrupado a obervaçõe em clae. Obtêm-e am dtrbuçõe de frequêca agrupada em clae ou dtrbuçõe agrupada. Ete tpo de dtrbuçõe é partcularmete útl quado dpomo de um grade úmero de dado relatvo a uma varável cotíua cujo valore obervado ão muto prómo u do outro. A frequêca de cada clae é o úmero de obervaçõe que ela cotém. No eemplo o dado dzem repeto a uma varável dcreta, quado provêm de uma varável cotíua etem alguma dfereça que remo obervar atravé do eemplo.

Eemplo.: Coderemo o cojuto de dado egute que repreeta o peo, epreo em grama, do coteúdo de uma ére de 00 garrafa que, o decuro de um tete aíram de uma lha de echmeto automátco: 0.5, 99.0, 00., 9., 98.5, 0., 98.5, 99.8, 00., 99., 00.8, 99.8, 0.5, 00., 0.8,9.99, 99., 98., 0.0, 99.0, 9.8,..., 00.80 A prmera caracterítca que podemo obervar ete cojuto de dado é que ão ete pratcamete repetção de valore. Ito leva a que ão temo vatagem em utlzar o dado agrupado uma tabela de frequêca, dado que ríamo ter uma tabela pratcamete com tata lha quato o úmero de dado. No etato, podemo cotrur uma tabela de frequêca e agruparmo o dado por clae: Clae Frequêca aboluta Frequêca relatva (%) Frequêca aboluta acumulada Frequêca relatva acumulada(%) [9.00, 98.00[ 8 8% 8 8% [98.00, 99.00[ % 9 9% [99.00, 00.00[ 8 8% 5 5% [00.00, 0.00[ 5 5% % [0.00, 0.00[ % 8 8% [0.00, 0.00[ 0 0% 9 9% [0.00, 0.00[ 5 5% 98 98% [0.00, 05.00[ % 99 99% [05.00, 0.00[ % 00 00% TOTAL 00 00% f HISTOGRAMA 0. 0.5 0. 0.5 0. 0.05 0 [9.00, 98.00[ [98.00, 99.00[ [99.00, 00.00[ [00.00, 0.00[ [0.00, 0.00[ [0.00, 0.00[ [0.00, 0.00[ [0.00, 05.00[ [05.00, 0.00[ peo (gr ama) Dagrama de caule-e-folha (team ad leaf) Quado precamo de orgazar uma amotra, de forma a ter uma prmera dea do comportameto da varável em etudo, e preparar a mema para calcular alguma etatítca amotra de forma ma rápda, o dagrama de caule-e-folha é etremamete útl. Ete tpo de repreetação para além de orgazar a amotra cotrbu para revelar a forma da dtrbução ubjacete, ma de uma forma ugetva, que faz lembrar um htograma.

Eemplo.8: Supohamo que a ota de uma turma de Matemátca do º ao com aluo foram a egute: 8 9 0 8 5 0 9 80 58 8 0 0 5 0 8 5 5 5 0 8 9 5 58 Na repreetação em dagrama de caule e folha temo o egute pao:. Ecolher o caule: 5 5 8 5 5 8 Por veze, utlza-e o caule horzotal, em vez de er vertcal. Ete proceo tora ma aparete a emelhaça etre um htograma e uma repreetação em caule-e-folha.. Ecrever a folha: 5 5 8 5 5 8 9 5 5 8 9 5 5 8 9 0. Caule e folha completo: 5 5 8 0 9 5 8 8 0 9 8 0 0 0 0 8 9 5 0 8

. Caule e folha completo e ordeado: Profuddade Caule Folha 9 () 0 5 5 8 0 5 9 8 8 0 8 9 0 0 0 0 5 5 8 9 0 Que caracterítca é que e pretede realçar, quado e repreeta um cojuto de dado ob a forma de um htograma ou de um caule-e-folha? Dada uma amotra, o apecto do htograma reflecte a forma da dtrbução da População ubjacete ao dado obervado. Ete é um do apecto da redução do dado, em que e perde alguma formação cotda ee dado, ma em cotrapartda obtemo a etrutura da População, que ele pretedem repreetar. Uma da vatage dete tpo de repreetação é poder obervar-e o tpo de dtrbução ubjacete ao dado, do qua detacamo algu eemplo: Dtrbuçõe métrca A dtrbução da frequêca faz-e de forma apromadamete métrca, relatvamete a uma clae méda. Dtrbuçõe eveada A dtrbução da frequêca faz-e de forma acetuadamete amétrca, apreetado valore ubtacalmete ma pequeo um do lado, relatvamete ao outro. 9

Dtrbuçõe com cauda loga A dtrbução da frequêca faz-e de tal forma que ete um grade úmero de clae o etremo, cuja frequêca ão pequea, relatvamete à clae cetra: Dtrbuçõe com váro pco ou moda A dtrbução da frequêca apreeta ou ma "pco" a que chamamo moda, ugerdo que o dado ão cottuído por váro grupo dtto:.5 Etatítca amotra O cálculo de etatítca amotra é uma forma ma tétca de decrever um cojuto de dado. A etatítca amotra ão etão medda calculada com bae o dado, a partr da qua é poível decrever globalmete o cojuto de valore que o dado tomam..5.. Medda de localzação.5... Méda A ma utlzada da etatítca de localzação é a méda artmétca amotral ou, como habtualmete e dega a méda amotral. Para um cojuto de dado ( =,,..., ) a méda amotral é defda pela epreão: = = (dado ão agrupado) () Coderemo o dado do eemplo., ma agora em o cojuto de dado etar apreetado uma tabela de frequêca: Etem outra méda para além da artmétca, por eemplo, méda geométrca, méda harmóca, méda quadrátca, etc. 0

,,,,,,, 5, 5,,,,,,,, 5,,, 5,...,,,,, ( = 000) A méda amotral é dada por + +... + + = =. ocupate por veículo. 000 Para dado agrupado uma tabela de frequêca a méda amotral é dada por = k = (dado agrupado) () ode k repreeta o úmero de valore dferete etete o cojuto de dado. No eemplo. e coderado o dado agrupado a tabela de frequêca teríamo a méda amotral dada por 0 + + 8 + 9 + 5 5 + 00 + 5 = =. 000 ocupate por veículo. No cao da varável er cotíua, dado que perdemo o valore cocreto do cojuto (fcaram afecto a uma determada clae) ão podemo calcular a méda amotral drectamete do valore do dado. Dete modo a cada clae va er atrbuído um repreetate ( ) e a méda amotral calculada atravé dee repreetate: = k = (dado agrupado em clae) (5) ode k é o úmero de clae do agrupameto, é a frequêca aboluta da clae e é o poto médo da clae, o qual é coderado como elemeto repreetatvo da clae. No eemplo. a méda amotral é dada por 8 9.5 + 98.5 +... + 05.5 = = 00. g 00 A méda é empre uma medda repreetatva do dado? Supohamo que temo a egute amotra:

...8.5.5.8.. A méda deta amotra é =.9. Embora todo o dado, com a ecepção de um dele (), etejam o tervalo [.5:.5 ], o valor obtdo para a méda ão pertece a ete tervalo. O que acotece é que a méda é muto eível a valore muto grade ou muto pequeo. No cao do eemplo, fo o valor que flacoou a méda. Se pearmo que, em vez dete valor podemo ter., temo razõe para pear que pode ter havdo um erro. E e em vez de o valor correcto foe., qual o valor da méda? Refazedo o cálculo com o valor correcto, obtém-e para a méda amotral, =., gfcatvamete dferete do valor obtdo aterormete..5... Medaa Uma outra medda de localzação é a medaa amotral ( M e). Codere-e que o dado que tegram a amotra ão colocado por ordem crecete, formado * * * um vector (,,..., ) - amotra ordeada. A medaa amotral é defda o egute termo: * + M * * e = + + Ímpar par No eemplo., temo um cojuto de 000 dado ( = 000 par ). A medaa é etão dada por * 500 + M e = Temo de aber qua ão o dado que ocupam a poçõe 500 e 50 quado etverem ordeado por ordem crecete. Atravé da obervação da tabela de frequêca (obervado a frequêca aboluta acumulada) temo que * e * = 50. Logo a medaa é + M e = = ocupate/vatura. * 50 500 = () No cao cotíuo, utlzado a defção ó podemo calcular a clae medaa. Depo de detfcada ea clae podemo calcular um valor apromado para a medaa atravé da fórmula: N 0,5 F M e l, = + * a = l + * f a ()

ode N é a frequêca aboluta acumulada da clae ate da clae medaa, a dmeão da amotra e l, a e ão, repectvamete, o lmte feror, ampltude e frequêca aboluta da clae medaa. No eemplo., vto que = 00 par, podemo ver qual a clae que cotém * 50 e temo: ou 0.5 * 5 F =, a clae medaa é [.00,00.00[ 99. Logo, atravé de () M e 50 9 = 99.00 +.00 = 99.5 g 8 Dado um htograma é fácl obter a poção da medaa, po eta etá a poção em que paado uma lha vertcal por ee poto o htograma fca dvddo em dua parte com área gua. Méda v Medaa Para lutrar a dfereça etre eta dua medda vejamo o egute eemplo. Coderemo a ota obtda por um aluo o º ao do curo: 0 5 8 5 9 = * * meda: = = medaa: = 9 M e = 9+ = 5 = 9 A méda e medaa da ota dee aluo foram de valore. Supohamo que ee aluo fez melhora da ota ma baa, paado de 0 a valore. Embora a medaa e mateha, o valor da méda ofreu um aumeto, paou para. valore. Temo etão que a méda, ao cotráro da medaa, é uma medda muto pouco retete, to é, ela é muto fluecada por valore muto grade ou muto pequeo, chamado outler, memo que ete valore urjam em pequeo úmero a amotra. Ete valore ão o repoáve pela má utlzação da méda em muta tuaçõe em que tera ma gfcado utlzar a medaa. Como medda de localzação, a medaa é Serão defdo ma adate.

ma retete do que a méda, po ão é tão eível ao dado. Etão qual da dua devemo utlzar? a) Quado a dtrbução é métrca, a méda e a medaa cocdem. b) A medaa ão é tão eível, como a méda, à obervaçõe que ão muto maore ou muto meore do que a retate (outler). Por outro lado a méda reflecte o valor de toda a obervaçõe. Repreetado a dtrbuçõe do dado a forma de uma macha (váldo para o dgrama de barra ou htograma), de um modo geral temo: Am, ão e pode dzer em termo aboluto qual deta medda de localzação é preferível, depededo do coteto em que etão a er utlzada..5... Moda A últma medda de localzação que erá etudada é a moda ( M ). Trata-e da medda que dca o valor ou a gama de valore o qua a cocetração do dado amotra é máma. Quado o dado forem realzaçõe de uma varável dcreta, a moda é o valor do dado que ocorre com maor frequêca; e o tervalo de clae com maor frequêca e a varável é cotíua. Am, da repreetação gráfca do dado, obtém-e medatamete o valor que repreeta a moda ou a clae modal. o Eta medda é epecalmete útl para reduzr a formação de um cojuto de dado qualtatvo, apreetado ob a forma de ome ou categora, para o qua ão e pode calcular a méda e por veze a medaa (e ão forem uceptíve de ordeação).

No eemplo., a moda é o valor com maor frequêca aboluta, ou eja, M = ocupate/vatura. o Quado o dado provêm de uma varável cotíua etem alguma dfereça o cálculo da moda. Tal como a medaa começamo por calcular a clae modal. Depo de detfcada a clae modal podemo calcular um valor apromado para a moda atravé da fórmula: M = l + a o + ode a é a ampltude da clae modal, l é o lmte feror da clae modal, é a dmeão da amotra, é a dfereça de frequêca aboluta etre a clae modal e a clae ateror à modal e é a dfereça de frequêca aboluta etre a clae modal e a clae poteror à clae modal. No eemplo., a clae com maor frequêca aboluta é [.00,00.00[ clae modal. Atravé de (8) temo: M o = 99.00 +.00 = 99.5 g + (8) 99 logo é a.5... Etremo e Quart O etremo ão o valore mímo, amotra. * = m( ), e mámo, * = ma( ), da Como vmo aterormete, a medaa é a medda de localzação que dvde a amotra. Geeralzado eta oção, o quatl de ordem p ( 0 < p < ), Qp, é tal que 00p% do elemeto da amotra ão meore ou gua a Qp e o retate 00 (-p)% do elemeto da amotra ão maore ou gua a Qp. A degação de quatl ecotra-e aocada à dea de que o quat dvdem a dtrbução de frequêca em quatdade gua, to é, com gual úmero de obervaçõe. De uma maera geral, o cálculo de um quatl, o cao dcreto, Q p = * [ p] + * * ( + ) p p+ e p ão é tero e p tero e o cao cotíuo, determa-e de forma dêtca à medaa. O quat podem er: Quart dvdem a dtrbução de frequêca em parte gua; Dec dvdem a dtrbução de frequêca em 0 parte gua; (9) 5

Percet dvdem a dtrbução de frequêca em 00 parte gua. A mportâca do quart deve-e ao facto de alguma repreetaçõe gráfca utlzarem eta medda: Q - º quartl: dvde a obervaçõe tal que 5% ão meore ou gua e 5% ão maore ou gua. Q - º quartl ou medaa: dvde a obervaçõe ao meo, tal que 50% ão ão meore ou gua e 50% ão maore ou gua. Q - º quartl: dvde a obervaçõe tal que 5% ão meore ou gua e 5% ão maore ou gua. No eemplo.8, = * = e * = 8 58 + = = 9 Q 0 = = 59 + = = 8 Q 8 = Me = =.5 08 5 + 5 = = Q = = 5.5.. Medda de dperão.5... Itervalo de varação Uma medda de dperão que e utlza por veze, é o tervalo de varação ou ampltude amotral, R, defda como edo a dfereça etre a maor e a meor da obervaçõe: R = ma( ) m( ) = (0) * * ode repreetamo por * e *, repectvamete o meor e o maor valor da amotra (,,..., ), de acordo com a otação troduzda aterormete, para a amotra ordeada. No eemplo.8, R = ma( ) m( ) = 8 = 5

.5... Varâca A varâca amotral é uma medda adequada para decrever a dperão de uma amotra (ou de uma população, e e dpuer de todo o dado que a compõem). A dperão de uma amotra pode er medda pela varâca amotral ( ) dada pela egute epreõe: ( X ) = = (dado ão agrupado) () = k k k ( X ) = = =! = (dado agrupado) () No etato, e pretedemo ferr acerca da varabldade de uma população de grade dmeõe a partr de uma amotra, etão, por razõe que ete mometo ão remo etudar, é preferível recorrer à varâca amotral corrgda. Neta etatítca, repreetada por ', a oma do erro quadrátco é dvdda por e ão por. ( ) ' = = X (dado ão agrupado) ( ) ' ' k ( X ) = = = No eemplo.8, k k = =! = ( ) (dado agrupado) () (5).5... Devo padrão = = = ( ) = =. ( ) = = = '.8 = = ( ) Uma vez que a varâca evolve a oma de quadrado, a udade em que e eprme ão é a mema que a do dado. Am, para obter uma medda da

varabldade ou dperão com a mema udade que o dado, tomamo a raz quadrada da varâca e obtemo o devo padrão: = () O devo padrão é uma medda que ó pode aumr valore ão egatvo e quato maor for, maor erá a dperão do dado. Alguma propredade do devo padrão, que reultam medatamete da defção, ão: o devo padrão é empre ão egatvo e erá tato maor, quata ma varabldade houver etre o dado; e =0, etão ão ete varabldade, to é, o dado ão todo gua. No eemplo.8, =.99 e =. ' '..5... Ampltude ter quartl A medda ateror tem a grade devatagem de er muto eível à etêca, a amotra, de uma obervação muto grade ou muto pequea. Am, defee uma outra medda, a ampltude ter-quartl, que é, em certa medda, uma olução de compromo, po ão é afectada, de um modo geral, pela etêca de um úmero pequeo de obervaçõe demaado grade ou demaado pequea. Eta medda é defda como edo a dfereça etre o º e º quart, Q = Q Q ( ) Do modo como e defe a ampltude ter-quartl, cocluímo que 50% do elemeto do meo da amotra etão cotdo um tervalo com aquela ampltude. Eta medda é ão egatva e erá tato maor quato maor for a varabldade o dado. Nota: Ao cotráro do que acotece com o devo padrão, uma ampltude terquartl ula, ão gfca ecearamete, que o dado ão apreetem varabldade. No eemplo.8, Q = Q Q = 5 59 = Ampltude ter-quartl v devo padrão Do memo modo que a quetão fo pota relatvamete à dua medda de localzação ma utlzada (méda e medaa), também aqu e pode por o problema de comparar a dua últma medda de dperão. A ampltude terquartl é ma robuta, relatvamete à preeça de outler, do que o devo padrão, que é ma eível ao dado. 8

.5..5. Boplot (caa de bgode) O boplot ou caa de bgode é um tpo de repreetação gráfca ode e realçam alguma caracterítca da amotra, omeadamete a etêca de outler (valore que e dtguem do retate, dado a dea de ão pertecerem ao memo cojuto de dado). O cojuto do valore da amotra compreeddo etre o º e o º quartl é repreetado por um rectâgulo (caa) com a medaa dcada por uma barra. Codera-e egudamete dua lha que uem o lado do rectâgulo com a barrera terore (evetualmete o etremo). A barrera feror teror é o meor valor da amotra (evetualmete o mímo), que é maor do que Q,5 Q. A barrera uperor teror é o maor valor da amotra (evetualmete o mámo), que é maor do que Q +,5 Q. Quado etem valore fora dete tervalo, [ Q,5 ;,5 ] Q Q + Q, dz-e que etem outler ou valore dcordate. Para averguar o grau do memo devem er calculada a barrera eterore: [ Q ] Q; Q + Q. Cao ea obervaçõe e ecotrem ete últmo tervalo degam-e por outler moderado, cao cotráro dzem-e outler evero. Nota: Quado ão etem outler e a etremdade da lha e repreetam o etremo da amotra, mímo ( * ) e mámo ( * ), eta repreetação cocde com o dagrama de etremo e quart. Ete tpo de repreetação realça 9

caracterítca mportate obre o dado, como ejam o cetro da amotra (medaa), varabldade, metra. Repare-e que da forma como o dagrama e cotró (dtâca etre a lha dcadora da medaa e o lado do rectâgulo; comprmeto da lha que aem do lado do rectâgulo; comprmeto da caa), e pode retrar medatamete a egute formação: Aqu podemo ver algu eemplo, correpodete a tpo dferete de dtrbução de dado. Voltado ao eemplo.8, a repreetação boplot temo o egute pao:. Cálculo do quart: = 58 + = = 9 Q 0 = = 59 + = = 8 Q 8 = Me = =, 5 08 5 + 5 = = Q = = 5. Cálculo da barrera terore: Q = Q Q = 5 59 = b = Q,5 Q = 58,5 = b = Q +,5 Q = 5 +,5 = 99. Será que etem outler? 0

A barrera terore ão [ ;99 ], logo, como ete um valor fora dete tervalo etamo a preeça de um outler. A barrera eterore fcam: B = Q Q = 58 = B = Q + Q = 5 + = Como eta obervação e ecotra detro da barrera eterore, to é :, é um outler moderado. [ ]. Repreetação gráfca do boplot:.5..5. Coefcete de varação O coefcete de varação eprea o devo padrão como percetagem da méda, é portato uma medda relatva da dperão da varável, CV = 00 (8) Nota: É preco ter em cota que e a méda é perto de zero, o coefcete de varação terá um valor elevado memo e o devo relatvamete à méda ão pequeo. Por o, dea de er útl quado a méda é próma de zero. No eemplo.8,.98 CV = 00 8.% 5.8

.. Dado bvarado Muta veze o etudo decrtvo ão e reume ao etudo de apea uma varável, por veze é eceáro a obervação de dua (ou ma) varáve para e ter uma vão global do problema em etudo. Nee cao deamo de ter uma amotra (,..., ) e paamo a ter dado bvarado (, y ), =,..., (obervaçõe de uma varável aleatóra bdmeoal, que erá defda o capítulo ). Por eemplo, a preão atmoférca etá relacoada com a alttude e/ou com a temperatura; a altura de uma craça etá relacoada com a alutura do pa e/ou mãe. Uma da coa que e pretede etudar é a relação etete etre a varáve dete par. Para ter uma dea de como a dua varáve e relacoam é comum repreetar grafcamete eta relação atravé de um gráfco de dperão. Eta repreetação cote a marcação um tema de eo carteao a obervaçõe, fcado com uma uvem de poto que correpodem ao pare ordeado (, y ). Eemplo 9: Coderemo o dado da temperatura do fuel gá (grau Fahrehet) e a taa de calor (Klowatt-hora) para uma turba de combutão para er uada a refrgeração. 00 5 50 5 00 5 50 5 00 5 50 5 00 5 50 500 y 99. 98.8 98.5 98.5 98.5 98. 98 9.8 9.8 9.8 9. 9.5 9. 9 9.8 9. Calor 99.5 99 98.5 98 9.5 9 Gráfco de dperão 9.5 0 00 00 00 Temperatura Ete dagrama motra a relação etra a varáve em etudo, dode e pode etrar que talvez eta uma correlação lear etre ela. Eta relação pode er traduzda atravé de uma recta.

...Regreão lear mple Quado a relação etete etre dua varáve é lear, pode er traduzda atravé de uma recta. Sedo am, temo o egute modelo determítco: Y = α + β X (9) em que α é a ordeada a orgem e β o declve da recta. No modelo de regreão lear mple pretede-e eplcar o efeto que uma varável, varável depedete ou eplcatva, obre uma varável y, varável depedete ou eplcada. Correlação Lear Potva (forte) Correlação Lear Negatva (forte) 0 0 0 0 Correlação Lear Fraca 0 0 Eta vualzação permte, atravé da mple obervação do dagrama de dperão, averguar a poível etêca ou ão de correlação lear etre dua varáve.

... Correlação. Coefcete de determação O coefcete de correlação lear, r y, mede o grau de aocação lear etre dado bvarado, e calcula-e da egute forma: r y y = (0) yy ode ( )( ) = y y = y y y = =, () ( ) () = = = = e ( ) = y y = y y yy = = () Dete modo podemo reecrever o coefcete de correlação lear como r y γ y = () y ode γ y é a covarâca de X e Y e r. A varação total da varável depedete (VT) é dada por ( ) er decompota da egute forma: = y y, que pode ( ) ^ ^ y y = y y y y + = = = VT VE VR (5)

em que VE é a varação eplcada pela regreão e VR é a varação redual. Fcamo etão com VE VR VT = VE + VR VT + VT = () em que a razão etre a varação eplcada pela regreão e a varação total, VE VT, é o coefcete de determação, R, que é a proporção da varabldade total que é eplcada pelo modelo de regreão, R y y = y ( y y) y y β = = = = = = = yy y y y y y y ( ) = = = () O coefcete de determação vara etre zero e um, 0 R. Quado ete coefcete toma o valor gfca que a recta de regreão eplca totalmete a varabldade da varável depedete. O valor ulo de R correpode à tuação em que a recta de regreão ão eplca ada da varabldade da varável depedete. O coefcete de correlação pode er calculado atravé do coefcete de determação, ry = ± R (8) em que o al depede do declve da recta de regreão, edo +(-) e ee declve é potvo (egatvo).... Método do mímo quadrado Quado e verfca, quer atravé do gráfco de dperão quer do coefcete de correlação lear, uma correlação forte etre dua varáve, podemo decrever a relação etre ea varáve atravé de uma recta de regreão (a recta que melhor e ajuta ao dado). Ea recta erve de modelo matemátco para eprear a relação lear etre dua varáve. Codera-e, em geral, X a varável depedete ou eplcatva e Y a varável depedete ou eplcada. Um do método ma utlzado para ajutar uma recta a um cojuto de dado é o Método do Mímo Quadrado (MMQ), que cote em determar a recta que mmza a oma do quadrado do devo (o 5

chamado erro ou reíduo) etre o verdadero valore, y, e o valore etmado a partr da recta de regreão que e pretede ajutar, ^ y. O modelo de regreão lear é a recta de regreão ^ y = α + β + ε (9) obtda de tal modo que a oma do quadrado do devo ou reíduo ^ ( ε = y y ) eja míma, ^ ε = y y = ( y α + β ) (0) m m m ( ) = = = Como tal, para etmar o parâmetro do modelo, é eceáro que a prmera dervada, em ordem a α e a β, ejam ula e a eguda ejam maore ou gua a zero, α = β ( y α β ) = 0 = ( y α β ) 0 = () A etmatva do mímo quadrado para o parâmetro α e a β ão e ^ ^ α = y β () y y = = ^ = β = y ()

Voltado ao eemplo.9, uma vez que e oberva o gráfco de dperão uma relação lear etre a varáve, vamo cofrmar eta relação atravé do coefcete de correlação, y 00 99, 0000 980,8 990 5 98,8 55 9, 50 50 98,5 500 90,5 5 5 98,5 05 90,5,5 5 00 98,5 0000 90,5 900 5 98, 505 9, 095 50 98 500 90 500 8 5 9,8 55 95,8 895 9 00 9,8 90000 95,8 90 0 5 9,8 055 95,8 85 50 9, 500 955, 0 5 9,5 05 950,5 5,5 00 9, 0000 9,9 890 5 9 805 909 5 5 50 9,8 0500 90, 50 500 9, 50000 950,89 850 Σ 5 55,9 5595 50,9 55 y = y = = = yy y y = = r y y O valor da correlação é r = 0.99 e o coefcete de determação R = 0.9 dcam uma forte correlação lear etre a temperatura de fuel gá e a taa de calor. Vamo agora etmar, atravé do MMQ, o parâmetro α e β e traçar a recta de regreão: y y 0.99 y y 55-5 55,9 = = = = 0, 005 ^ y = = = β 5595-(5) = = ^ 5, 9 5 α = y β = ( 0, 005) = 99,59 Sedo am, a recta de regreão calculada pelo método do mímo quadrado é dada por, ^ ^ ^ y = α + β = 99,59 0, 005

cujo gráfco de dperão com a repectva recta de regreão é o egute: Calor 99.5 99 98.5 98 9.5 9 Gráfco de dperão y = -0.005 + 99.59 R = 0.9 9.5 0 00 00 00 Temperatura Atravé da recta de regreão etmada é poível prever taa de calor com bae a temperatura do fuel gá. Por eemplo, para uma temperatura do fuel gá de 05 grau Fahrehet prevê-e uma taa de calor de ^ y = 0.005 05 + 99.59 = 9.05 Klowatt-hora. 8