O Coeficiente de Determinação R 2 como Instrumento Didático para Avaliar a Utilidade de um Modelo de Regressão Linear Múltipla

Documentos relacionados
Estatística - exestatmeddisper.doc 25/02/09

Cap. 5. Testes de Hipóteses

Em muitas situações duas ou mais variáveis estão relacionadas e surge então a necessidade de determinar a natureza deste relacionamento.

Econometria: 3 - Regressão Múltipla

Construção e Análise de Gráficos

Macroeconometria Aula 3 Revisão de estatística e teste de hipótese

REGRESSÃO LINEAR 05/10/2016 REPRESENTAÇAO MATRICIAL. Y i = X 1i + 2 X 2i k X ni + i Y = X + INTRODUÇÃO SIMPLES MÚLTIPLA

Tópicos Extras 2ª parte. Análise de Correlação e Regressão

MEDIDAS DE TENDÊNCIA CENTRAL I

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou. experimental.

Estudo do intervalo de confiança da regressão inversa utilizando o software R

Professor Mauricio Lutz REGRESSÃO LINEAR SIMPLES. Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das formulas: ö ; ø.

Avaliação da qualidade do ajuste

Regressao Simples. Parte II: Anova, Estimação Intervalar e Predição

Regressão Simples. Parte III: Coeficiente de determinação, regressão na origem e método de máxima verossimilhança

Estudo das relações entre peso e altura de estudantes de estatística através da análise de regressão simples.

MEDIDAS DE DISPERSÃO:

5 Critérios para Análise dos Resultados

ESTATÍSTICA MÓDULO 2 OS RAMOS DA ESTATÍSTICA

Modelo de Regressão Simples

Capítulo 5: Ajuste de curvas pelo método dos mínimos quadrados

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Estatística: Aplicação ao Sensoriamento Remoto SER ANO Estimação Pontual

ESTATÍSTICA Exame Final 1ª Época 3 de Junho de 2002 às 14 horas Duração : 3 horas

CAPÍTULO 3 MEDIDAS DE TENDÊNCIA CENTRAL E VARIABILIDADE PPGEP Medidas de Tendência Central Média Aritmética para Dados Agrupados

Tabela 1 Números de acidentes /mês no Cruzamento X em CG/07. N de acidentes / mês fi f

Probabilidades e Estatística LEAN, LEGI, LEGM, LMAC, MEAer, MEAmbi, MEC

6.1 - PROCEDIMENTO DE AVALIAÇÃO DE INCERTEZA EM MEDIÇÕES DIRETAS

Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. PUCRS FAMAT: Departamento de Estatística

Faculdade de Tecnologia de Catanduva CURSO SUPERIOR DE TECNOLOGIA EM AUTOMAÇÃO INDUSTRIAL

Distribuições de Probabilidades

7 Análise de covariância (ANCOVA)

Interpolação. Exemplo de Interpolação Linear. Exemplo de Interpolação Polinomial de grau superior a 1.

Confiabilidade Estrutural

ESTATÍSTICA APLICADA À ZOOTECNIA

Parte 3 - Regressão linear simples

x n = n ESTATÍSTICA STICA DESCRITIVA Conjunto de dados: Organização; Amostra ou Resumo; Apresentação. População

Probabilidades e Estatística

Inferência Estatística e Aplicações I. Edson Zangiacomi Martinez Departamento de Medicina Social FMRP/USP

Distribuições Amostrais. Estatística. 8 - Distribuições Amostrais UNESP FEG DPD

ANÁLISE DE REGRESSÃO E CORRELAÇÃO

Difusão entre Dois Compartimentos

Relatório 2ª Atividade Formativa UC ECS

? Isso é, d i= ( x i. . Percebeu que

MEDIDAS DE POSIÇÃO: X = soma dos valores observados. Onde: i 72 X = 12

CONHECIMENTOS ESPECÍFICOS

Média. Mediana. Ponto Médio. Moda. Itabira MEDIDAS DE CENTRO. Prof. Msc. Emerson José de Paiva 1 BAC011 - ESTATÍSTICA. BAC Estatística

ANÁLISE DE ERROS. Todas as medidas das grandezas físicas deverão estar sempre acompanhadas da sua dimensão (unidades)! ERROS

Regressão e Correlação

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma:

Métodos iterativos. Capítulo O Método de Jacobi

REGESD Prolic Matemática e Realidade- Profª Suzi Samá Pinto e Profº Alessandro da Silva Saadi

9 Medidas Descritivas

MAE0229 Introdução à Probabilidade e Estatística II

Probabilidades e Estatística LEGM, LEIC-A, LEIC-T, MA, MEMec

HIDROLOGIA E RECURSOS HÍDRICOS. Análise estatística aplicada à hidrologia

Estatística Descritiva. Medidas estatísticas: Localização, Dispersão

MÓDULO 8 REVISÃO REVISÃO MÓDULO 1

Estatística. 2 - Estatística Descritiva

50 Logo, Número de erros de impressão

Probabilidades e Estatística LEE, LEIC-A, LEIC-T, LEMat, LERC, MEBiol, MEBiom, MEEC, MEFT, MEMec, MEQ

Econometria: 4 - Regressão Múltipla em Notação Matricial

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

Lista de Exercícios #9 Assunto: Análise de Regressão Método de Mínimos Quadrados

3. TESTES DE QUALIDADE DE AJUSTAMENTO

Organização; Resumo; Apresentação.

Aula 9. Aula de hoje. Aula passada. Self-normalized Importance Sampling Gerando amostras complicadas Variância amostral Simulação

Controle Estatístico de Qualidade. Capítulo 6 (montgomery)

A análise de variância de uma classificação (One-Way ANOVA) verifica se as médias de k amostras independentes (tratamentos) diferem entre si.

ANÁLISE DE REGRESSÃO E CORRELAÇÃO

DISTRIBUIÇÃO HIPERGEOMÉTRICA

Modelos de regressão linear: abordagem clássica

Estatística Básica - Continuação

Modelos de Regressão Linear Simples e Múltipla. Fabio Antonio Avilla (Matemática) Profª Dra. Carine Savalli Redígolo (Orientadora)

Regressão. Pedro Paulo Balestrassi

MÉTODO DOS MÍNIMOS QUADRADOS

ESTATÍSTICA Aula 7. Prof. Dr. Marco Antonio Leonel Caetano

Estatística: uma definição

a) 1,8 e 4,6. b) 2,0 e 2,2. c) 1,8 e 5,2. d) 2,0 e 4,6. e) 2,0 e 1,9.

3. ANPEC Questão 15 Ainda em relação à questão anterior pode-se concluir que, exceto por erro de arredondamento:

Centro de Ciências Agrárias e Ambientais da UFBA Departamento de Engenharia Agrícola

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

DESEMPENHO DE ESTIMADORES DA MÉDIA POPULACIONAL DE DISTRIBUIÇÕES ASSIMÉTRICAS BASEADOS EM AMOSTRAGEM POR CONJUNTOS ORDENADOS

Análise de Regressão

( ) ( IV ) n ( ) Escolha a alternativa correta: A. III, II, I, IV. B. II, III, I, IV. C. IV, III, I, II. D. IV, II, I, III. E. Nenhuma das anteriores.

AVALIAÇÃO DE GANHOS E PERDAS EM FUNDOS DE INVESTIMENTOS UTILIZANDO REGRESSÃO LINEAR. José Antonio Stark Ferreira

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

NOTAS DE AULA DA DISCIPLINA CE076. ], T 2 = conhecido como T 2 de Hotelling

Prof. Janete Pereira Amador 1

Introdução à Correlação e Regressão Linear

MEDIDAS DE DISPERSÃO 9. MEDIDAS DE DISPERSÃO

Forma padrão do modelo de Programação Linear

Análise Exploratória de Dados

Caracterização de Partículas. Prof. Gerônimo

3 Experimento com Mistura com Respostas Não-Normais

Regressão Linear Simples uma revisão

O delineamento amostral determina os processos de seleção e de inferência do valor da amostra para o valor populacional.

n. A densidade de corrente associada a esta espécie iônica é J n. O modelo está ilustrado na figura abaixo.

16/03/2014. IV. Juros: taxa efetiva, equivalente e proporcional. IV.1 Taxa efetiva. IV.2 Taxas proporcionais. Definição:

Transcrição:

O Coefcete de Determação R como Istrumeto Ddátco para Avalar a Utldade de um Modelo de Regressão Lear Múltpla Roberto C. Quo Eda A. Res Departameto de Estatístca ICEx UFMG - Brasl Lupérco F. Bessegato Departameto de Estatístca ICE UFJF - Brasl RESUMO Este artgo apreseta uma proposta de uso do coefcete de determação como estatístca para um atratvo teste de hpóteses, gorado pela maora dos lvros ddátcos, baseado a dstrbução por amostragem Beta. Adcoalmete, mostramos que o valor amostral do r-quadrado múltplo pode ser obtdo com uso de sucessvas regressões leares smples, vablzado o seu cálculo em sala de aula por meo de máquas de calcular báscas. Palavras-chave: Regressão lear, coefcete de determação, r-quadrado, dstrbução Beta.. Itrodução Quado troduzmos o coceto de regressão lear para os aluos dos prmeros aos de graduação, é comum que já teham ouvdo de professores de outras dscplas que um bom modelo devera ter o famoso r elevado. Os aluos etedem que o valor de r costtu-se em um grau percetual da qualdade de ajuste de um modelo. A tetatva de mostrar-lhes uma aálse mas precsa e que a terpretação do valor mpresso pode ser equvocada geralmete ão é compreedda, podedo etrar em coflto com explcações dos professores das dscplas específcas do seu curso. Corroborado a ossa experêca, Goldberg (99), cta que ão é raro ler em relatóros de pesqusa empírca declarações como "eu teho um r elevado, por sso a mha teora é boa" ou "o meu r é maor do que o seu, por sso a mha teora é melhor que a sua". Além dsso, é mportate saletar que a avalação tradcoal da utldade do modelo pelo teste F ão apreseta uma ordem de gradeza tutva como a proporção, utlzada para quatfcar r, que está amplamete corporada a socedade e é de fácl etedmeto.

Quado a regressão é múltpla, a dfculdade de explcá-la aos aluos é ada maor, pos surge o agravate de ão exstr uma fgura trodutóra smples, aáloga ao gráfco de dspersão, para dcar se um determado modelo de regressão múltpla será cosderado útl. O valor de r certamete trasmte uma mesagem prelmar, mas esse valor pode ser lusóro, devdo ao pequeo tamaho amostral e, por sso, precsa ser melhor trabalhado para aprovetar a motvação cal dos aluos. Etretato, o exagero das crítcas em relação ao uso do r é mas desmotvate aos aluos do que propramete útl o processo de apredzado. Goldberg (99), por exemplo, argumeta que o mas mportate do r é que ele ão tem mportâca o modelo de regressão clássco. Este trata de parâmetros da população, ão da qualdade do ajustameto da amostra.... Já Camero (993) ressalta que o r ão é um teste estatístco e parece ão haver qualquer justfcatva tutva para seu emprego como estatístca descrtva, sugerdo que o valor de r ão devera sequer ser reportado. Etedemos, etretato, que o coefcete de determação deva ser aprovetado o processo de apredzado dos aluos. Ele pode ser usado como uma estatístca de teste para avalação da exstêca de uma relação útl etre a varável resposta e pelo meos uma das varáves regressoras em um modelo de regressão lear. Em ossa opão, apesar dos resultados serem equvaletes ao teste F, o etedmeto e apelo ddátco é superor. Para tato, cosderaremos, este artgo, o fato de que o R possu uma dstrbução amostral Beta (Wheatherbur, 96). Esta dstrbução está dspoível em plalhas eletrôcas e a maora dos softwares estatístcos e pode, assm, ser faclmete utlzada para gerar tabelas smlares às da dstrbução F, com o objetvo de calcular valores crítcos para comparação com o valor observado de r. Além dsso, o cálculo do r pode ser obtdo, mesmo em casos de regressão múltpla, com o uso sucessvo de regressões leares smples, podedo, assm, ser faclmete trabalhado em sala de aula, uma vez que a maora das calculadoras báscas realzam os cálculos de regressão lear smples.

. Cohecmeto Teórco e Notação Em geral, as aulas de regressão lear, começamos o curso motvado os aluos a ctarem stuações prátcas da vda cotdaa que poderam ser cosderados exemplos de feômeos que podem ser explcados por um cojuto de varáves. Tal atvdade cota com a cotrbução e teresse de város aluos. Em seguda, é comum expressarmos o modelo matematcamete como: X X X, 0... k k em que dca a varável resposta, X s são as k varáves regressoras e j, j = 0,,...,k, são chamados de coefcetes de regressão. O termo dca o erro aleatóro e usualmete é suposto ter dstrbução Normal com méda zero e varâca costate. Neste artgo, presummos que tal suposção é acetável e, assm, ão dscutremos a avalação dos resíduos (Maores detalhes em Motgomery et al., 006). O processo de estmação dos parâmetros j, j=0,,...,k, é calmete explcado pelo método dos mímos quadrados e exemplos umércos podem ser trabalhados com a partcpação atva dos aluos, resultado as estmatvas ˆ j, j 0,,..., k dos coefcetes e a equação de regressão estmada, dada por ˆ ˆ X ˆ X ˆ X ˆ 0... k k Em termos geras, os aluos setem dfculdades com estes cálculos, pos a maora possuem máquas de calcular apeas com a fução regressão lear smples e correlação lear de Pearso dspoível. Veremos adate a Seção 6 como aprovetar este recurso dos aluos para o cálculo múltplo. Nesta fase, um gráfco de dspersão etre observados e ˆ estmados costtu-se em uma ferrameta efcaz para motvar os aluos a costrução de dcadores da qualdade do modelo. Motvados pela regressão lear smples, é muto comum que os aluos sugram o coefcete de correlação de Pearso (r) etre e ˆ como uma medda do grau de ajuste. A tetatva de motvá-los a trabalhar com a medda ao quadrado (r ), deomada coefcete de determação, ão apreseta uma boa compreesão. Uma curosdade que pode ser ctada é que se usarmos os estmadores de mímos quadrados de y sobre x e de x sobre y, respectvamete, y=a+bx e x=c+dy, etão 3 r bd.

4 Uma alteratva é costrur hstogramas suavzados e sobrepostos dos valores observados e ajustados ˆ com os dados utlzados a exemplfcação umérca. A Fgura lustra esta alteratva, a qual percebe-se que a varâca dos ˆ a amostra V ˆ ˆ) (, (já usado o fato de que a méda dos ˆ é gual a, a méda dos ) é meor (ou gual) à varâca dos a amostra ) ( V. É tutvo pesar que, quato meor a varâca dos valores estmados em relação à varâca dos valores observados, por é o ajuste do modelo, pos dca que as varáves regressoras cotém pouca formação sobre a varável resposta. Assm, é razoável utlzarmos a razão V V ˆ ) ( ˆ) ( como uma medda do grau de ajuste do modelo. Sua terpretação é aturalmete percebda como a proporção da varação total de explcada pela varação as varáves X s através do modelo de regressão. Deotamos a razão por r (mostrado que, de fato, ela é o coefcete r elevado ao quadrado) e a ttulamos como coefcete de determação ou r-quadrado. Uma dscussão mas avaçada que pode ser realzada sera chamar a ateção dos aluos para o fato de que o coefcete de determação pode ser escrto como, ) ( ) ( ˆ e r em que e ˆ é o resíduo da -ésma observação. Este desevolvmeto permte formar aos aluos que o termo

e /( ) é um estmador vcado para, e que o estmador ão vcado é dado por e /( k ). Se usarmos esta estmatva ão vcada o cálculo do r, obteremos uma ova medda, deomada r ajustado e represetada por r. Esta ova medda possu a propredade de pealzar o r tradcoal pelo úmero de varáves explcatvas. Ou seja, ao cotráro do r tradcoal, que sempre aumeta com a etrada de varáves explcatvas, o r ajustado poderá aumetar ou dmur com a etrada de ovas varáves depedetes o modelo. Um problema é que r pode ser egatvo e, assm, dfcultar ada mas a terpretação. Maores detalhes podem ser obtdos em Gujarat (009). Fgura : Hstogramas suavzados de e ˆ. Um poto teressate que pode ser ctado, é que o deomador da fórmula usual da varâca, para uma amostra de uma população ormal com méda e desvo descohecdos, pode apresetar dferetes alteratvas, por exemplo, -,, -3, +, -5/3, depededo da propredade que se deseja: ão vcado, erro médo quadrátco mímo, meda ubasedess, modal ubasedess, etc. O letor teressado pode cosultar maores detalhes em Saha e Msra (99). 5

3. Um Teste de Hpóteses para o Cosderado que os aluos já possuem a percepção de que valores baxos de r costtuem-se em dcatvo de que o modelo pode ão ser útl, a questão adcoal e fudametal é explcar que evetuas repetções depedetes do expermeto provavelmete mplcaram (a dstrbução por amostragem) em dferetes valores de r. Este cojuto de possíves valores de r é represetado pela varável aleatóra R. É fudametal que etedam a dfereça da varável aleatóra R e o partcular valor r obtdo de uma amostra. Além dsso, é também fudametal que etedam que exste um coefcete de determação populacoal ( ), mas que seu valor é descohecdo. Como trabalhamos com amostras, o que cosegumos é uma estmatva (r ). O objetvo é saber se um valor de a população podera faclmete ter orgado uma 0 amostra com o partcular r observado. Se a resposta for sm, etão mesmo que r fosse alto, o modelo ão devera ser cosderado útl, pos este caso, tem-se que (... 0). Portato, a questão prcpal é saber qual deve ser o valor k mímo de r (deotado por L) a ser observado para que possamos cosderar o modelo útl, ou seja, para coclurmos que muto provavelmete a amostra fo gerada de uma população com. 0 Os aluos precsam eteder que, para 0, dferetes amostras obtdas da população poderam orgar dferetes valores de r, represetados aqu pela varável aleatóra R. Como os valores possíves de R varam etre zero e um, algus aluos sugerem corretamete que a varável aleatóra R possu uma dstrbução amostral Beta, sem, o etato, dcarem os parâmetros adequadamete. Mas precsamete, R possu dstrbução amostral Beta com parâmetros gual a k/ e (-k-)/, em que k é o úmero de regressores e o tamaho amostral (Weatherbur, 96). Cosderado que a méda da dstrbução Beta é data por k/(-) e represeta o valor médo que se obtera para R quado (... 0), uma possível sugestão para um ovo k r ajustado sera r k / ( ). Outra possbldade, procurado mater a ova medda etre zero e um, sera utlzar r [ k / ( )]. Estas duas meddas são motvadas pela méda da dstrbução Beta e possuem propredades smlares ao r tradcoal. A seguda proposta é pratcamete gual à sugestão de Goldberger 6

(99, p. 78), que propôs r ( k / ), ão apresetado, etretato, a motvação da sugestão. A Fgura lustra uma dstrbução Beta com a dcação de um possível valor mímo L para r para cosderar útl o modelo em aálse. O valor L é defdo em fução do ível de sgfcâca desejado para o teste. Fgura : Exemplo da dstrbução Beta. Um exemplo umérco pode cosoldar toda a explcação para os aluos: basta mostrar a obteção de L e comparação com o valor observado r. Também se pode obter faclmete a probabldade de sgfcâca (valor p) pelo cálculo de P( R r ). Observe que estamos destacado a segute equvalêca etre os testes de hpóteses: H H 0 :... k 0 H0 : 0 : Caso Cotráro H : 0 Apesar de ão ser objetvo do artgo, também é possível realzar teste de hpóteses da forma H : 0 0 versus H : 0, para j,..., k, com a utlzação do j coefcete de correlação parcal ao quadrado. Por exemplo, se desejamos testar H0: 0versus j H : 0, sera ecessáro calcular o coefcete de correlação parcal ao quadrado etre e X, [ r ; X X,..., Xk ] descosderado o efeto das demas varáves e cosderar que a varável aleatóra R ; X X,..., Xk possu dstrbução por amostragem Beta com parâmetros gual a / e (-k-)/. Para o cálculo do coefcete de correlação parcal etre e X, por exemplo, basta calcular a correlação 7

de Pearso etre os resíduos de, em fução X,...X k, e os resíduos de X em fução X,...X k. Em geral tal abordagem é bem compreedda pelos aluos, prcpalmete chamado a ateção de que os resíduos cotém a parte ão explcada da varável depedete em fução das varáves explcatvas. De maera geral, a explcação ateror pode ser utlzada para todos os testes do tpo H : 0 0 versus H : 0. Além dsso, podemos utlzar os coefcetes de correlação parcal para realzar testes de hpóteses para quasquer submodelos com a hpótese ula formulada como j j H :... 0 0 j em que j<k. Neste caso, o coefcete de correlação parcal ao quadrado ; X,..., X j X j,..., Xk R possu dstrbução por amostragem Beta com parâmetros guas a j/ e (-k-)/. Quato ao j>, devemos eteder a correlação o setdo múltplo. Maores detalhes sobre esta seção podem ser obtdos em Weatherbur (96). 4. Exemplo Numérco O exemplo descrto esta seção fo retrado de Aderso et al. (00) e será resolvdo por meo da plalha eletrôca Mcrosoft Excel00. Poderíamos utlzar softwares como o Mtab, R, Matlab, SPSS, SAS, etc., mas costatamos que mutas vezes o Excel é a úca opção dspoível. A Fgura 3 mostra a plalha com os dados da potêca (em HP), do peso (em lbras) e da velocdade (em mlhas por hora), após percorrda ¼ de mlha, para 6 carros GT e esporte (998 Road & Track Sports & GT Cars). O objetvo é avalar se a velocdade (V) do carro está relacoada ao seu peso e à sua potêca. Para sso, podemos calmete cosderar o modelo V Peso Pot, 0 para o qual desejamos realzar o teste das hpóteses H0 : 0 versus H : caso cotráro. Vamos assumr que as suposções clásscas do modelo de regressão estão satsfetas. Prmeramete, obtemos os estmadores de mímos quadrados ˆ 0, ˆ e ˆ. Na célula E4 sermos a fução =PROJ.LIN(D:D7;B:C7;;). Selecoamos um úmero de células gual ao úmero de parâmetros a serem estmados, E4:G4. Em 8

seguda, apertamos F, segudo por CTRL+SHIFT+ENTER, e obtemos as estmatvas de mímos quadrados. A velocdade estmada (VE) é obtda como VE ˆ ˆ Peso ˆ Pot. No Excel sermos a célula H a fórmula 0 =$G$+$F$*B+$E$*C e arrastamos até a célula H7. O valor de r é obtdo dvddo-se a varâca da velocdade estmada pela varâca da velocdade observada. No Excel, sermos a célula I a fórmula =VAR(H:H7)/VAR(D:D7) obtedo 0.880367. Adotado que R possu dstrbução Beta com parâmetros [k/] e 6.5 [(-k-)/] e cosderado um ível de sgfcâca de 5%, podemos obter L com ajuda da fução BETA.ACUM.INV(0,95;;6.5). Cosderado que r =0,8804 e L=0,3693, rejetamos H 0 e cosderamos que o modelo é útl para explcar velocdade por, ao meos, uma das varáves explcatvas ao ível de sgfcâca de 5%. Fgura 3: Plalha com dados de potêca, peso e velocdade para 6 carros GT e esporte. A Fgura 4 lustra a regão de rejeção em fução do L. A probabldade de sgfcâca (valor p) pode ser obtda como PR ( 0.8804) e o Excel por meo da fórmula =-DISTBETA(I;;6,5). A Fgura 5 apreseta a plalha com os resultados umércos obtdos para avalação da utldade do modelo de regressão lear múltpla, explcados esta seção. 9

Fgura 4: Regão de rejeção do teste do exemplo. Fgura 5: Cálculos realzados para avalação da utldade do modelo. Destacamos que todos os resultados obtdos esta seção seram guas se fosse utlzado a estatístca F para aálse. 0

5. Tabela para Avalação do r Esta seção apreseta a Tabela, com valores crítcos para comparação com com r, com objetvo de avalar a utldade de um modelo geral X X X cosderado o úmero de regressores k varado 0... k k etre e 0 e o tamaho amostral varado etre 3 e 5. Tal escolha de e k cotempla a maora dos exemplos e exercícos cotdos em lvros ddátcos. O ível de sgfcâca adotado será o 5% o setdo de que é o mas usual. Assm, pretedemos permtr aos aluos uma rápda tomada de decsão sob a utldade do modelo ao ível de 5% de sgfcâca. Fxados o úmero de regressores (k) e o tamaho amostral (), temos o meor r para cosderamos o modelo útl (pelo meos um dos parâmetros (,,..., k ) é dferete de zero ao ível de sgfcâca 5%). Por exemplo, a aplcação da Seção 3, temos =6 e k=, resultado que o mímo valor de cosderar o modelo útl ao ível de sgfcâca 5%, é 0,3693. r, para Para outros íves de sgfcâca, úmero de regressores e tamaho amostral, tabelas adcoas podem ser faclmete costruídas utlzado a fução BETA.ACUM.INV(-alfa;k/;(-k-)/) do Excel ou fução equvalete de softwares estatístcos. Observe que os valores crítcos da dstrbução Beta (L) podem também ser obtdos por meo da relação L F F * * / ( ), em que * F Fk k / ( ) e F é o valor crítco da dstrbução F de Fsher. Assm, caso seja ecessáro, o professor poderá utlzar as tradcoas tabelas F para obter os valores crítcos da dstrbução Beta. Etretato, recomedamos o uso da tabela Beta uma vez que esta opção mostrou-se mas compreesível e teressate aos aluos.

Tabela : Valor mímo de r para cosderar o modelo útl, ao ível de sgfcâca 5%. 6. Obtedo o r com uma Calculadora com o Módulo Regressão Lear Smples Mutas vezes ão dspomos de um laboratóro com computadores para serem usados os cálculos desevolvdos a Seção 4. Apesar de podemos forecer tabelas da dstrbução Beta como a lustrada a seção ateror ada temos o problema do cálculo do valor amostral de r que ão é pratcável de ser realzado maualmete durate o tempo de uma aula usual. Em geral a maora dos aluos dos prmeros aos de graduação possuem calculadoras que realzam apeas regressão lear smples e correlação lear de Pearso. Esta seção objetva mostrar como utlzar este recurso para o cálculo de r. A capacdade do método de regressão lear smples ser usado em problemas que demadam regressão lear múltpla com varáves Dummy s fo tratado por Lev et. al. (989) para o caso de aálse de varâca. Etretato, o artgo ão tratou da regressão lear múltpla o caso geral. Se as varáves explcatvas são ão correlacoadas etão r r r... r e o cálculo demadara smplesmete calcular o coefcete de yx yx yx k correlação lear etre e cada uma das varáves explcatvas X, X,..., X k.

Etretato, a prátca as varáves depedetes quase sempre possuem algum grau de correlação, o que complca o cálculo. Assm, o objetvo sera gerar varáves ão correlacoadas * * * X, X,..., X k a partr de X, X,..., X k e cosequetemete utlzarmos r r * r *... r * Sem yx yx yx k perda de geeraldade usaremos o caso k=4 para uma melhor explcação. Numa prmera etapa calculamos os resíduos da regressão lear smples etre X e X 4 e deotamos por R ; calculamos os resíduos etre X e X 4 e deotamos por R ; calculamos os resíduos etre X 3 e X 4 e deotamos por R 3. Agora calculamos os resíduos etre R e R 3 e deotamos por R 4 e calculamos os resíduos etre R e R 3 e deotamos por R 5. A varável * X será gual aos resíduos etre R 4 e R 5. A varável * X será gual ao resíduo etre R e R 3 ; a varável * X 3 será gual a R 3 e * X 4 = X 4. Para o exemplo descrto a Seção 4, temos que r r r 0.00740 0.87966 0.880367. * yx * yx Nossa sugestão é que o professor solcte um exercíco em sala de aula com duas ou três varáves explcatvas, com aproxmadamete gual a cco. Para o caso de três varáves explcatvas, o tempo para resolução, cludo o teste de hpóteses dscutdo este artgo, varou etre quze e vte mutos. 7. Coclusões O objetvo deste trabalho fo expor a mportâca de apresetar o teste de hpóteses baseado o coefcete de determação R e em sua dstrbução amostral Beta, como alteratva para testar a sgfcâca de um modelo de regressão lear múltpla. Este procedmeto se mostrou, pela ossa experêca em sala de aula, mas compreesível e tutvo aos aluos em relação ao equvalete e tradcoal teste F. No osso eteder, a prcpal explcação é que o valor de r pode ser terpretado como um ídce percetual de uso comum aos aluos dferetemete do valor F. O uso da dstrbução Beta também ão apreseta problemas, estado dspoível clusve em plalhas como o Excel. A Tabela 3 apresetou grade acetabldade e compreesão dos aluos, permtdo-lhes uma rápda tomada de 3

decsão em relação à utldade do modelo. Além dsso, o valor de r pode ser obtdo utlzado o módulo de regressão lear smples roteramete presetes em calculadoras báscas e acessíves. Falmete, efatzamos que é ecessáro que os aluos etedam que o teste realzado só será acetável se as hpóteses clásscas relatvas ao compoete erro sejam julgadas satsfatóras. 8. Referêcas Aderso, D. R.; Sweeey, D. J. & Wllams, T. A. Essetals of statstcs for busess ad ecoomcs. Thomso Learg, 00. Ascombe, F.J. Graphs Statstcal Aalyss. The Amerca Statstca,.7, p.7-, 973. Camero, S. Why s the R square Adjusted Reposted?. Joural of Quattatve Ecoomcs, v.9,., p.83-86, 993. Foster, F. D; Smth, T. & Whaley, Robert E. Assessg Goodess-of-Ft of Asset Prcg Models: The Dstrbuto of the maxmal R. The Joural of Face, V. LII,., p.59-607, 997. Goldberg, A. S. A Course e Ecoometrcs. Cambrdge, Mass: Havard Uversty, Press, 99. Gujarat, D. N. Basc Ecoometrcs, 4 th ed. McGraw-Hll Compaes, Ic, 003. Lev, J. R.; Serl, R. C. & Webe-Berma, L. Aalyss of varace though smple correlato. The Amerca Statstca,.43, p.3-34, 989. Motgomery, D. C.; Peck, E. A & Vg, G. G. Itroducto to lear regresso aalyss, 3d ed, Wley-Iterscece, 006. Saha, H. & Msra, S. Deftos of sample varace: some teachg problems to be overcome. The Statstca,.4, p.55-64, 99. Weatherbur, C. E. A Frst Course Mathematcal Statstcs. Cambrdge at The Uversty Press, 96. Mcrosoft ad Excel are regstered trademarks of Mcrosoft Corporato the Uted States ad other coutres. 4