APLICAÇÃO DE MÉTODOS ESTATÍSTICOS NO DESPORTO: ANÁLISE DO CAMPEONATO DE FUTEBOL, EM PORTUGAL

Tamanho: px
Começar a partir da página:

Download "APLICAÇÃO DE MÉTODOS ESTATÍSTICOS NO DESPORTO: ANÁLISE DO CAMPEONATO DE FUTEBOL, EM PORTUGAL"

Transcrição

1 APLICAÇÃO DE MÉTODOS ESTATÍSTICOS NO DESPORTO: ANÁLISE DO CAMPEONATO DE FUTEBOL, EM PORTUGAL STATISTICAL METHODS APPLIED TO SPORTS: ANALISYS OF THE PORTUGUESE SOCCER CHAMPIONSHIP Autor: Paulo Almeda Perera - Prof. Auxlar da Unversdade Católca Portuguesa, Pólo de Vseu Insttuto Unverstáro de Desenvolvmento e Promoção Socal RESUMO: Métodos estatístcos, como os modelos de regressão e a análse factoral de componentes prncpas são aplcados ao estudo dos resultados do campeonato naconal de futebol. São desenvolvdos dos modelos, utlzando, como varável dependente, os resultados dos jogos e como varáves ndependentes, dados estatístcos dsponíves para o comportamento das equpas ntervenentes. Após a elmnação de outlers e a valdação dos pressupostos dos modelos de regressão, calculam-se as estmatvas dos resultados dos jogos e respectvos ntervalos de confança, a 95%, que orgnam classfcações prevstas pelos modelos, que são comparadas com os valores observados. PALAVRAS-CHAVE:! Modelos de regressão, análse factoral, desporto, campeonato naconal de futebol, estmatva das classfcações. ABSTRACT:! Statstcal methods, such as regresson models and factoral analyss of prncpal components are appled to the study of portuguese soccer champonshp results. Two models are developed, usng, as dependent varable, the results of soccer games and as ndependent varables, avalable statstcal data for the behavor of the ntervenng teams. After outlers elmnaton and valdaton of the regresson models assumptons, the estmaton of results for the soccer games and 95% confdence ntervals are calculated, whch orgnate classfcaton predctons by the models that are compared wth the observed values. KEY-WORDS:! Regresson models, factoral analyss, sports, portuguese soccer champonshp, classfcaton estmaton.

2 . INTRODUÇÃO O desporto gra em torno de estatístcas, tendo sempre por base um sstema numérco de resultados, por exemplo, os golos num jogo de futebol. Os acontecmentos desportvos podem, assm, consttur um tópco de nvestgação estatístca, o que vem a acontecer há, pelo menos, três décadas (Machol et al., 976; Ladany e Machol, 977). Devdo à sua relevânca, a Amercan Statstcal Assocaton crou, em 992, uma secção denomnada Statstcs n Sports. Exstem publcações, nesta área, dspersas por város jornas de estatístca, tendo surgdo, recentemente, uma mportante complação de aplcações, na área da estatístca, a acontecmentos desportvos (Bennett, 998), em que são apresentados trabalhos sobre váras modaldades desportvas: Futebol Amercano, Basebol, Basquetebol, Futebol, Golfe, Hóque no Gelo, Téns e Atletsmo. As aplcações estatístcas a eventos desportvos são também uma poderosa ferramenta para catvar a atenção dos estudantes: pela famlardade com os desportos, o contexto da aplcação é mas faclmente compreenddo, podendo ser dado o devdo ênfase à análse estatístca e à sua percepção crítca. Com o desenvolvmento das tecnologas e sstemas de nformação, temos presentemente uma grande dsponbldade de dados, nomeadamente estatístcos. A Infordesporto (Infordesporto, ste na Internet) é uma dessas bases de dados, que dsponblza uma nformação completa sobre váras estatístcas relatvas aos jogos de futebol do campeonato naconal, em Portugal, desde a época de 998/99. A análse de regressão, sendo um método estatístco que utlza a relação entre duas ou mas varáves quanttatvas, permte estmar uma varável a partr de outras. O Modelo de Regressão Lnear, dscutdo por alguns autores ndcam-se dos, a título de exemplo (Neter et al., 996; Draper e Smth, 98), é um meo formal de exprmr essa relação estatístca entre varáves ndependentes, de prevsão ou explcatvas e uma varável dependente, de resposta ou explcada. Encontram-se algumas aplcações destes modelos a competções desportvas em publcações recentes (Smth, 999; Szymansk e Smth, 997; Gray, 997; Kahane, 997; Hamlton, 997) que, usualmente, se cngem à análse da nfluênca de algumas, poucas, varáves nos resultados desportvos. Neste trabalho, pretende aplcar-se o modelo de regressão aos campeonatos de futebol, em Portugal, de 998/999 e 999/2000, de modo a estudar a relação entre os dados estatístcos para os jogos e os resultados obtdos pelas equpas ntervenentes. Esta análse passa pela descrção do desenvolvmento prátco de um modelo de regressão, permtndo exemplfcar e detalhar os passos conducentes à valdação e aplcação do modelo. O modelo permte desenvolver prevsões sobre qual devera ter sdo o resultado dos jogos, de acordo com as estatístcas dsponíves, e compará-lo com o resultado efectvamente observado, orgnando classfcações prevstas pelo modelo.

3 A manpulação de grandes quantdades de dados estatístcos só é possível com adequados meos nformátcos. O software utlzado neste estudo é o SPSS - Statstcal Package for Socal Scences, para o qual se refere um texto de apoo (Pestana e Gagero, 2000), entre város exstentes. 2. DADOS ESTATÍSTICOS A Infordesporto dsponblza uma nformação estatístca bastante completa sobre os jogos do campeonato naconal de futebol da I dvsão, desde a época de 998/99. Para aplcação e desenvolvmento de um modelo de regressão é necessáro, em prmero lugar, sstematzar os dados dsponíves, tendo por objectvo relaconar o resultado de um jogo de futebol (varável dependente) com o comportamento das duas equpas antagonstas, descrto pelas denomnadas varáves ndependentes: a nformação estatístca dsponível para os ntervenentes no jogo. No Quadro n.º, ntroduz-se a lsta das estatístcas dsponíves para cada jogo, agrupadas em categoras e representadas por abrevaturas, sglas essas que serão utlzadas ao longo do texto. Quadro n.º. Estatístcas dsponíves para cada jogo Geras: Guarda-redes: RELV estado do relvado DC defesas completas ESPEC n.º de espectadores DI defesas ncompletas TJOGO tempo jogado (% do tempo total) SC saídas completas Tempos de posse de bola (mn.): SI saídas ncompletas DEF na defesa Jogadores: MCD no meo campo defensvo FC faltas cometdas MCO no meo campo ofensvo FS faltas sofrdas ATA no ataque P perdas de bola TOT total R recuperações de bola POSSE posse de bola (% do total) AT Ataques Dscplnares: CR Cruzamentos CA cartões amarelos RE Remates CV cartões vermelhos AS Assstêncas Utlzou-se a segunte escala ordnal: -mau, 2-razoável, 3-bom, 4-muto bom, 5-excelente. Destas váras estatístcas analsadas num jogo de futebol, as estatístcas geras e a percentagem de posse de bola apresentam um valor para cada jogo; todas as restantes apresentam dos valores, o prmero assocado a uma das equpas e o segundo assocado à outra: sendo preceddas pela letra C, quando dzem respeto à equpa que joga em casa e pelo prefxo F, quando assocadas à equpa que actua fora do seu

4 terreno. Deste modo, o resultado de cada jogo está relaconado com estas 42 estatístcas, denomnadas varáves ndependentes, para efeto do modelo de regressão. A análse reporta-se a duas épocas (998/999 e 999/2000) do campeonato naconal de futebol, consttundo cada jogo uma observação que rá ntegrar o modelo de regressão, pelo que exstem, no total, 62 observações destas 42 varáves. O Modelo de Regressão relacona, estatstcamente, uma varável dependente com varáves ndependentes, exprmndo a tendênca da prmera para varar com as segundas, de um modo sstemátco. 3. MODELO DE REGRESSÃO A hpótese formulada neste estudo consste em estabelecer uma relação estatístca, utlzando a análse de regressão, entre o resultado de um jogo de futebol e as estatístcas dsponíves para as varáves que estão relaconadas com o comportamento das equpas ntervenentes, de modo a servr dos objectvos: descrção, através do desenvolvmento de um modelo váldo e utlzável para caracterzar a relação entre as varáves; controlo, de modo a verfcar se os resultados efectvamente obtdos são, ou não, dferentes dos prevstos pelo modelo. A fórmula geral da curva de regressão para o modelo é: Y β 0 β X β X β X + ε =, 2,..., n () = p, p n é o número de observações: corresponde aos 62 jogos, das épocas de 998/999 e 999/2000, do campeonato naconal de futebol; Y é a varável dependente ( representa a observação em n observações): serão testadas duas meddas do resultado de cada jogo de futebol: a prmera, denomnada VED, consste numa escala ordnal, em que 2 = vtóra, = empate e 0 = derrota, defnda desta forma, para garantr a smetra da varável; a segunda, representada pela sgla GMGS, é dada pela dferença, entre Golos Marcados e Golos Sofrdos, para a equpa que actua em casa; X p- são as varáves ndependentes ou explcatvas: correspondem às observações das 42 estatístcas apresentadas no Quadro n.º, para cada jogo; β k são os parâmetros do modelo, medndo a varação méda do valor esperado da varável dependente Y, com o aumento de uma undade na varável assocada, quando todas as outras varáves explcatvas no modelo permanecem constantes; ε é o termo de erro aleatóro, representando as varáves com poder explcatvo sobre a varável dependente omtdas pelo modelo.

5 No modelo, uma componente da varação na varável dependente é explcada pelas varáves ndependentes que o consttuem, sendo dada pelo coefcente de determnação (r 2 ), mas exste uma outra componente que reflecte a nossa gnorânca referente a factores explcatvos não contemplados. 4. DESENVOLVIMENTO DOS MODELOS DE REGRESSÃO 4.. DADOS ESTATÍSTICOS: VARIÁVEIS DO MODELO Os dados em análse consttuem um estudo observaconal explcatvo. Uma regra empírca para stuações deste tpo é que devem exstr 6 a 0 observações por cada varável ndependente, o que sucede neste estudo SELECÇÃO DAS VARIÁVEIS INDEPENDENTES A INCLUIR NOS MODELOS É também mportante reduzr o número de varáves a nclur no modelo fnal (Mller, 990), devdo à dfculdade em compreender um modelo com mutas varáves e ao aumento na varabldade assocada aos coefcentes do modelo, provocado pela correlação entre as varáves o que sucede, normalmente, num estudo observaconal explcatvo, que dmnu as capacdades descrtvas e de controlo do modelo (os valores estmados para a varável dependente apresentam grande varânca). Utlzam-se procedmentos para selecconar e testar sub-grupos de varáves ndependentes mportantes, com o objectvo de desenvolver um modelo com um menor número de varáves, escolhendo as que explcam melhor a varável dependente ANÁLISE FACTORIAL DE COMPONENTES PRINCIPAIS No decorrer do estudo que permte a selecção das varáves ndependentes relevantes para o modelo, verfca-se a exstênca de uma forte correlação entre algumas varáves, o que mpede a sua utlzação smultânea nos modelos de regressão. Este facto, que ocorre para qualquer uma das varáves dependentes (VED ou GMGS), obrga à selecção de apenas uma varável, entre as váras que estão correlaconadas entre s, para ntegrar o modelo de regressão, stuação que orgnara uma perda da nformação, presente nas restantes varáves elmnadas do modelo, que se podem consderar, à partda, mportantes. Para ultrapassar esta contraredade, recorreu-se à aplcação das técncas de análse factoral de componentes prncpas, de modo a reduzr o número de varáves, mnmzando a perda de nformação. As varáves com forte correlação, entre s, são as que representam as estatístcas de ataque de qualquer das equpa (tempos de posse de bola e recuperações,

6 ataques, remates e cruzamentos) e as dscplnares para as equpas que actuam fora do seu terreno (cartões amarelos e vermelhos). De acordo com as correlações exstentes entre varáves, exstem cnco grupos de varáves, apresentados no Quadro n.º 2, aos quas será aplcada a análse factoral de componentes prncpas, de modo a transformar as varáves ncas (X, X 2,..., X p ), correlaconadas entre s, num menor número de varáves não correlaconadas (F, F 2,..., F p ), desgnadas por factores prncpas ou, smplesmente, por factores. Cada varável é expressa como combnação lnear dos factores que lhe são comuns: X X... = bf + b2f bk Fk + U 2 b2f + b22f b2k Fk + U 2 p = (2) X = b F + b F b F + U p p2 2 pk k p Onde b j são os coefcentes, factores ou loadngs, que correlaconam as varáves orgnas com os factores comuns e U representam os factores úncos, ou seja, a parte de uma varável que não é explcada pelos factores comuns. Os prmero e segundo grupos de varáves são consttuídos pelas estatístcas de ataque (ataques, remates, cruzamentos e recuperações), para as equpas que jogam em casa e fora, respectvamente CATA e FATA; o tercero e quarto grupos ntegram os tempos de posse de bola (no meo campo defensvo, no ataque e total), também para as equpas que actuam em casa CTAT e fora FTAT, respectvamente; o qunto grupo apresenta as estatístcas dscplnares (cartões amarelos e vermelhos), da equpa que actua fora de casa FCAV. Da análse do quadro, verfca-se que todas as varáves de cada grupo apresentam correlações postvas entre s e, como dado complementar, deve ser referdo que todas as correlações apresentadas são sgnfcatvas, para um nível de sgnfcânca de %.

7 Quadro n.º 2. Grupos de varáves sujetas a análse factoral: correlações entre as varáves ntegrantes de cada grupo Grupo CATA Grupo 3 CTAT CAT CRE CCR CR CMCO CATA CTOT CAT,00 0,59 0,74 0,35 CMCO,00 0,49 0,77 CRE 0,59,00 0,53 0,8 CATA 0,49,00 0,70 CCR 0,74 0,53,00 0,28 CTOT 0,77 0,70,00 CR 0,35 0,8 0,28,00 Grupo 4 FTAT Grupo 2 FATA FMCO FATA FTOT FAT FRE FCR FR FMCO,00 0,5 0,77 FAT,00 0,59 0,73 0,39 FATA 0,5,00 0,64 FRE 0,59,00 0,50 0,2 FTOT 0,77 0,64,00 FCR 0,73 0,50,00 0,25 Grupo 5 FCAV FR 0,39 0,2 0,25,00 FCA FCV FCA,00 0,52 FCV 0,52,00 De modo a prossegur com a análse factoral, deve testar-se e rejetar a hpótese da matrz de correlações ser a matrz dentdade: utlzando o teste de esfercdade de Bartlett que, para todos os grupos de varáves, apresenta um nível de sgnfcânca de 0,000, pode rejetar-se a hpótese testada, mostrando a exstênca de correlação entre as varáves. Uma medda da adequação dos dados (MAD) para a análse factoral de componentes prncpas consste na estatístca Kaser-Meyer-Olkn (KMO), que compara as correlações smples com as parcas entre as varáves, devendo os coefcentes de correlação parcas ser pequenos. Kaser adjectva os valores de KMO, de acordo com a adequação dos dados para a realzação da análse factoral, como: KMO <0,5 0,5-0,6 0,6-0,7 0,7-0,8 0,8-0,9,0 MAD Inacetável Má Razoável Méda Boa Muto boa No Quadro n.º 3 são apresentados os valores da KMO para os cnco grupos de varáves, que sugerem dados adequados, de forma razoável ou méda, para a aplcação da análse factoral, com excepção do grupo FCAV, em que essa medda é adjectvada como má, embora sendo anda possível realzar a referda análse.

8 Quadro n.º 3. Adequação dos dados para a análse factoral Grupos de varáves KMO MAD CATA 0,75 Méda FATA 0,698 Razoável CTAT 0,64 Razoável FTAT 0,660 Razoável FCAV 0,500 Má Em cada grupo de varáves pode, anda, ser analsada a adequação de cada varável para utlzação da análse factoral, através dos valores das correlações da dagonal prncpal da matrz ant-magem, que consstem numa medda da adequação dos dados (MAD), para cada varável, ntroduzda no Quadro n.º 4. Valores da MAD elevados, tal como os obtdos neste estudo, permtem conclur que é possível a realzação da análse factoral. Quadro n.º 4. Adequação das varáves para a análse factoral CATA FATA CTAT FTAT FCAV Varável MAD Varável MAD Varável MAD Varável MAD Varável MAD CAT 0,66 FAT 0,64 CMCD 0,63 FMCD 0,66 FCA 0,50 CRE 0,8 FRE 0,80 CATA 0,67 FATA 0,77 FCV 0,50 CCR 0,70 FCR 0,69 CTOT 0,57 FTOT 0,6 CR 0,82 FR 0,74 Depos de verfcar a possbldade de executar adequadamente a análse factoral, prossegue-se com a extracção dos factores a partr das varáves para os cnco grupos defndos. O prmero passo consste, precsamente, na defnção do número de componentes (ou factores) retdos, necessáros para descrever os dados, através da aplcação de três regras: a proporção da varânca explcada pelas componentes deve ser superor a 60%; a varânca de cada componente (valores própros ou egenvalues) retda deve ser superor à undade, ou seja, à varânca méda; no screeplot (gráfco da varânca explcada em função das componentes), os pontos de maor declve correspondem às componentes retdas. De acordo com os procedmentos referdos, como pode ser observado no Quadro n.º 5, foram retdos dos factores nos dos prmeros grupos de varáves e apenas um factor nos restantes, assnalados a negrto.

9 Quadro n.º 5. Factores (componentes) retdos a partr das varáves orgnas CATA Valores própros CTAT Valores própros Factor Total % de σ 2 % cum. Factor Total % de σ 2 % cum. 2,40 60,0 60,0 2,3 77, 77, 2 0,86 2,6 8,6 2 0,52 7,2 3 0,49 2, 3 0,7 5,7 4 0,25 6,3 FTAT Valores própros FATA Valores própros Factor Total % de σ 2 % cum. Factor Total % de σ 2 % cum. 2,28 76,0 76,0 2,40 59,9 59,9 2 0,5 6,9 2 0,85 2, 8,0 3 0,2 7, 3 0,5 2,8 FCAV Valores própros 4 0,25 6,2 Factor Total % de σ 2 % cum.,52 76,0 76,0 2 0,48 24,0 No quadro apresentam-se os valores própros, a percentagem de varânca assocada a cada factor e a percentagem cumulatva de varânca explcada pelas componentes retdas. A varânca explcada pelos factores retdos, nos város grupos de varáves, vara entre 76% e 82%, valores que são bastante razoáves para a aplcação de análse factoral. No Quadro n.º 6 apresentam-se os valores das comunaldades, que correspondem à proporção da varânca de cada varável explcada pelas componentes prncpas retdas. Todas as varáves apresentam uma forte relação com os factores retdos, uma vez que os valores observados para as comunaldades são elevados, o menor valor é de 65%, sendo a maora dos valores superores a 75%. Quadro n.º 6. Comunaldades (Com.) assocadas a cada varável CATA FATA CTAT FTAT FCAV Varável Com. Varável Com. Varável Com. Varável Com. Varável Com. CAT 0,82 FAT 0,83 CMCD 0,74 FMCD 0,77 FCA 0,76 CRE 0,70 FRE 0,68 CATA 0,68 FATA 0,65 FCV 0,76 CCR 0,77 FCR 0,75 CTOT 0,89 FTOT 0,86 CR 0,98 FR 0,99 Após a aplcação e valdação de todos os passos da análse factoral de componentes prncpas, fnalmente, procede-se à determnação da matrz dos componentes, que apresenta os coefcentes, factores ou loadngs, que relaconam as varáves com os factores retdos.

10 Quadro n.º 7. Matrz de componentes Factor CATA Factor FATA Factor Factor Factor Var. 2 Var. 2 Var. CTAT Var. FTAT Var. FCAV CAT 0,903-0,067 FAT 0,909-0,048 CMCD 0,860 FMCD 0,876 FCA 0,872 CRE 0,770-0,328 FRE 0,767-0,297 CATA 0,825 FATA 0,809 FCV 0,872 CCR 0,866-0,27 FCR 0,843-0,200 CTOT 0,945 FTOT 0,926 CR 0,493 0,858 FR 0,520 0,846 Por exemplo, para o prmero grupo de varáves: CAT CCR = 0,903CATA 0, 067CATA2 CRE = 0,770CATA 0, 328CATA2 = 0,866CATA 0, 27CATA2 CR = 0,493CATA + 0, 858CATA2 (3) Os valores própros das componentes retdas correspondem à soma dos quadrados dos coefcentes das varáves, para cada factor (soma em coluna), enquanto que as comunaldades podem ser obtdas pela soma dos quadrados dos coefcentes dos factores, para cada varável (soma em lnha). Para os dos prmeros grupos de varáves, em que foram retdos dos factores, procede-se anda à rotação da matrz dos componentes, de modo a extremar os valores dos coefcentes, para assocar, ndubtavelmente, cada varável a apenas um factor. Nos grupos de varáves CATA e FATA, embora já exsta uma separação clara entre as varáves assocadas a cada factor, realzou-se a rotação da matrz de componentes, utlzando o método Varmax, com a normalzação de Kaser, obtendo-se, no Quadro n.º 8, a matrz de componentes, após rotação. O Gráfco n.º lustra a forma como as varáves estão assocadas a cada um dos factores: para ambos os grupos de varáves, representatvos das estatístcas de ataque para as equpas que actuam em casa e fora, os ataques, remates e cruzamentos são representados pelo factor e as recuperações estão lgadas ao factor 2. No desenvolvmento dos modelos de regressão, as estatístcas de ataque são substtuídas pelos factores retdos que lhes estão assocados, de modo a elmnar a correlação exstente entre as varáves, não perdendo a nformação por elas representada. Quadro n.º 8. Matrz de componentes após rotação Factor Factor Var. CATA CATA2 Var. FATA FATA2 CAT 0,864 0,27 FAT 0,855 0,3 CRE 0,836-0,02 FRE 0,822 0,026 CCR 0,852 0,202 FCR 0,855 0,45 CR 0,4 0,979 FR 0,49 0,98

11 Gráfco n.º. Assocação entre componentes retdos e varáves.0 CR.0 FR 0.5 CAT 0.5 FAT CATA2 0.0 CCR CRE FATA2 0.0 FCR FRE CATA FATA 4.2. MODELOS DE REGRESSÃO VARIÁVEIS UTILIZADAS O objectvo deste estudo passa pelo desenvolvmento de modelos que relaconem a varável dependente, resultado de um jogo de futebol, com as varáves ndependentes em análse. Foram construídos modelos, utlzando duas varáves dependentes que exprmem, de modo dferente, o resultado de um jogo. Tal como referdo anterormente, o Modelo tem como varável dependente VED, que apresenta três resultados possíves, para cada jogo: 2 = vtóra, = empate e 0 = derrota, reportados à equpa que actua no seu terreno, sendo o resultado da equpa que joga fora complementar a este; o Modelo 2 utlza a varável dependente GMGS, que resulta da dferença entre Golos Marcados e Golos Sofrdos pela equpa que joga perante o seu públco. As 42 estatístcas dsponíves sobre cada jogo de futebol foram reduzdas; através da aplcação da análse factoral de componentes prncpas, prevamente descrta, a algumas varáves correlaconadas entre s. No Quadro n.º 9 estão lstadas as varáves resultantes, que serão utlzadas na construção dos modelos de regressão. Na análse subsequente serão utlzadas estas 33 varáves ndependentes, cuja nomenclatura resulta da anterormente apresentada, no Quadro n.º, com a ntrodução do prefxo C, quando a estatístca dz respeto à equpa que actua em casa e do prefxo F, quando se reporta à equpa que joga fora. As estatístca geras e a percentagem de posse de bola da equpa que actua no seu terreno ( POSSE ) dzem respeto a cada jogo. Assnalam-se a negrto as varáves que resultam de factores determnados na análse factoral de componentes prncpas.

12 Quadro n.º 9. Varáves ndependentes para cada jogo Geras: Tempos de posse: Guarda-redes: Jogadores: RELV Casa Fora Casa Fora Casa Fora ESPEC CDEF FDEF CDC FDC CFC FFC TJOGO CMCD FMCD CDI FDI CFS FFS Dscplnares: CTAT FTAT CSC FSC CP FP Casa Fora POSSE CSI FSI CATA FATA CCA FCAV CATA2 FATA2 CCV CAS FAS Para um dos jogos não estão dsponíves dados estatístcos, pelo que exstem 6 observações, relatvas aos jogos analsados, das varáves em análse, com a excepção de quatro encontros, em que não estão dsponíves dados para algumas varáves (mssng values). Nesta stuação, optou-se pela utlzação dos valores médos da equpa em análse, em casa ou fora, conforme o caso, de modo a não se perder a nformação estatístca para outras varáves da observação em causa CONSTRUÇÃO DOS MODELOS DE REGRESSÃO Este consttu o passo decsvo do estudo da relação estatístca entre as varáves, embora seja descrto de forma bastante resumda. Ambos os modelos de regressão, ncalmente, ntegram todas as varáves ndependentes, bem como as formas funconas não lneares da relação destas com a varável dependente, que ntroduzem melhoras na descrção dos dados, o que ocorre esporadcamente, para algumas varáves, com a função quadrátca, que provoca aumentos sgnfcatvos no coefcente de determnação, quando comparado com o valor do mesmo para a relação lnear. A utlzação desta forma pressupõe a realzação de uma transformação das varáves, de modo a reduzr a correlação entre os termos da função quadrátca, que se consegue do segunte modo: sendo X,p a observação de uma varável deste tpo, a sua relação com a varável dependente será: Y p, p p2 2, p = β β x + β x + + ε com x, p = X, p X (4) Através de um processo de análse sstemátca da mportânca de cada varável nos modelos desenvolvdos, vão sendo elmnadas, passo a passo, varáves que não apresentam relevânca, de acordo com os crtéros de análse da sgnfcânca das varáves ndependentes, de maxmzação do coefcente de determnação ajustado e utlzando o procedmento Forward Stepwse que, essencalmente, desenvolve uma sequênca de modelos de regressão, adconando ou retrando em cada passo uma

13 varável ndependente. A aplcação deste procedmento é descrta, pormenorzadamente, por város autores (Freedman, 983; Pope e Webster, 972). No Quadro n.º 0 são apresentados os resultados mas sgnfcatvos para os modelos de regressão ncalmente construídos, bem como as varáves ndependentes selecconadas para ntegrar estes modelos e respectvos níves de sgnfcânca. Quadro n.º 0. Modelos de Regressão Modelo : Varável dependente - VED Coefcente de Determnação: r 2 = 0,334 g.l. SS MS Estmatva do desvo padrão: MSE = 0,663 Regressão 20 30,00 6,500 F = 4,8 Sgnfcânca F =0,00 Resíduos ,4 0,439 Var. b s(b ) Sg. t Var. b s(b ) Sg. t Constante 4,020 0,465 0,000 Jogador CFC 0,03 0,006 0,02 Geras RELV 0,06 0,028 0,027 CFC 2-0,00 0,00 0,047 ESPEC 3,2e -6 2,98e -6 0,295 CP -0,006 0,004 0,2 Dsc- CCA -0,025 0,09 0,8 CATA 0,08 0,042 0,009 plnares CCV -0,250 0,078 0,00 CATA2 0,99 0,040 0,000 FCAV 0,067 0,030 0,025 CAS 0,8 0,09 0,000 Tempos CDEF 0,069 0,033 0,036 FFC -0,0 0,005 0,034 de FDEF -0,060 0,030 0,048 FATA -0,096 0,040 0,08 posse POSSE -4,483 0,775 0,000 FATA2-0,95 0,039 0,000 Guarda- CSC 0,022 0,00 0,027 FAS -0,42 0,023 0,000 -redes FSC -0,038 0,00 0,000

14 Modelo 2: Varável dependente - GMGS Coefcente de Determnação: r 2 = 0,422 g.l. SS MS Estmatva do desvo padrão: MSE =,290 Regressão 8 78,93 39,94 F = 24,0 Sgnfcânca F =0,00 Resíduos ,49,663 Var. b s(b ) Sg. t Var. b s(b ) Sg. t Constante -0,732 0,968 0,450 Jogador CFC 0,035 0,00 0,00 Geras RELV 0,096 0,054 0,077 CP -0,02 0,008 0,52 ESPEC 7,80e -6 5,77e -6 0,77 CATA -0,04 0,069 0,835 TJOGO 3,658,492 0,04 CATA2 0,377 0,078 0,000 Dsc- CCA -0,056 0,036 0,26 CAS 0,305 0,043 0,000 plnares CCV -0,523 0,5 0,00 CAS 2 0,03 0,0 0,004 FCAV 0,59 0,059 0,007 FFC -0,037 0,00 0,000 Guarda- CSC 0,060 0,09 0,002 FATA -0,04 0,069 0,840 -redes FSC -0,099 0,08 0,000 FATA2-0,384 0,077 0,000 FAS -0,340 0,044 0,000 g.l. graus de lberdade SS e MS somatóro e méda do somatóro dos quadrados. b e s(b ) estmatvas do coefcente e do seu desvo padrão para a varável. Sg. t nível de sgnfcânca do teste t de Student. Verfca-se a exclusão, do modelo VED, das varáves percentagem de tempo de jogo, tempos de posse de bola no meo campo defensvo e no ataque, defesas e saídas ncompletas dos guarda-redes, faltas sofrdas e perdas de bola da equpa que joga fora. A varável faltas cometdas pela equpa que actua em casa surge na forma quadrátca. O coefcente de determnação ndca que apenas 33,4% da varação que ocorre na varável dependente VED é explcada pelas varáves ncluídas no modelo, o teste F, à sgnfcânca global do modelo, é valdado por apresentar sgnfcânca nula. A estatístca, ou varável, cuja estmatva do coefcente apresenta valor postvo contrbu postvamente para a vtóra da equpa que actua em casa, tendo as estmatvas negatvas o efeto contráro: uma varação de uma undade na varável ndependente provoca uma varação méda esperada na varável dependente gual ao valor da estmatva do coefcente. A sgnfcânca do teste t de Student para cada varável ndca-nos a probabldade dessa varável tomar um valor nulo no modelo, não sendo sgnfcante. Exstem três varáves (ESPEC, CCA e CP), cujos valores da sgnfcânca são superores ao estabelecdo como desejável, que é de 5%. O modelo 2 GMGS, comparatvamente com o anteror, passa a ntegrar a varável percentagem de tempo de jogo, sendo excluídos os tempos de posse de bola. A varável assstêncas da equpa que joga em casa aparece na forma quadrátca.

15 O coefcente de determnação é superor: as varáves do modelo explcam 42,2% da varação da varável dependente GMGS e o teste F valda o modelo. As varáves apresentam estmatvas para os seus coefcentes com snal dêntco às do modelo, com excepção do factor CATA, para as estatístcas de ataque da equpa que actua em casa. Exste um número aprecável de varáves, cuja sgnfcânca do teste t de Student apresenta valores da sgnfcânca superores ao estabelecdo como desejável, que é de 5%, que serão analsadas nos pontos seguntes ANÁLISE DE OUTLIERS Os outlers são casos extremos nfluentes em determnada análse estatístca. No desenvolvmento dos modelos de regressão mporta determnar o conjunto de observações que podem ser consderadas como outlers, de modo a equaconar a sua elmnação na construção de modelos subsequentes, com o objectvo de obter refnamentos. A análse de outlers (Barnett e Lews, 994; Rousseeuw e Leroy, 987), com o objectvo de dentfcação das observações que os consttuem será efectuada com a ajuda das seguntes estatístcas: resíduos estandardzados, resíduos estudantzados, leverage, dstânca de Cook, dfbetas estandardzados e dfft estandardzado. De modo a proceder a esta análse, torna-se premente ntroduzr a matrz H, cuja compreensão é facltada pela formulação matrcal do modelo. Y Y2 = Yn X X X... 2 n X X X, p 2, p... n, p β 0 ε β + ε β p ε n ou Y = X β + ε (5) ( n ) ( n p) ( p ) ( n ) A matrz H resulta de: H ( n n) = X ( X ' X ) X ', sendo X a matrz transposta de X. (6) Os resíduos, para cada observação, calculam-se a partr da dferença entre os valores observados e os valores estmados pelo modelo para a varável dependente: e = Y Yˆ (7) A partr destes valores podem calcular-se os resíduos estandardzados: e * = e MSE (8)

16 Consdera-se como outler uma observação em que o resíduo estandardzado tenha valor absoluto superor a,96, para um nível de sgnfcânca de 5%. Nos dos modelos desenvolvdos, dentfcam-se algumas observações como outlers, representadas pelos pontos que ultrapassam os lmtes, no Gráfco n.º 2. Gráfco n.º 2. Resíduos estandardzados 4 Modelo - VED 4 Modelo 2 - GMGS Resíduos Estandardzados Resíduos Estandardzados Observação Observação Um prmero refnamento, que torna os resíduos mas efcazes no reconhecmento de outlers, consste no reconhecmento do facto de que as observações podem apresentar dferentes desvos padrão entre elas. O desvo padrão de uma observação é estmado através da expressão (9), em que h representa o elemento da dagonal prncpal da matrz H referente à observação. s ( e ) MSE( ) = (9) h A razão entre cada resíduo e o seu desvo padrão estmado é denomnada resíduo estudantzado: e r = (0) s( e ) Uma segunda melhora resulta do cálculo dos resíduos para a observação, quando o modelo de regressão se basea em todos os dados, com a excepção da observação, obtendo-se os resíduos deleted: d ˆ ( ) = Y Y () Combnando as duas formas ntroduzdas, podem calcular-se os resíduos estudantzados deleted: d t = () s( d )

17 Estes, possbltam um melhor dagnóstco de outlers, que resultam das observações, cujos resíduos estudantzados deleted são elevados, em valor absoluto. Pode demonstrar-se que este tpo de resíduos seguem uma dstrbução t de Student, pelo que é possível defnr um valor crítco, a partr do qual se consdera uma observação como outler: para um nível de sgnfcânca de 5%, esse valor crítco é também de,96. Assm, no Gráfco n.º 3, lustram-se os outlers obtdos. A partr da análse dos resíduos, lustrada pelos Gráfcos n.º 2 e n.º 3, a detecção de outlers é semelhante para os dos tpos de resíduos, sendo o seu número superor no Modelo 2 GMGS, bem como o valor absoluto dos resíduos. O leverage, dado pelo elemento da dagonal prncpal (h ) da matrz H, prevamente defnda, representa a nfluênca da observação na qualdade do ajustamento feto. Quando é superor a duas vezes o seu valor médo, ou seja, 2(p+)/n (utlzando a nomenclatura ntroduzda na formulação do modelo), a observação é consderada nfluente. O gráfco n.º 4 lustra os outlers dentfcados por esta regra. Gráfco n.º 3. Resíduos estudantzados deleted Resíduos Estudantzados Deleted Modelo - VED Resíduos Estudantzados Deleted Modelo 2 - GMGS Observação Observação Gráfco n.º 4. Leverage.20 Modelo - VED.20 Modelo 2 - GMGS.5.5 Leverage.0 Leverage Observação Observação Após a dentfcação, como outlers, de observações, no que dz respeto aos valores das varáves dependente e ndependentes, mporta verfcar a sua nfluênca

18 no comportamento do modelo, que pode ser quantfcada pela dstânca de Cook, dfbetas estandardzados e dfft estandardzado: uma observação consdera-se nfluente, se a sua exclusão causar alterações substancas na função de regressão estmada. A dstânca de Cook consdera a varação provocada nos resíduos de todas as observações, quando a observação é excluída do cálculo dos coefcentes de regressão, podendo ser calculada sem recorrer à estmação de uma nova função de regressão, cada vez que uma observação é excluída, através de uma expressão equvalente: n ( Yˆ ˆ j Y j( ) ) 2 2 j= e h ( ) ( ) ( ) D = D = (2) p + MSE p + MSE 2 h Uma observação é consderada nfluente quando a dstânca de Cook é superor a 4/(n-p-). Os respectvos outlers são lustradas pelo Gráfco n.º 5. O dfft estandardzado representa a dferença entre o valor estmado pelo modelo, para a observação, quando todas as observações são utlzadas e o valor estmado, para a mesma observação, quando o caso é excluído do cálculo da função de regressão que, tal como na equação anteror, pode ser calculado através de uma expressão equvalente, que não obrga ao cálculo da função de regressão, cada vez que uma observação é excluída do modelo. dffts = Yˆ Yˆ MSE ( ) ( ) h dffts = t h h (3) Uma observação é consderada outler, quando o valor absoluto do dfft estandardzado é superor a 2 ( p + ) n. Os resultados, para esta medda da nfluênca das observações, apresentam-se no Gráfco n.º 6. Gráfco n.º 5. Dstânca de Cook.020 Modelo - VED.020 Modelo 2 - GMGS Dstânca de Cook Dstânca de Cook Observação Observação

19 Gráfco n.º 6. dfft estandardzado.6 Modelo - VED.6 Modelo 2 - GMGS.4.4 dfft estandardzado dfft estandardzado Observação Observação A medda da nfluênca de uma observação, em cada coefcente da regressão β k, resulta da dferença entre o valor estmado para o coefcente de regressão baseado em todas as observações e o mesmo valor omtndo o caso. O DfBeta estandardzado obtém-se, pelo quocente entre essa dferença e a estmatva do desvo padrão do coefcente de regressão em análse: dfbeta bk bk ( ) = k = 0,,, p- (4) MSE c ( ) kk Em que c kk é o k elemento da dagonal prncpal da matrz (X X) -. O valor de DfBeta é calculado, para todas as observações, para todos os parâmetros e para a constante do modelo. As observações são consderadas outlers quando o valor absoluto de DfBeta é superor a 2/ n. O Gráfco n.º 7 permte observar os pontos assm dentfcados, segundo o crtéro do DfBeta, para os coefcentes assocados à varável CAS, a título de exemplo. Gráfco n.º 7. dfbeta estandardzado para a varável CAS dfbeta estandardzado para FAS Modelo - VED dfbeta estandardzado para FAS Modelo 2 - GMGS Observação Observação A análse de outlers apresentada permte dentfcar os casos extremos consderados nfluentes para os modelos, que serão excluídos na construção de novas

20 funções de regressão. Foram consderados casos extremos nfluentes as observações que desrespetam as condções mpostas aos resíduos ou, então, que não estejam dentro dos lmtes mpostos para, pelo menos, três dos restantes crtéros consderados. A análse de outlers processou-se, deste modo, em dos passos sucessvos, de manera a construr um modelo ntermédo, cuja análse, nos mesmos termos do modelo ncal, permtu a detecção de mas casos extremos nfluentes, que levaram à construção dos modelos de regressão defntvos. Os crtéros estabelecdos permtem a detecção de 20 outlers no modelo VED e, no modelo 2 GMGS, foram consderados 09 outlers. É relevante observar que as observações detectadas como outlers, em ambos os modelos, se dstrbuem de modo unforme por todas as equpas, quer actuando em casa, quer em jogos fora. Quanto às varáves que representam os resultados dos jogos, tanto no caso da varável VED, como para a varável GMGS, há poucos empates consderados como outlers, quando comparados com a sua frequênca relatva no total de jogos REFINAMENTO DOS MODELOS DE REGRESSÃO, ELIMINANDO OS OUTLIERS Foram desenvolvdos novos modelos, exclundo os outlers detectados anterormente, que serão utlzados para explcar as relações estatístcas entre as varáves em análse. No Quadro n.º apresentam-se os resultados sgnfcatvos para os modelos de regressão defntvos, o prmero com 49 observações e o segundo com 502, após a elmnação dos casos extremos nfluentes, bem como para as varáves ndependentes. As alterações mas mportantes no modelo VED, relatvamente ao ncalmente construído, resdem no aumento do coefcente de determnação: a varação que ocorre na varável dependente VED, explcada pelas varáves do modelo, aumentou pratcamente para o dobro 62,% ; na dmnução do desvo padrão e nos níves de sgnfcânca assocados às varáves, sendo apenas dos moderadamente superores a 5%. As varáves que contrbuem postvamente para a vtóra da equpa que actua em casa, como explcado anterormente, pelo snal da estmatva do respectvo coefcente, são o estado do relvado, o número de espectadores, o tempo de posse na defesa, as saídas completas do guarda-redes, as faltas cometdas, as estatístcas de ataque e as assstêncas, para a equpa que actua em casa e as acções dscplnares para a equpa que joga fora. As varáves cuja contrbução para a varável dependente é negatva são o tempo de posse na defesa, as saídas completas do guarda-redes, as faltas cometdas, as estatístcas de ataque e as assstêncas, para a equpa que joga fora e as acções dscplnares, a percentagem de posse de bola e as perdas de bola para a equpa que actua em casa. Analsando crtcamente os resultados, não sera talvez de esperar que as faltas cometdas por uma equpa tvessem um contrbuto postvo para o resultado e que a percentagem de posse de bola nfluencasse negatvamente o resultado.

21 Quadro n.º Modelos de Regressão Modelo : Varável dependente - VED Coefcente de Determnação: r 2 = 0,62 g.l. SS MS Estmatva do desvo padrão: MSE = 0,457 Regressão 20 60,9 8,045 F = 38,5 Sgnfcânca F =0,00 Resíduos ,4 0,209 Var. b s(b ) Sg. t Var. b s(b ) Sg. t Constante 5,757 0,366 0,000 Jogador CFC 0,0 0,004 0,00 Geras RELV 0,038 0,022 0,086 CFC 2-0,002 0,000 0,000 ESPEC 4,52e -6 2,30e -6 0,050 CP -0,006 0,003 0,053 Dsc- CCA -0,04 0,04 0,004 CATA 0,067 0,033 0,043 plnares CCV -0,407 0,066 0,000 CATA2 0,202 0,032 0,000 FCAV 0,087 0,023 0,000 CAS 0,09 0,05 0,000 Tempos CDEF 0,044 0,027 0,099 FFC -0,022 0,004 0,000 de FDEF -0,059 0,024 0,05 FATA -0,2 0,032 0,000 posse POSSE -6,387 0,6 0,000 FATA2-0,284 0,03 0,000 Guarda- CSC 0,05 0,008 0,053 FAS -0,97 0,08 0,000 -redes FSC -0,043 0,008 0,000 Modelo 2: Varável dependente - GMGS Coefcente de Determnação: r 2 = 0,620 g.l. SS MS Estmatva do desvo padrão: MSE = 0,834 Regressão 8 546,54 30,363 F = 43,7 Sgnfcânca F =0,00 Resíduos ,6 0,695 Var. b s(b ) Sg. t Var. b s(b ) Sg. t Constante -0,864 0,7 0,224 Jogador CFC 0,034 0,008 0,000 Geras RELV 0,083 0,039 0,034 CP -0,02 0,006 0,039 ESPEC 7,5e -6 4,30e -6 0,08 CATA -0,26 0,050 0,0 TJOGO 4,368,07 0,000 CATA2 0,342 0,056 0,000 Dsc- CCA -0,083 0,026 0,00 CAS 0,270 0,030 0,000 Plnares CCV -0,496 0,0 0,000 CAS 2 0,030 0,007 0,000 FCAV 0,20 0,042 0,004 FFC -0,042 0,007 0,000 Guarda- CSC 0,059 0,04 0,000 FATA -0,7 0,049 0,07 -redes FSC -0,00 0,03 0,000 FATA2-0,50 0,056 0,000 FAS -0,350 0,034 0,000 g.l. graus de lberdade SS e MS somatóro e méda do somatóro dos quadrados. b e s(b ) estmatvas do coefcente e do seu desvo padrão para a varável. Sg. t nível de sgnfcânca do teste t de Student.

22 O novo modelo 2 GMGS ntroduz também um aumento do coefcente de determnação, relatvamente ao modelo ncal, para 62%, dmnução do desvo padrão e níves de sgnfcânca nferores a 5% para as varáves, com excepção apenas de uma delas. As varáves partlhadas com o modelo contrbuem todas da mesma forma para o resultado do jogo, com excepção do factor CATA, para as estatístcas de ataque (ataques, cruzamentos e remates) da equpa que actua em casa, que nfluenca negatvamente o resultado da equpa que joga em casa, o que não sera de esperar à partda. A varável tempo jogado (% do tempo total) favorece o resultado para a equpa que actua perante o seu públco VALIDAÇÃO DOS MODELOS DE REGRESSÃO Os modelos de regressão devem cumprr determnados pressupostos, cuja verfcação valda os modelos desenvolvdos. Deste modo, torna-se necessára a concretzação de testes estatístcos, que ncluem análse gráfca de resíduos, estudo da multcolneardade (correlação entre varáves ndependentes), análse da homocedastcdade (varânca constante dos termos de erro) e medda da autocorrelação, com o objectvo de valdar os modelos. Em prmero lugar será verfcada a homocedastcdade que, etmologcamente sgnfca varânca constante. Resultando um resíduo da dferença entre os valores prevstos pelo modelo e os valores observados, um dos processos alternatvos para analsar a homocedastcdade consste em observar a relação entre os resíduos estandardzados e os valores estmados estandardzados da varável dependente. No gráfco n.º 8 lustra-se esta relação, para o valor absoluto dos resíduos estandardzados, que torna mas fácl a análse gráfca. Gráfco n.º 8. Relação entre resíduos e valores estmados estandardzados Resíduos estandardzados (valor absoluto) Modelo - VED Resíduos estandardzados (valor absoluto) Modelo 2 - GMGS Valores estmados estandardzados Valores estmados estandardzados No modelo verfca-se uma dspersão lgeramente superor para valores estmados nferores, em valor absoluto, dervada também do tpo de varável dependente. No modelo 2 a ampltude mantém-se aproxmadamente constante em relação ao exo horzontal, pelo que não parece exstr varação da dspersão. Os

23 modelos parecem passíves de ser consderados, quanto a este prmero pressuposto, com alguns cudados para o prmero modelo. Um segundo pressuposto a analsar é a nexstênca de auto-correlação entre as varáves ndependentes, através do teste de Durbn-Watson, que permte verfcar se os termos de erro são ndependentes, ou seja, se o parâmetro de auto-correlação é nulo. A estatístca de teste apresenta o valor de,85 e de,86 para os modelos e 2, respectvamente. Para um nível de sgnfcânca de 5%, o valor crítco consderado para este teste é de,78, pelo que não podemos rejetar a hpótese, para nenhum dos modelos construídos, de que a auto-correlação seja nula. Um tercero pressuposto defne que os resíduos devem segur uma dstrbução normal, podendo ser verfcado pelo teste Kolmogorov-Smrnov (K-S), com a correcção de Lllefors, apresentado no Quadro n.º 2. Quadro n.º 2. Teste à normaldade dos resíduos estandardzados Estatístca K-S (Lllefors) Graus de lberdade Sgnfcânca Modelo 0, ,000 Modelo 2 0, ,052 Exge-se, normalmente, um nível de sgnfcânca de 5% para não rejetar a hpótese dos resíduos segurem uma dstrbução normal, o que sucede apenas para o Modelo 2. Também para este pressuposto, o Modelo exge uma atenção especal. De modo a complementar o estudo da normaldade dos resíduos, apresenta-se o Gráfco n.º 9, que regsta a dferença entre o hstograma da dstrbução das varáves aleatóras resduas e a dstrbução normal, observando-se alguma correspondênca entre a dstrbução das frequêncas relatvas das váras classes defndas para os resíduos e a curva de dstrbução normal, prncpalmente para o Modelo 2. Gráfco n.º 9. Hstograma dos resíduos estandardzados e dstrbução normal 00 Modelo - VED 80 Modelo 2 - GMGS Frequênca Frequênca Resíduos estandardzados Resíduos estandardzados Os desvos à normaldade podem ser anda observados no Gráfco n.º 0, em que se apresentam os gráfcos Q-Q, de modo a lustrar, pelos desvos à lnha oblíqua, as dferenças em relação à dstrbução normal. Verfca-se que estes desvos não

24 apresentam magntude mas elevada para o modelo, pelo que podemos prossegur com a valdação dos modelos. Fnalmente, mporta verfcar o pressuposto da ausênca de multcolneardade, cuja ntensdade pode ser estudada, sumaramente, através da análse da correlação entre as varáves ndependentes. Os maores valores absolutos observados para a correlação são entre as varáves CATA2 e FATA2, cujas maores componentes são dadas pelas recuperações de bola, com valores de (-0,65) e (-0,62) para os modelos e 2, respectvamente, o que não ndca multcolneardade. Gráfco n.º 0. Gráfcos Q-Q dos resíduos estandardzados 3 Modelo - VED 3 Modelo 2 - GMGS Valor estmado normal Valor estmado normal Resíduos estandardzados Resíduos estandardzados O factor de nflação da varânca (FIV) é também uma medda da multcolnearedade, que contablza a nflação sofrda pela varânca dos coefcentes de regressão estmados, provocada pela correlação entre varáves. Pode ser demonstrado que este factor, para uma varável k, é: 2 ( ) ( r ) FIV k =, 2,, p- (5) k = k onde r 2 k corresponde ao coefcente de determnação, quando a varável X k é relaconada, através de um modelo de regressão lnear, com as restantes (p-2) varáves ndependentes. Valores elevado do FIV são ndcadores de multcolneardade, consderando-se valores superores a 0 nfluencadores das estmatvas dos coefcentes de regressão. No Quadro n.º 3 apresentam-se os FIV para as varáves utlzadas nos dos modelos, cujos valores mas elevados não ndcam, de algum modo, a exstênca de multcolneardade.

25 Quadro n.º 3. Factor de nflacção da varânca Modelo - VED Modelo 2 - GMGS Varável FIV Varável FIV Varável FIV Varável FIV Const. CFC,408 Const. CFC,262 RELV,277 CFC 2,206 RELV,279 CP,2 ESPEC,272 CP,244 ESPEC,258 CATA,738 CCA,42 CATA 2,505 TJOGO,369 CATA2 2,336 CCV,259 CATA2 2,303 CCA,399 CAS,67 FCAV,246 CAS,280 CCV,225 CAS 2,459 CDEF,848 FFC,309 FCAV,307 FFC,237 FDEF,777 FATA 2,32 CSC,33 FATA,695 POSSE 2,554 FATA2 2,95 FSC,255 FATA2 2,287 CSC,333 FAS,203 FAS,46 FSC,290 b e s(b ) - estmatvas do coefcente e do seu desvo padrão para a varável. A análse de ambos os modelos construídos permte conclur que podem ser aplcados para os dados estudados, uma vez que cumprem, de um modo geral, os pressupostos analsados, pelo que a sua utlzação para a prevsão dos resultados dos jogos de futebol pode ser realzada. 5. PREVISÃO DOS RESULTADOS DOS JOGOS Um dos objectvos dos modelos de regressão é, precsamente, a prevsão da varável dependente a partr dos valores das varáves ndependentes. Com base nos modelos desenvolvdos é possível cumprr este objectvo, calculando a estmatva do resultado de cada jogo ( Yˆ ), a partr do comportamento das equpas ntervenentes: dados estatístcos, relevantes para o modelo, observados para cada jogo (X, X 2,, X,p- ) e das estmatvas dos coefcentes dos modelos de regressão (b 0, b,, b p- ), apresentadas nos quadros n.º 2 e 3. Yˆ b b X b X b X =, 2,..., n (6) = p, p Estas estmatvas, dos resultados dos jogos, utlzando os modelos desenvolvdos, podem ser, então, comparadas com os resultados efectvamente observados. É também premente efectuar uma análse de sensbldade aos resultados dos jogos prevstos pelos modelos, para o que se calculam ntervalos de confança para as

26 estmatvas do prevsões, sendo utlzado um nível de confança de 95%. Sendo X h o vector coluna consttuído pelos valores das varáves ndependentes, para uma observação em partcular, os lmtes nferor (LI) e superor (LS) do ntervalo de confança, a 95%, podem ser obtdos através da segunte expressão. [ X ] ( 0,025, n p) MSE X ' ( X ' X ) Y ˆ ± t (7) Sendo t o valor da dstrbução t de Student para uma probabldade de 0,025 e para n-p graus de lberdade e X h a matrz transposta de X h. Após o cálculo da prevsão para o valor da varável dependente, bem como dos seus lmtes de confança, que apresentam valores contínuos, mporta transformá-los em valores que representam o resultado de um jogo de futebol, em termos de vtóra, empate ou derrota de uma das equpas, objectvo atngdo através de análse que se apresenta segudamente. Nas duas épocas estudadas, foram dsputados 62 jogos, tendo ocorrdo 304 vtóras da equpa que joga em casa (VC), 74 empates (E) e 34 vtóras das equpas que actuam fora (VF). Esta dstrbução dos três resultados possíves, para o período em análse: 49,7% VC, 28,4% E e 2,9% VF apresenta valores semelhantes aos verfcados em outros períodos de tempo. Se calcularmos, por exemplo, a dstrbução dos resultados para as ses épocas de futebol, em que o campeonato decorreu em condções semelhantes às actuas (com 8 equpas e três pontos atrbuídos à vtóra), desde 94/95 até 99/2000, verfcam-se os seguntes valores: 50,3% VC, 26,4% E e 23,3% VF. Esta constânca da dstrbução de resultados consubstanca o passo segunte: a elaboração de regras de decsão para defnr os resultados dos jogos em função dos valores prevstos pelos modelos para as varáves dependentes utlzadas. As regras de decsão, apresentadas no Quadro n.º 4, consstem em que: Para o Modelo VED, consdera-se vtóra da equpa da casa quando o valor prevsto para a varável dependente é superor a,37, vtóra da equpa que joga fora quando o valor prevsto é nferor a 0,90 e empate nos restantes casos. No Modelo 2 GMGS, a valores prevstos, para a varável dependente, superores a 0,50 corresponde uma vtóra casera, nferores a 0,25 ndcam vtóra forastera e aos restantes está assocado o empate. Deste modo, a dstrbução dos três resultados possíves, prevstos pelos modelos desenvolvdos, é dêntca à dstrbução observada para os 62 jogos em análse: as dferenças percentuas observadas, nas frequêncas relatvas de cada resultado, são mínmas. h h

27 Quadro n.º 4. Regras de decsão para defnr os resultados dos jogos ( Yˆ ) Frequênca Modelo - VED Modelo 2 - GMGS Resultado Observada Regra de decsão Frequênca Regra de decsão Frequênca VC 49,7% Y ˆ >, 37 49,8% Yˆ > 0, 50 50,% E 28,4% 0,90 < Yˆ <, 37 28,2% 0,25 < Yˆ < 0, 50 28,2% VF 2,9% Yˆ < 0, 90 22,% Yˆ < 0, 25 2,8% As equpas ntervenentes em cada jogo são representadas, em todos os quadros e gráfcos seguntes, por uma abrevatura com três dígtos, de acordo com o Quadro n.º 5. Quadro n.º 5 Abrevaturas dos nomes das equpas ACA Académca CAM Campomaorense MAR Marítmo ALV Alverca CHA Desp. Chaves POR Porto BEI Bera-mar EST Estrela Amadora RIO Ro Ave BEL Belenenses FAR Farense SAL Salgueros BEN Benfca GIL Gl Vcente SCL Santa Clara BOA Boavsta GUI Gumarães SET Vt. Setúbal BRA Sp. Braga LEI U. Lera SPO Sportng Estabelecdas as regras de decsão, torna-se possível efectuar a prevsão do resultado de cada um dos jogos, utlzando os modelos de regressão. No Quadro n.º 6 são apresentadas as prevsões calculadas com ambos os modelos, a título de exemplo, para os jogos entre os quatro prmeros classfcados de cada uma das épocas estudadas e comparadas com os resultados efectvamente observados. Os jogos são apresentados por ordem cronológca. Importa explcar que os resultados dos jogos (Res.) são representados pelos pontos atrbuídos à equpa que joga em casa, cujos sgnfcados são, de acordo com a smbologa já utlzada, 3 VC, E e 0 VF. Na prmera coluna é dentfcado o jogo em análse, bem como o resultado verfcado, em termos de golos marcados, golos sofrdos e pontos obtdos, relatvos à equpa que actua em casa. Para os dos modelos desenvolvdos são calculadas as estmatvas do valor da varável dependente e dos seus lmtes de confança, a 95%, bem como os resultados correspondentes, de acordo com as regras de decsão estabelecdas e a análse da sua concordânca ($) ou não (%) com o resultado efectvamente observado. Analse-se, a título de exemplo, o últmo jogo apresentado da temporada de 999/2000, que podera decdr o título: Sportng-Benfca (0-). Ambos os modelos preconzam uma vtóra do Sportng, através da estmatva da varável dependente, resultado do jogo, a partr dos dados estatístcos. Apenas o lmte de confança nferor, para um grau de confança de 95%, permte chegar à conclusão de que o

28 resultado podera ser um empate, mas nenhum dos modelos estma o resultado que realmente se verfcou, uma vtóra do Benfca. Quadro n.º 6 Resultados dos jogos: valores observados e prevstos Campeonato de 998/999 Valor Observado Modelo VED Modelo 2 - GMGS Jogo (GM-GS) Res. Yˆ Res. LI Res. LS Res. Yˆ Res. LI Res. LS Res. POR-BOA (0-2) 0-0,44 0 $ -0,67 0 $ -0,2 0 $ -,69 0 $ -2,06 0 $ -,32 0 $ BOA-BEN (2-) 3 0,03 0 % -0,25 0 % 0,3 0 % -,86 0 % -2,38 0 % -,34 0 % BOA-SPO (2-2) -0,08 0 % -0,3 0 % 0,4 0 % -2,03 0 % -2,47 0 % -,59 0 % POR-BEN (3-) 3 2,25 3 $ 2,03 3 $ 2,48 3 $ 2,6 3 $ 2,2 3 $ 3,02 3 $ POR-SPO (3-2) 3,38 3 $,8 %,58 3 $ 0,73 3 $ 0,37 %,09 3 $ SPO-BEN (-2) 0 0,44 0 $ 0,7 0 $ 0,7 0 $ -0,9 % -0,62 0 $ 0,25 % BOA-POR (0-0),06 $ 0,89 0 %,23 $ -0,36 0 % -0,68 0 % -0,09 $ BEN-BOA (0-3) 0,05 % 0,7 0 $,40 3 % 0,74 3 % 0,5 %,32 3 % BEN-POR (-),60 3 %,4 3 %,78 3 % 0,09 $ -0,24 $ 0,42 $ SPO-BOA (-),64 3 %,44 3 %,83 3 % 0,70 3 % 0,42 $ 0,97 3 % SPO-POR (-),53 3 %,36 $,69 3 %,5 3 %,27 3 %,75 3 % BEN-SPO (3-3),7 $ 0,89 0 %,44 3 % 0,9 $ -0,3 0 % 0,68 3 % Campeonato de 999/2000 Valor Observado Modelo - VED Modelo 2 - GMGS Jogo (GM-GS) Res. Yˆ Res. LI Res. LS Res. Yˆ Res. LI Res. LS Res. BOA-POR (-),20 $,07 $,34 $ 0,22 $ -0,03 $ 0,46 $ SPO-BOA (2-0) 3,80 3 $,62 3 $,99 3 $,30 3 $ 0,97 3 $,64 3 $ BEN-BOA (-) 0,97 $ 0,73 0 %,20 $ -0,5 $ -0,54 0 % 0,25 $ POR-SPO (3-0) 3,9 3 $,65 3 $ 2,7 3 $ 2,35 3 $,95 3 $ 2,75 3 $ POR-BEN (2-0) 3 2,06 3 $,84 3 $ 2,28 3 $,04 3 $ 0,68 3 $,40 3 $ BEN-SPO (0-0),4 $ 0,8 0 %,47 3 % 0,68 3 % 0,08 $,28 3 % POR-BOA (-0) 3,55 3 $,4 3 $,70 3 $,3 3 $ 0,89 3 $,37 3 $ BOA-SPO (0-) 0 0,7 0 $ 0,53 0 $ 0,89 0 $ -0,29 0 $ -0,58 0 $ 0,00 % BOA-BEN (-) 0,58 0 % 0,40 0 % 0,76 0 % -0,8 0 % -,2 0 % -0,50 0 % SPO-POR (2-0) 3,96 3 $,70 3 $ 2,22 3 $ 0,40 % -0,08 % 0,87 3 $ BEN-POR (-0) 3,5 % 0,98 %,3 % 0,2 % -0,09 % 0,5 3 $ SPO-BEN (0-) 0,59 3 %,36 %,82 3 % 0,58 3 % 0,8 % 0,99 3 % Os modelos permtem efectuar as prevsões da varável dependente, resultado do jogo, para todas as observações, à excepção de um deles, ACA-SAL (0-), para o qual não estão dsponíves dados estatístcos, tal como já fo referdo anterormente.

29 Aplcando os modelos a todos os jogos, podem calcular-se as classfcações fnas das equpas estmadas pelos modelos, através do somatóro de pontos consegudos por cada equpa e compará-las com as classfcações efectvamente verfcadas, como pode observar-se no Quadro n.º 7. Para uma análse mas detalhada, dvdem-se os pontos totas em pontos obtdos em casa e fora e apresentam-se, para cada modelo, os lmtes nferores e superores da classfcação fnal, tendo por base os lmtes de confança, a 95%, para o por e melhor resultado, respectvamente, de cada equpa, em cada jogo. A título de nformação adconal, verfca-se que o modelo VED estma resultados dferentes dos observados para 246 jogos e relatvamente ao modelo 2 GMGS, exstem 256 jogos nestas condções. Os dos modelos orgnam prevsões dferentes, entre ambos, em 40 jogos. Quadro n.º 7. Classfcações fnas observadas e estmadas pelos modelos Campeonato de 999/2000 Total de pontos Pontos em casa Pontos fora Mod. -VED Mod. 2-GMGS Obs. VED GMGS Obs. VED GMGS Obs. LI Mod. LS LI Mod. LS SPO POR BEN BOA GIL MAR GUI EST BRA LEI ALV BEL CAM FAR SAL RIO SET SCL

30 Campeonato de 998/999 Total de pontos Pontos em casa Pontos fora Mod. -VED Mod. 2-GMGS Obs. VED GMGS Obs. VED GMGS Obs. LI Mod. LS LI Mod. LS POR BOA BEN SPO SET LEI GUI EST BRA MAR FAR SAL CAM ALV RIO BEI CHA ACA De modo a sstematzar a análse de como a classfcação estmada pelos modelos dfere da observada, no Quadro n.º 8 ndcam-se as alterações classfcatvas resultantes das estmatvas obtdas pelos modelos, com a ndcação de manutenção (=), subda (&n) ou descda ('n) de n posções na tabela. Quadro n.º 8. Comparação das classfcações estmadas com as observadas Classfcações da época de 999/2000 Classfcações da época de 998/999 Observada Mod. VED Mod. GMGS Observada Mod. VED Mod. GMGS SPO 77 SPO 73 = SPO 67 = POR 79 POR 7 = POR 73 = POR 73 MAR 64 &4 BEN 66 & BOA 7 BOA 65 = BEN 64 & BEN 69 POR 62 ' POR 65 ' BEN 65 SET 63 &2 BOA 6 ' BOA 55 BEN 58 ' MAR 57 &2 SPO 63 BEN 62 ' SPO 60 = GIL 53 EST 53 &3 EST 56 &3 SET 53 SPO 62 ' BRA 59 &4 MAR 50 GIL 49 ' GUI 50 & LEI 52 GUI 52 & SET 56 ' GUI 48 SET 48 &0 RIO 46 &9 GUI 50 BRA 5 &2 GUI 56 = EST 45 GUI 45 ' GIL 45 '3 EST 45 EST 50 = EST 5 = BRA 43 RIO 45 &7 SCL 44 &9 BRA 42 BEI 49 &7 FAR 42 &2 LEI 42 SCL 44 &8 BOA 42 '6 MAR 4 LEI 46 '4 BEI 4 &6 ALV 4 BOA 42 '7 SET 4 &6 FAR 39 RIO 4 &4 ACA 40 &7 BEL 40 BRA 42 '3 ALV 39 ' SAL 38 FAR 39 ' LEI 38 '6 CAM 36 BEL 39 ' CAM 39 = CAM 37 CAM 35 = MAR 38 '3 FAR 35 SAL 38 & BRA 38 '5 ALV 35 MAR 33 '4 ALV 35 = SAL 34 CAM 34 '2 FAR 35 ' RIO 35 ALV 32 ' SAL 34 '3 RIO 33 FAR 34 '2 LEI 3 '6 BEI 33 ACA 30 &2 CAM 34 '3 SET 33 LEI 30 '7 SAL 3 '2 CHA 25 CHA 28 = RIO 3 '2 SCL 3 ALV 28 '7 BEL 30 '6 ACA 2 SAL 27 '6 CHA 29 '

31 Ambos os modelos confrmam, através dos seus resultados, os vencedores de ambos os campeonatos e ndcam subdas sgnfcatvas, em 999/2000, para o Marítmo, Est. Amadora, Setúbal, Ro Ave e Santa Clara, que obtveram uma classfcação nferor à estmada pelos modelos e descdas sgnfcatvas para o Boavsta, Braga, Lera, Alverca e Belenenses, que obtveram resultados acma dos estmados. Na temporada anteror, em 998/99, as subdas mas sgnfcatvas estmadas pelos modelos são do Braga, Bera-mar e Académca, sendo as descdas relevantes para o Lera, Marítmo e Salgueros. No entanto, pode colocar-se uma questão: se a regra de decsão fosse outra ou se o modelo tvesse uma estrutura dferente, qual a nfluênca nos resultados prevstos pelo modelo? Uma abordagem à resposta a esta questão pode ser obtda através de uma análse de sensbldade aos resultados, utlzando os lmtes dos ntervalos de confança, a 95%, para as prevsões pelos modelos, dos valores estmados das classfcações fnas, para cada temporada, já apresentados no Quadro n.º 7 e lustrados pelo Gráfco n.º. Estes lmtes dão uma dea da varação que pode ocorrer nas classfcações fnas estmadas pelos modelo, por varações pontuas do resultado estmado de cada jogo. A análse deste gráfco permte vsualzar, faclmente, a comparação entre os valores observados para a pontuação obtda na classfcação fnal, por cada equpa e os mesmos valores prevstos pelos modelos de regressão lnear, já nterpretada anterormente, para as equpas com maores dferenças. Os ntervalos de confança, prevstos por ambos os modelos, apresentam alguma concordânca entre s e ncluem, na maora dos casos, os valores observados das classfcações. Gráfco n.º. Análse de sensbldade à classfcação fnal estmada Época de 999/2000

32 Época de 998/999 Classfcações: observada. prevsta pelo Modelo VED e - respectvo ntervalo de confança, a 95%. prevsta pelo Modelo 2 GMGS e - respectvo ntervalo de confança, a 95%. 6. CONSIDERAÇÕES FINAIS Os procedmentos que dão orgem aos modelos de regressão permtem exemplfcar o desenvolvmento e aplcação de um modelo de regressão para estudos observaconas explcatvos, lustrando os város passos que vão sendo tomados. Os modelos desenvolvdos, após a elmnação de outlers, respetam os pressupostos exgdos para modelos de regressão, apresentando a sua aplcação, aos resultados dos jogos de futebol do campeonato naconal, alguma sustentabldade. No entanto, partndo de outros prsmas, no que dz respeto à análse dos resultados dos jogos de futebol, em função das estatístcas dsponíves, poderão ser elaborados outros modelos, com varações mas ou menos relevantes, mas com resultados que também podem ser sgnfcatvos. Será mportante verfcar a aplcação dos modelos a um conjunto superor de observações e as alterações por elas provocadas nas estmatvas dos coefcentes dos modelos e até nas varáves que os ntegram, através do estudo de futuras épocas do campeonato naconal de futebol. É de referr que os lmtes dos ntervalos de confança, a 95%, provocam alterações sgnfcatvas nos resultados dos modelos, devdo a estes apresentarem uma varabldade consderável, quanto à prevsão dos resultados, facto que se deve, certamente à aleatoredade assocada a um desafo de futebol, que não passa de um

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

PRESSUPOSTOS DO MODELO DE REGRESSÃO

PRESSUPOSTOS DO MODELO DE REGRESSÃO PREUPOTO DO MODELO DE REGREÃO A aplcação do modelo de regressão lnear múltpla (bem como da smples) pressupõe a verfcação de alguns pressupostos que condensamos segudamente.. Os erros E são varáves aleatóras

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca

Leia mais

4 Critérios para Avaliação dos Cenários

4 Critérios para Avaliação dos Cenários Crtéros para Avalação dos Cenáros É desejável que um modelo de geração de séres sntétcas preserve as prncpas característcas da sére hstórca. Isto quer dzer que a utldade de um modelo pode ser verfcada

Leia mais

Métodos Avançados em Epidemiologia

Métodos Avançados em Epidemiologia Unversdade Federal de Mnas Geras Insttuto de Cêncas Exatas Departamento de Estatístca Métodos Avançados em Epdemologa Aula 5-1 Regressão Lnear Smples: Estmação e Interpretação da Reta Tabela ANOVA e R

Leia mais

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) UNDADE V DELNEAMENTO NTERAMENTE CASUALZADO (DC) CUABÁ, MT 015/ PROF.: RÔMULO MÔRA romulomora.webnode.com 1. NTRODUÇÃO Este delneamento apresenta como característca prncpal a necessdade de homogenedade

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ 1 É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

1. CORRELAÇÃO E REGRESSÃO LINEAR

1. CORRELAÇÃO E REGRESSÃO LINEAR 1 CORRELAÇÃO E REGREÃO LINEAR Quando deseja-se estudar se exste relação entre duas varáves quanttatvas, pode-se utlzar a ferramenta estatístca da Correlação Lnear mples de Pearson Quando essa correlação

Leia mais

Associação entre duas variáveis quantitativas

Associação entre duas variáveis quantitativas Exemplo O departamento de RH de uma empresa deseja avalar a efcáca dos testes aplcados para a seleção de funconáros. Para tanto, fo sorteada uma amostra aleatóra de 50 funconáros que fazem parte da empresa

Leia mais

7 - Distribuição de Freqüências

7 - Distribuição de Freqüências 7 - Dstrbução de Freqüêncas 7.1 Introdução Em mutas áreas há uma grande quantdade de nformações numércas que precsam ser dvulgadas de forma resumda. O método mas comum de resumr estes dados numércos consste

Leia mais

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Regressão Múltipla. Parte I: Modelo Geral e Estimação Regressão Múltpla Parte I: Modelo Geral e Estmação Regressão lnear múltpla Exemplos: Num estudo sobre a produtvdade de trabalhadores ( em aeronave, navos) o pesqusador deseja controlar o número desses

Leia mais

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo 3 Metodologa de Avalação da Relação entre o Custo Operaconal e o Preço do Óleo Este capítulo tem como objetvo apresentar a metodologa que será empregada nesta pesqusa para avalar a dependênca entre duas

Leia mais

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS 1 A análse de dagnóstco (ou dagnóstco do ajuste) confgura uma etapa fundamental no ajuste de modelos de regressão. O objetvo prncpal da análse de dagnóstco

Leia mais

DELINEAMENTOS EXPERIMENTAIS

DELINEAMENTOS EXPERIMENTAIS SUMÁRIO 1 Delneamentos Expermentas 2 1.1 Delneamento Interamente Casualzado..................... 2 1.2 Delneamento Blocos Casualzados (DBC).................... 3 1.3 Delneamento Quadrado Latno (DQL)......................

Leia mais

2 Incerteza de medição

2 Incerteza de medição 2 Incerteza de medção Toda medção envolve ensaos, ajustes, condconamentos e a observação de ndcações em um nstrumento. Este conhecmento é utlzado para obter o valor de uma grandeza (mensurando) a partr

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Constata-se, freqüentemente, a estênca de uma relação entre duas (ou mas) varáves. Se tal relação é de natureza quanttatva, a correlação é o nstrumento adequado para descobrr e medr

Leia mais

Cap. IV Análise estatística de incertezas aleatórias

Cap. IV Análise estatística de incertezas aleatórias TLF 010/11 Cap. IV Análse estatístca de ncertezas aleatóras Capítulo IV Análse estatístca de ncertezas aleatóras 4.1. Méda 43 4.. Desvo padrão 44 4.3. Sgnfcado do desvo padrão 46 4.4. Desvo padrão da méda

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-4 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Programa do curso: Semana Conteúdo Apresentação da dscplna. Prncípos de modelos lneares de regressão.

Leia mais

Análise de Regressão

Análise de Regressão Análse de Regressão método estatístco que utlza relação entre duas ou mas varáves de modo que uma varável pode ser estmada (ou predta) a partr da outra ou das outras Neter, J. et al. Appled Lnear Statstcal

Leia mais

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência. MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada,

Leia mais

REGRESSÃO NÃO LINEAR 27/06/2017

REGRESSÃO NÃO LINEAR 27/06/2017 7/06/07 REGRESSÃO NÃO LINEAR CUIABÁ, MT 07/ Os modelos de regressão não lnear dferencam-se dos modelos lneares, tanto smples como múltplos, pelo fato de suas varáves ndependentes não estarem separados

Leia mais

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 014 Estatístca Descrtva e Análse Exploratóra Etapas ncas. Utlzadas para descrever e resumr os dados. A dsponbldade de uma grande quantdade de dados e de

Leia mais

Estatística II Antonio Roque Aula 18. Regressão Linear

Estatística II Antonio Roque Aula 18. Regressão Linear Estatístca II Antono Roque Aula 18 Regressão Lnear Quando se consderam duas varáves aleatóras ao mesmo tempo, X e Y, as técncas estatístcas aplcadas são as de regressão e correlação. As duas técncas estão

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ Em mutas stuações duas ou mas varáves estão relaconadas e surge então a necessdade de determnar a natureza deste relaconamento. A análse

Leia mais

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro. Aplcação Por exemplo, se prepararmos uma área expermental com todo cudado possível e fzermos, manualmente, o planto de 100 sementes seleconadas de um mlho híbrdo, cudando para que as sementes fquem na

Leia mais

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall Sstemas Intelgentes Aplcados Carlos Hall Programa do Curso Lmpeza/Integração de Dados Transformação de Dados Dscretzação de Varáves Contínuas Transformação de Varáves Dscretas em Contínuas Transformação

Leia mais

Testes não-paramétricos

Testes não-paramétricos Testes não-paramétrcos Prof. Lorí Val, Dr. http://www.mat.ufrgs.br/val/ val@mat.ufrgs.br Um teste não paramétrco testa outras stuações que não parâmetros populaconas. Estas stuações podem ser relaconamentos,

Leia mais

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA CAPÍTULO DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA. A MÉDIA ARITMÉTICA OU PROMÉDIO Defnção: é gual a soma dos valores do grupo de dados dvdda pelo número de valores. X x Soma dos valores de x número de

Leia mais

Gabarito da Lista de Exercícios de Econometria I

Gabarito da Lista de Exercícios de Econometria I Gabarto da sta de Exercícos de Econometra I Professor: Rogéro lva Mattos Montor: eonardo enrque A. lva Questão Y X y x xy x ŷ ˆ ˆ y ŷ (Y - Y ) (X - X ) (Ŷ - Y ) 360 00-76 -00 35.00 40.000 36-4 30.976 3076

Leia mais

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES NOÇÕES SOBRE CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES 1 O nosso objetvo é estudar a relação entre duas varáves quanttatvas. Eemplos:. Idade e altura das cranças.. v. Tempo de prátca de esportes e rtmo cardíaco

Leia mais

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas 3.6. Análse descrtva com dados agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas

Leia mais

ESTATÍSTICA APLICADA II ANO LECTIVO 2011/2012. Exame Final 26 de Julho de 2012

ESTATÍSTICA APLICADA II ANO LECTIVO 2011/2012. Exame Final 26 de Julho de 2012 ETATÍTICA APLICADA II ANO LECTIVO / Exame Fnal 6 de Julho de Duração : H 3 M Nota: Responder um grupo por folha (utlze frente e verso de cada folha) Em todas as questões apresentar os cálculos efectuados

Leia mais

3 A técnica de computação intensiva Bootstrap

3 A técnica de computação intensiva Bootstrap A técnca de computação ntensva ootstrap O termo ootstrap tem orgem na expressão de língua nglesa lft oneself by pullng hs/her bootstrap, ou seja, alguém levantar-se puxando seu própro cadarço de bota.

Leia mais

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA

Análise de Regressão. Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA Análse de Regressão Profa Alcone Mranda dos Santos Departamento de Saúde Públca UFMA Introdução Uma das preocupações estatístcas ao analsar dados, é a de crar modelos que explctem estruturas do fenômeno

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análse Exploratóra de Dados Objetvos Análse de duas varáves quanttatvas: traçar dagramas de dspersão, para avalar possíves relações entre as duas varáves; calcular o coefcente de correlação entre as duas

Leia mais

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES 1. Obtenha os estmadores dos coefcentes lnear e angular de um modelo de regressão lnear smples utlzando o método

Leia mais

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EATAS DEPARTAMENTO DE ESTATÍSTICA UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Leia mais

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3 FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 3 Nome Nº Turma: Data: / / Professor 10.º Ano Classfcação Apresente o seu racocíno de forma clara, ndcando todos os cálculos que tver de efetuar e todas

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Prncípos de cração de modelos empírcos: Modelos (matemátcos, lógcos, ) são comumente utlzados na

Leia mais

INSTITUTO POLITÉCNICO DE VISEU ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

INSTITUTO POLITÉCNICO DE VISEU ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO Área Centfca Curso Matemátca Engenhara Electrotécnca º Semestre º 00/0 Fcha nº 9. Um artgo da revsta Wear (99) apresenta dados relatvos à vscosdade do óleo e ao desgaste do aço maco. A relação entre estas

Leia mais

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média. Estatístca Dscplna de Estatístca 0/ Curso de Admnstração em Gestão Públca Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos uns dos

Leia mais

Escola Superior de Tecnologia de Viseu. Fundamentos de Estatística 2006/2007 Ficha nº 7

Escola Superior de Tecnologia de Viseu. Fundamentos de Estatística 2006/2007 Ficha nº 7 Escola Superor de Tecnologa de Vseu Fundamentos de Estatístca 006/00 Fcha nº. Um artgo da revsta Wear (99) apresenta dados relatvos à vscosdade do óleo e ao desgaste do aço maco. A relação entre estas

Leia mais

Gráficos de Controle para Processos Autocorrelacionados

Gráficos de Controle para Processos Autocorrelacionados Gráfcos de Controle para Processos Autocorrelaconados Gráfco de controle de Shewhart: observações ndependentes e normalmente dstrbuídas. Shewhart ao crar os gráfcos de controle não exgu que os dados fossem

Leia mais

MODELOS DE REGRESSÃO PARAMÉTRICOS

MODELOS DE REGRESSÃO PARAMÉTRICOS MODELOS DE REGRESSÃO PARAMÉTRICOS Às vezes é de nteresse nclur na análse, característcas dos ndvíduos que podem estar relaconadas com o tempo de vda. Estudo de nsufcênca renal: verfcar qual o efeto da

Leia mais

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear normal com erros heterocedástcos O método de mínmos quadrados ponderados Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear clássco com erros heterocedástcos O método de mínmos quadrados ponderados 1 Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

2ª Atividade Formativa UC ECS

2ª Atividade Formativa UC ECS I. Explque quando é que a méda conduz a melhores resultados que a medana. Dê um exemplo para a melhor utlzação de cada uma das meddas de localzação (Exame 01/09/2009). II. Suponha que um professor fez

Leia mais

ANÁLISE DE ESTRUTURAS I INTRODUÇÃO AO MÉTODO DE CROSS

ANÁLISE DE ESTRUTURAS I INTRODUÇÃO AO MÉTODO DE CROSS DECvl ANÁLISE DE ESTRUTURAS I INTRODUÇÃO AO ÉTODO DE CROSS Orlando J. B. A. Perera 20 de ao de 206 2 . Introdução O método teratvo ntroduzdo por Hardy Cross (Analyss of Contnuous Frames by Dstrbutng Fxed-End

Leia mais

Programa de Certificação de Medidas de um laboratório

Programa de Certificação de Medidas de um laboratório Programa de Certfcação de Meddas de um laboratóro Tratamento de dados Elmnação de dervas Programa de calbração entre laboratóros Programa nterno de calbração justes de meddas a curvas Tratamento dos resultados

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análse Exploratóra de Dados Objetvos Análse de duas varáves quanttatvas: obter uma reta que se ajuste aos dados segundo o crtéro de mínmos quadrados; apresentar outros crtéros para a determnação de uma

Leia mais

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011

PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 2010/2011 Instruções: PROVA DE ESTATÍSTICA & PROBABILIDADES SELEÇÃO MESTRADO/UFMG 00/0 Cada uestão respondda corretamente vale (um) ponto. Cada uestão respondda ncorretamente vale - (menos um) ponto. Cada uestão

Leia mais

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma Capítulo 8 Dferencação Numérca Quase todos os métodos numércos utlzados atualmente para obtenção de soluções de equações erencas ordnáras e parcas utlzam algum tpo de aproxmação para as dervadas contínuas

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16% Análse de Rsco 1 RISCO Rsco possbldade de perda. Quanto maor a possbldade, maor o rsco. Exemplo: Empresa X va receber $ 1.000 de uros em 30 das com títulos do governo. A empresa Y pode receber entre $

Leia mais

ANÁLISE DA VARIÂNCIA DA REGRESSÃO

ANÁLISE DA VARIÂNCIA DA REGRESSÃO ANÁLISE DA VARIÂNCIA DA REGRESSÃO PROCEDIMENTO GERAL DE REGRESSÃO Em um modelo de análse de varânca, como no DIA, o fator em estudo pode ser quanttatvo ou qualtatvo. FATOR QUANTITATIVO: é aquele cujos

Leia mais

CURSO de ESTATÍSTICA Gabarito

CURSO de ESTATÍSTICA Gabarito UNIVERSIDADE FEDERAL FLUMINENSE TRANSFERÊNCIA o semestre letvo de 010 e 1 o semestre letvo de 011 CURSO de ESTATÍSTICA Gabarto INSTRUÇÕES AO CANDIDATO Verfque se este caderno contém: PROVA DE REDAÇÃO com

Leia mais

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4 FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 4 Nome Nº Turma: Data: / / Professor 10.º Ano Classfcação Apresente o seu racocíno de forma clara, ndcando todos os cálculos que tver de efetuar e todas

Leia mais

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária. Modelagem multvarável com varáves quanttatvas e qualtatvas, com resposta bnára. O modelo de regressão não lnear logístco ou modelo logístco é utlzado quando a varável resposta é qualtatva com dos resultados

Leia mais

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média. Estatístca Dscplna de Estatístca 0/ Curso Superor de tecnólogo em Gestão Ambental Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos

Leia mais

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 1

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 1 FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 1 Nome Nº Turma: Data: / / Professor 10.º Ano Classfcação Apresente o seu racocíno de forma clara, ndcando todos os cálculos que tver de efetuar e todas

Leia mais

Contabilometria. Aula 8 Regressão Linear Simples

Contabilometria. Aula 8 Regressão Linear Simples Contalometra Aula 8 Regressão Lnear Smples Orgem hstórca do termo Regressão Le da Regressão Unversal de Galton 1885 Galton verfcou que, apesar da tendênca de que pas altos tvessem flhos altos e pas axos

Leia mais

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Capítulo 1. Exercício 5. Capítulo 2 Exercício UNIVERSIDADE FEDERAL DE GOIÁS CIÊNCIAS ECONÔMICAS ECONOMETRIA (04-II) PRIMEIRA LISTA DE EXERCÍCIOS Exercícos do Gujarat Exercíco 5 Capítulo Capítulo Exercíco 3 4 5 7 0 5 Capítulo 3 As duas prmeras demonstrações

Leia mais

Análise de Variância. Comparação de duas ou mais médias

Análise de Variância. Comparação de duas ou mais médias Análse de Varânca Comparação de duas ou mas médas Análse de varânca com um fator Exemplo Um expermento fo realzado para se estudar dabetes gestaconal. Desejava-se avalar o comportamento da hemoglobna (HbA)

Leia mais

Cap. 11 Correlação e Regressão

Cap. 11 Correlação e Regressão Estatístca para Cursos de Engenhara e Informátca Pedro Alberto Barbetta / Marcelo Menezes Res / Antono Cezar Borna São Paulo: Atlas, 2004 Cap. 11 Correlação e Regressão APOIO: Fundação de Apoo à Pesqusa

Leia mais

Aula Características dos sistemas de medição

Aula Características dos sistemas de medição Aula - Característcas dos sstemas de medção O comportamento funconal de um sstema de medção é descrto pelas suas característcas (parâmetros) operaconas e metrológcas. Aqu é defnda e analsada uma sére destes

Leia mais

Regressão Linear Simples by Estevam Martins

Regressão Linear Simples by Estevam Martins Regressão Lnear Smples by Estevam Martns stvm@uol.com.br "O únco lugar onde o sucesso vem antes do trabalho, é no dconáro" Albert Ensten Introdução Mutos estudos estatístcos têm como objetvo estabelecer

Leia mais

Reconhecimento Estatístico de Padrões

Reconhecimento Estatístico de Padrões Reconhecmento Estatístco de Padrões X 3 O paradgma pode ser sumarzado da segunte forma: Cada padrão é representado por um vector de característcas x = x1 x2 x N (,,, ) x x1 x... x d 2 = X 1 X 2 Espaço

Leia mais

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos Curso de extensão, MMQ IFUSP, feverero/4 Alguns exercíco báscos I Exercícos (MMQ) Uma grandeza cujo valor verdadero x é desconhecdo, fo medda três vezes, com procedmentos expermentas dêntcos e, portanto,

Leia mais

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA APLICAÇÃO NO CONTROLE DE QUALIDADE DE FÁRMACOS Prof. Dr. Marcelo Martns de Sena MÓDULO 04 Undade Unverstára de Cêncas Eatas e Tecnológcas UnUCET Anápols 1 MÓDULO 04

Leia mais

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro UNIVERIDADE DE ÃO PAULO FACULDADE DE ECONOMIA, ADMINITRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE ADMINITRAÇÃO RAD1507 Estatístca Aplcada à Admnstração I Prof. Dr. Evandro Marcos adel Rbero

Leia mais

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma:

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma: Professora Janete Perera Amador 1 8 Meddas Descrtvas Vmos anterormente que um conjunto de dados pode ser resumdo através de uma dstrbução de freqüêncas, e que esta pode ser representada através de uma

Leia mais

Representação e Descrição de Regiões

Representação e Descrição de Regiões Depos de uma magem ter sdo segmentada em regões é necessáro representar e descrever cada regão para posteror processamento A escolha da representação de uma regão envolve a escolha dos elementos que são

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

Redução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma

Redução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma Redução dos Dados Júlo Osóro Meddas Característcas da Dstrbução Tendênca Central (Localzação) Varação (Dspersão) Forma 1 Meddas Característcas da Dstrbução Meddas Estatístcas Tendênca Central Dspersão

Leia mais

5 Implementação Procedimento de segmentação

5 Implementação Procedimento de segmentação 5 Implementação O capítulo segunte apresenta uma batera de expermentos prátcos realzados com o objetvo de valdar o método proposto neste trabalho. O método envolve, contudo, alguns passos que podem ser

Leia mais

6 Análises de probabilidade de ruptura de um talude

6 Análises de probabilidade de ruptura de um talude 6 Análses de probabldade de ruptura de um talude 6.. Introdução No presente capítulo, apresentam-se prevsões de probabldades de ruptura para o talude de jusante da Barragem de Benguê mostrada na fgura

Leia mais

Covariância na Propagação de Erros

Covariância na Propagação de Erros Técncas Laboratoras de Físca Lc. Físca e Eng. omédca 007/08 Capítulo VII Covarânca e Correlação Covarânca na propagação de erros Coefcente de Correlação Lnear 35 Covarânca na Propagação de Erros Suponhamos

Leia mais

ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL

ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL Revsta Matz Onlne ESTUDO DE MODELOS PARA AJUSTE E PREVISÃO DE UMA SÉRIE TEMPORAL Valera Ap. Martns Ferrera Vvane Carla Fortulan Valéra Aparecda Martns. Mestre em Cêncas pela Unversdade de São Paulo- USP.

Leia mais

Análise de Regressão Linear Múltipla VII

Análise de Regressão Linear Múltipla VII Análse de Regressão Lnear Múltpla VII Aula 1 Hej et al., 4 Seções 3. e 3.4 Hpótese Lnear Geral Seja y = + 1 x 1 + x +... + k x k +, = 1,,..., n. um modelo de regressão lnear múltpla, que pode ser escrto

Leia mais

Estatística I Licenciatura MAEG 2006/07

Estatística I Licenciatura MAEG 2006/07 Estatístca I Lcencatura MAEG 006/07 AMOSTRAGEM. DISTRIBUIÇÕES POR AMOSTRAGEM.. Em determnada unversdade verfca-se que 30% dos alunos têm carro. Seleccona-se uma amostra casual smples de 0 alunos. a) Qual

Leia mais

Métodos Experimentais em Ciências Mecânicas

Métodos Experimentais em Ciências Mecânicas Métodos Expermentas em Cêncas Mecâncas Professor Jorge Luz A. Ferrera Sumáro.. Dagrama de Dspersão. Coefcente de Correlação Lnear de Pearson. Flosofa assocada a medda da Estatstca. este de Hpótese 3. Exemplos.

Leia mais

6 Modelo Proposto Introdução

6 Modelo Proposto Introdução 6 Modelo Proposto 6.1. Introdução Neste capítulo serão apresentados detalhes do modelo proposto nesta dssertação de mestrado, onde será utlzado um modelo híbrdo para se obter prevsão de carga curto prazo

Leia mais

Universidade da Beira Interior Departamento de Matemática. Ficha de exercícios nº2: Distribuições Bidimensionais

Universidade da Beira Interior Departamento de Matemática. Ficha de exercícios nº2: Distribuições Bidimensionais Ano lectvo: 2006/2007 Unversdade da Bera Interor Departamento de Matemátca ESTATÍSTICA Fcha de exercícos nº2: Dstrbuções Bdmensonas Curso: Cêncas do Desporto 1. Consdere a segunte tabela de contngênca:

Leia mais

Tabela 1. Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de menores de 5 anos para 20 países, 1992.

Tabela 1. Porcentagem de crianças imunizadas contra DPT e taxa de mortalidade de menores de 5 anos para 20 países, 1992. Regressão Lnear Algumas vezes estamos nteressados não apenas se exste assocação entre duas varáves quanttatvas x e y, mas nós temos também uma hpótese a respeto de uma provável relação de causa e efeto

Leia mais

Capítulo 2. Modelos de Regressão

Capítulo 2. Modelos de Regressão Capítulo 2 Modelos de regressão 39 Capítulo 2 Modelos de Regressão Objetvos do Capítulo Todos os modelos são errados, mas alguns são útes George E P Box Algumas vezes fcamos assustados quando vemos engenheros

Leia mais

Variável discreta: X = número de divórcios por indivíduo

Variável discreta: X = número de divórcios por indivíduo 5. Análse descrtva com dados agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-4 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Programa do curso: Semana Conteúdo Apresentação da dscplna. Prncípos de modelos lneares de regressão.

Leia mais

8 - Medidas Descritivas

8 - Medidas Descritivas 8 - Meddas Descrtvas 8. Introdução Ao descrevemos um conjunto de dados por meo de tabelas e gráfcos temos muto mas nformações sobre o comportamento de uma varável do que a própra sére orgnal de dados.

Leia mais

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 2

FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 2 FICHA de AVALIAÇÃO de MATEMÁTICA A 10.º Ano Versão 2 Nome Nº Turma: Data: / / Professor 10.º Ano Classfcação Apresente o seu racocíno de forma clara, ndcando todos os cálculos que tver de efetuar e todas

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional. ou experimental. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~vall/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal http://www.mat.ufrgs.br/~vall/ ou expermental. Numa relação

Leia mais

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

DEFINIÇÃO - MODELO LINEAR GENERALIZADO DEFINIÇÃO - MODELO LINEAR GENERALIZADO 1 Um modelo lnear generalzado é defndo pelos seguntes três componentes: Componente aleatóro; Componente sstemátco; Função de lgação; Componente aleatóro: Um conjunto

Leia mais

Análise de Regressão Linear Múltipla IV

Análise de Regressão Linear Múltipla IV Análse de Regressão Lnear Múltpla IV Aula 7 Guarat e Porter, 11 Capítulos 7 e 8 He et al., 4 Capítulo 3 Exemplo Tomando por base o modelo salaro 1educ anosemp exp prev log 3 a senhorta Jole, gerente do

Leia mais

REGRESSÃO LINEAR ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA REGRESSÃO CURVILÍNEA FUNÇÃO QUADRÁTICA

REGRESSÃO LINEAR ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA REGRESSÃO CURVILÍNEA FUNÇÃO QUADRÁTICA ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA REGRESSÃO LINEAR Verfcado, pelo valor de r, que ocorre uma sgnfcante correlação lnear entre duas varáves há necessdade de quantfcar tal relação, o que é feto pela análse

Leia mais

Teoria Elementar da Probabilidade

Teoria Elementar da Probabilidade 10 Teora Elementar da Probabldade MODELOS MATEMÁTICOS DETERMINÍSTICOS PROBABILÍSTICOS PROCESSO (FENÓMENO) ALEATÓRIO - Quando o acaso nterfere na ocorrênca de um ou mas dos resultados nos quas tal processo

Leia mais

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira UNIVERSIDADE DE PERNAMBUCO ESCOLA POLITÉCNICA DE PERNAMBUCO Físca Expermental Prof o José Wlson Vera wlson.vera@upe.br AULA 01: PROCESSOS DE ANÁLISE GRÁFICA E NUMÉRICA MODELO LINEAR Recfe, agosto de 2015

Leia mais

TESTE DO QUI-QUADRADO - Ajustamento

TESTE DO QUI-QUADRADO - Ajustamento Exemplo 3: Avalar se uma moeda ou um dado é honesto; Em 100 lances de moeda, observaram-se 65 coroas e 35 caras. Testar se a moeda é honesta. 1 H 0 : a moeda é honesta; H 1 : a moeda não é honesta; 2 α

Leia mais

TABELAS E GRÁFICOS PARA VARIÁVEIS ALEATÓRIAS QUANTITATIVAS CONTÍNUAS

TABELAS E GRÁFICOS PARA VARIÁVEIS ALEATÓRIAS QUANTITATIVAS CONTÍNUAS TABELAS E GRÁFICOS PARA VARIÁVEIS ALEATÓRIAS QUANTITATIVAS CONTÍNUAS Varável Qualquer característca assocada a uma população Classfcação de varáves Qualtatva { Nomnal sexo, cor dos olhos Ordnal Classe

Leia mais

AULA 4. Segundo Quartil ( Q observações são menores que ele e 50% são maiores.

AULA 4. Segundo Quartil ( Q observações são menores que ele e 50% são maiores. Estatístca Aplcada à Engenhara AULA 4 UNAMA - Unversdade da Amazôna.8 MEDIDA EPARATRIZE ão valores que separam o rol (os dados ordenados) em quatro (quarts), dez (decs) ou em cem (percents) partes guas.

Leia mais