MA 0330 ANÁS MUTVARAA AOS Aálse de orresodêca úla M Pava Soler ava@me.us.br Sem/016
Obetvos: Aálse de orresodêca Varável olua u.a. / Varável ha 1 1 Y 11 Y 1 Y 1 Y 1 Y 1 Y Y Y Y 1 Y Y Y Y 1 Y Y Y detfcar a estrutura dos dados multvarados com Tabelas de otgêca escrever grafcamete os dados dsostos em tabelas de cotgêca de tal forma a reresetar o adrão de assocação etre varáves os vetores lha e os vetores colua da tabela são vsualzados como otos em um esaço vetoral ecomor a estatístca ² do teste de deedêca em tab. de cotgêca TÉNA GRÁFA MUTMNSONA (smlar ao scaloameto!!) (essecalmete descrtva, ão adota qualquer modelo estrutural, auxla a aálse ferecal)
Aálse de orresodêca Ao oral 1976 1977 1978 1979 1980 Total A 64 58 67 59 60 308 B 18 18 3 0 17 96 1 10 9 1 9 5 36 5 34 31 7 153 9 1 5 0 0 115 F 133 115 116 107 89 560 G 34 8 30 6 9 147 H 178 143 180 150 148 799 8 8 5 6 6 33 101 113 143 11 107 576 K 66 56 60 58 53 93 87 69 79 68 69 37 M 3 19 17 19 17 95 N 34 4 9 6 3 136 O 70 56 60 55 50 91 P 9 0 5 19 18 111 Q 46 40 38 38 33 195 R 13 1 149 1 11 68 S 79 68 70 61 57 335 T 130 109 148 110 100 597 U 17 19 15 16 89 Total 13 1139 136 1134 1060 5981 Ao logo de 5 aos, em cada ao, cerca de 1000 essoas de uma cdade foram amostradas e questoadas sobre quas oras, detre 1, eles lam regularmete. omo reresetar o hábto de letura de oras dos cdadãos e sua varação ao logo do temo?
Aálse de orresodêca strbução de 5.387 estudates escoceses de acordo com a cor dos olhos e dos cabelos (Fsher, 1940) or do cabelo or olhos laro Ruvo Médo scuro Preto Total laros 688 116 584 188 4 1580 Azul 36 38 41 110 3 718 Médo 343 84 909 41 6 1774 scuro 98 48 403 681 85 1315 Total 1455 86 137 1391 118 5387 omo descrever grafcamete o adrão de assocação etre as varáves cor dos olhos e dos cabelos dos estudates escoceses?
Aálse de orresodêca strbução dos fucoáros de uma emresa de acordo com o tabagsmo. Hábto de Fumar Fucoáro Não Pouco Médo Muto Total Nível 1 4 3 11 Nível 4 3 7 4 18 Nível 3 5 10 1 4 51 Nível 4 18 4 33 13 88 Nível 5 10 6 7 5 Total 61 45 6 5 193 Para aderr a uma camaha acoal at-tabagsmo, o gerete de Recursos Humaos de uma emresa desea cohecer o hábto de fumar dos fucoáros. Os dados acma foram coletados ara esta faldade. A reresetação gráfca dos dados é, em geral, de fácl etedmeto. omo reresetar o adrão de assocação etre o ível do fucoáro e o hábto de fumar em um gráfco?
Aálse de orresodêca fluêca da dade da adolescete o to de amoro (vertt, 004) Faxa tára < 16 16-17 17-18 18-19 19-0 Nehum amorado 1 1 14 13 8 Namoro sem sexo 8 9 6 8 Namoro com sexo 3 4 10 10 Total 31 33 4 31 0 omo descrever grafcamete o adrão de assocação etre as varáves faxa etára da adolescete e o to de amoro?
Aálse de orresodêca (vertt, 004) m tabelas de cotgêca, é um método de decomosção da estatístca Qu-Quadrado em comoetes que corresodem a exos rcas que mas exlcam a heterogeedade etre as varáves colua (ou lhas) da tabela. Método que smultaeamete atrbu uma escala às lhas e, searadamete, uma escala às coluas da tabela de tal forma a maxmzar a correlação etre as duas escalas. Método de obteção de coordeadas ara reresetar as categoras das varáves lha e colua da tabela, de tal forma que o adrão de assocação sea reresetado grafcamete é uma aálse de scaloameto Multdmesoal ara uma medda de dstâca esecífca ara dados categorzados, cohecda como dstâca Qu- Quadrado.
Aálse de orresodêca e scaloameto Multdmesoal Varável olua Varável ha 1 Total 1 11 1 1 1. 1. 1. Total.1.. Perfs ha Varável olua Varável ha 1 Total 1 11 = 11 / 1. 1 = 1 / 1. 1 1 = 1 /. = /. 1 ;.. Perfs olua Varável olua Varável ha 1 1 11 = 11 /.1 1 = 1 /. 1 = 1 /.1 = /. Total 1 1 ;..
Aálse de orresodêca e scaloameto Multdmesoal Varável olua Varável ha 1 Total 1 11 1 1 1. 1. 1. Total.1.. stâca Qu-Quadrado Perfs ha 1,,..., d has k 1 k k k stâca Qu-Quadrado Perfs olua c 1,,..., d oluas k 1 k k k xtrar as oordeadas Prcas das Matrzes de dstâcas has e oluas resultados equvaletes à solução va dvs de Y e Y que veremos a segur.
Aálse de orresodêca e scaloameto Multdmesoal fluêca da dade da adolescete o to de amoro (vertt, 004) Faxa tára < 16 16-17 17-18 18-19 19-0 Nehum amorado 1 (68) 1 (64) 14 (58) 13 (4) 8 (40) Namoro sem sexo 8 (6) 9 (7) 6 (5) 8 (6) (10) Namoro com sexo (6) 3 (9) 4 (17) 10 (3) 10 (50) Total 31 (100%) 33 (100%) 4 (100%) 31 (100%) 0 (100%) oluas d < 16 16-17 17-18 18-19 19-0 <16 0,00 0,09 0,6 0,66 1,07 16-17 0,00 0,19 0,59 1,01 17-18 0,00 0,41 0,83 18-19 0,00 0,51 19-0 0,00 d has Sem Nam Nam NamSexo Sem Nam 0,00 0,1 0,93 Nam 0,00 0,93 NamSexo 0,00 Obter as coordeadas rcas (va scaloameto Multdmesoal) a artr das matrzes de dstâcas Qu-Quadrado.
omoet Aálse de orresodêca e scaloameto Multdmesoal fluêca da dade da adolescete o to de amoro (vertt, 004) 0,75 P1 P Sem Nam -0,1933 0,0610 Nam -0,194-0,145 Nam Sex 0,73 0,000 <16-0,3547 0,0550 16-17 -0,897-0,0003 17-18 -0,1033-0,0001 18-19 0,806-0,134 19-0 0,7169 0,134 0,50 0,5 0,00-0,5-0,50-0,50 <16 Sem Nam 16-17 17-18 Nam 18-19 -0,5 0,00 0,5 omoet 1 0,50 19-0 Nam Sex 0,75
omoet Aálse de orresodêca e scaloameto Multdmesoal fluêca da dade da adolescete o to de amoro (vertt, 004) P1 P Sem Nam -0,1933 0,0610 Nam -0,194-0,145 Nam Sex 0,73 0,000 <16-0,3547 0,0550 16-17 -0,897-0,0003 17-18 -0,1033-0,0001 18-19 0,806-0,134 19-0 0,7169 0,134 0,75 0,50 0,5 0,00-0,5-0,50-0,50 <16 Sem Nam 16-17 17-18 Nam 18-19 -0,5 0,00 0,5 omoet 1 0,50 19-0 Nam Sex 0,75 d ucld ( 16,16 17) 0,3547 0,897 0,055 0,0003 0, 09 d QuQuad ( 16,16 17) 0,68 0,64 0,6 0,7 0,06 0,09 0,55 0,4 0,1 0,09
Aálse de orresodêca stâca ucldaa etre Vetores de Frequêcas Ao Partdo 1 Partdo Partdo 3 Partdo 4 Partdo 5 Total 00 0,5 0,44 0,1 0,16 0,05 1 006* O 1195 90 545 771 199 5000 170 10 510 780 30 5000 O 1 O O 51 51 strbução da teção de voto de eletores * Resultados arcas de uma esqusa eletoral O: freq. Observadas em 006 : freq. seradas (sob as roorções de 00) 75 170 80 35 9 10 510 780 5 5 51 51 31 14,01 30 statístca de um teste de aderêca stâca ao quadrado etre as freqüêcas observadas e eseradas com esos guas ao verso das freq. eseradas A estatístca é uma medda de dstâca ucldaa ao quadrado oderada
Aálse de orresodêca stâca ucldaa etre Vetores de Frequêcas strbução da teção de voto de eletores Ao Partdo 1 Partdo Partdo 3 Partdo 4 Partdo 5 Total 00 0,5 0,44 0,1 0,16 0,05 1 006* O 1195 90 545 771 199 5000 170 10 510 780 30 5000 1/ O 0,39 0,458 0,109 0,154 0,04 1 1/ 0,54 0,44 0,10 0,156 0,046 1 O,, 1 O O 1 A sgfcâca da estatístca deede do tamaho amostral / é a dstâca ucldaa oderada etre o vetor de freq. relatvas observadas e eseradas (é uma medda da varabldade ou érca etre os erfs).
Aálse de orresodêca stâca ucldaa etre Vetores de Frequêcas 1 1 O O Aálse de orresodêca cosdera a dsersão de vetores de frequêca relatva () em um esaço multdmesoal. O vetor é deomado um erfl de frequêcas relatvas. É calculada a dstâca ucldaa oderada: dstâca etre o vetor de frequêcas relatvas observadas de cada oulação ( ) e o vetor de frequêcas relatvas eserado ( ). A aálse é flexível o setdo de dar esos ( massas ) aos erfs das oulações sob estudo, como veremos a segur.
Aálse de orresodêca Reresetação dos Perfs ha da Tabela Varável olua Varável ha 1 Total 1 11 1 1 1. 1. 1. Total.1.. statístca Qu-Quadrado: O O11 11 O1 1 O ; 1 1 11 1 O 1 1.. O.. 1 1 1 1 1 d d 1 : erfl de freqüêcas relatvas da lha
d Aálse de orresodêca Varável olua Varável ha 1 Total 1 11 1 1 1. 1. 1. Total.1..,,..., ; 1,,..., 1,,..., 1.. 1... k,,..., ; k 1 Reresetação dos Perfs ha da Tabela 1. k etróde (lha) stâca ucldaa oderada ao quadrado do erfl de freqüêcas relatvas da lha ao cetróde omo reresetar tas erfs lha em um esaço multdmesoal?
Aálse de orresodêca Varável olua Varável ha 1 Total 1 11 1 1 1. 1. 1. Total.1...1.. 1,,...,,,..., d 1 O O11 11 O1 1 O ; 1 1 / (): medda de érca total do couto dos erfs. Mede a varação dos erfs dvduas em toro do cetróde. 11 O obetvo da aálse de orresodêca é ecotrar um subesaço de baxa dmesão que melhor coteha os erfs 1 Poderação da estatístca or
Aálse de orresodêca Matrz de dados (frequêcas relatvas) com a soma de cada lha gual a uma costate c (c=1). O vetor cetróde é dado or: 1.. / 1/ 1/ esos dag,..., 1 Matrz de massas: dag massas / Matrz de esos: tão, os exos rcas (deotados or F) dos erfs lha odem ser obtdos da decomosção e valores sgulares de Y. Para k dmesões e com >, tem-se: k k N X M M N N M N Y esos massas ' ' ; 1 / ) ( : érca total k 1... : roorção da érca descrta elos exos osdere as segutes matrzes: assocada à margal fxada 1 1... 1 Y
Aálse de orresodêca Nível do fucoáro vs tabagsmo Hábto de Fumar Fucoáro Não Pouco Médo Muto Total Nível 1 4 3 11 Nível 4 3 7 4 18 Nível 3 5 10 1 4 51 Nível 4 18 4 33 13 88 Nível 5 10 6 7 5 Total 61 45 6 5 193 xected Frequeces F0 F1 F F3 N1 3,48,56 3,53 1,4 N 5,69 4,0 5,78,33 N3 16,1 11,89 16,38 6,61 N4 7,81 0,5 8,7 11,40 N5 7,90 5,83 8,03 3,4 h-square staces F0 F1 F F3 Total N1 0,079 0,14 0,081 0,3 0,516 N 0,50 0,341 0,56 1,194,93 N3 4,893 0,301 1,173 1,08 7,395 N4 3,463 0,591 0,79 0,5 5,070 N5 0,557 0,005 0,13 0,474 1,168 Total 9,493 1,36,434 3,153 16,44 statístca = 16,44 O (=0,17) Relatve ertas F0 F1 F F3 Total N1 0,005 0,008 0,005 0,014 0,031 N 0,031 0,01 0,016 0,073 0,139 N3 0,98 0,018 0,071 0,063 0,450 N4 0,11 0,036 0,048 0,014 0,308 N5 0,034 0,000 0,008 0,09 0,071 Total 0,577 0,083 0,148 0,19 1,000 érca total=16,44/193=0,08518 0,3/16,44
Aálse de orresodêca strbução de fucoáros de acordo com o tabagsmo Hábto de Fumar Fucoáro Não Pouco Médo Muto Total Nível 1 4 3 11 Nível 4 3 7 4 18 Nível 3 5 10 1 4 51 Nível 4 18 4 33 13 88 Nível 5 10 6 7 5 Total 61 45 6 5 193 Perfs ha da Tabela Y 5x4 F0 F1 F F3 Mass N1 0,364 0,18 0,73 0,18 0,057 N 0, 0,167 0,389 0, 0,093 N3 0,490 0,196 0,35 0,078 0,64 N4 0,05 0,73 0,375 0,148 0,456 N5 0,400 0,40 0,80 0,080 0,130 Mass 0,316 0,33 0,31 0,130 Vetor de esos (verso) Vetor de massas Y 54 N X ( k ) M =( 0,734 0,1001 0,003 ) 0,066-0,194-0,59-0,43 0,381-0,011-0,33 0,058 0,01 0,078 X k N ( ) 55 5 Nível1 Nível Nível3 Nível4 Nível5
omoet 0,4 0,3 Aálse de orresodêca strbução de fucoáros de acordo com o tabagsmo Hábto de Fumar Fucoáro Não Pouco Médo Muto Total Nível 1 4 3 11 Nível 4 3 7 4 18 Nível 3 5 10 1 4 51 Nível 4 18 4 33 13 88 Nível 5 10 6 7 5 Total 61 45 6 5 193 Reresetação Row Plot dos erfs lha ( exo 1) ( exo ) 0,734 0, 0748 0,1001 0, 01 1 0, 0,1 0,0 N4 N5 N3 0,0848/0,08518=0,995 99,5% da érca total dos dados está reresetada o lao -0,1-0, N -0,3-0,3-0, N1-0,1 0,0 0,1 omoet 1 0, 0,3 0,4 os fucoáros íves N5 e N3 são mas semelhates em seu hábto de fumar. N e N4 estão mas dstates deste gruo, sedo mas semelhates etre s. N1 ocua uma osção termedára etre estes gruos.
Aálse de orresodêca Reresetação dos Perfs olua da Tabela strbução de fucoáros de acordo com o tabagsmo Hábto de Fumar Fucoáro Não Pouco Médo Muto Total Nível 1 4 3 11 Nível 4 3 7 4 18 Nível 3 5 10 1 4 51 Nível 4 18 4 33 13 88 Nível 5 10 6 7 5 Total 61 45 6 5 193 Problema ual: studar o adrão de varação da varável hábto de fumar em fução do ível fucoal a emresa omo reresetar os erfs das frequêcas relatvas das coluas?
Aálse de orresodêca Reresetação dos Perfs olua da Tabela Varável olua Varável ha 1 Total O O11 11 O1 1 O ; 1 1 1 1 1 11 1 1 1. 1. 1. Total.1.. statístca Qu-Quadrado: c c 11 1 1 c : 1 c 1,,..., 1 d d O c c 1 c c c erfl de freqüêcas relatvas da colua
Aálse de orresodêca Varável olua Varável ha 1 Total 1 11 1 1 1. 1. 1. Total.1.. 1,,..., c 1,,..., etróde (colua) d c,..., ; 1, c c 1 c c c Reresetação dos Perfs olua da Tabela 1 c c c stâca ucldaa oderada ao quadrado do erfl de freqüêcas relatvas da colua ao cetróde omo reresetar tas erfs colua em um esaço multdmesoal?
Aálse de orresodêca Reresetação dos Perfs ha e olua da Tabela Varável olua Varável ha 1 Total 1 11 1 1 1. 1. 1. Total.1.. lhas Y 1 1... 1 1,...,.1. dag1/ esos. massa dag / coluas Y 1 1... 1 eso dag 1/. massa dag. / 1.,...,. : matrz de esos : matrz de massas
Aálse de orresodêca Reresetação dos Perfs olua da Tabela 1 1 1 1...... 1 1 Y Y esos dag. 1/.. 1,..., dag massas /. Obter os exos rcas G dos erfs coluas obter a decomosção esectral da matrz Y, tal que, ara dmesões de ordem k, tem-se: k k k N X ) ( ) ( ) ( M M N N M N Y eso massa ; Os valores sgulares da reresetação dos erfs lha e colua são os mesmos (a meos de autovalores ulos) o subesaço ótmo ara a reresetação dos erfs lha e colua é o mesmo!!
Aálse de orresodêca strbução de fucoáros de acordo com o tabagsmo Hábto de Fumar Fucoáro Não Pouco Médo Muto Total Nível 1 4 3 11 Nível 4 3 7 4 18 Nível 3 5 10 1 4 51 Nível 4 18 4 33 13 88 Nível 5 10 6 7 5 Total 61 45 6 5 193 Y 4x5 Perfs olua da Tabela F0 F1 F F3 Mass N1 0,066 0,044 0,048 0,080 0,057 N 0,066 0,067 0,113 0,160 0,093 N3 0,410 0, 0,194 0,160 0,64 N4 0,95 0,533 0,53 0,50 0,456 N5 0,164 0,133 0,113 0,080 0,130 Mass 0,316 0,33 0,31 0,130 Y ' 45 N M =( 0,734 0,1001 0,003 ) X ( k ) 0,393-0,031-0,1 0,141-0,196 0,007-0,94-0,198 X N ( k ) ( k ) ( k ) F0 F1 F F3
omoet 0,4 0,3 Aálse de orresodêca strbução de fucoáros de acordo com o tabagsmo Hábto de Fumar Fucoáro Não Pouco Médo Muto Total Nível 1 4 3 11 Nível 4 3 7 4 18 Nível 3 5 10 1 4 51 Nível 4 18 4 33 13 88 Nível 5 10 6 7 5 Total 61 45 6 5 193 Reresetação olum Plot dos erfs colua ( exo 1) ( exo ) 0,734 0, 0748 0,1001 0, 01 1 0, 0,1 0,0 F F1 F0 0,0848/0,08518=0,995 99,5% da érca total dos dados está reresetada o lao -0,1-0, -0,3 F3 dsosção lear (1) dos íves de hábto de fumar. O gruo de ão fumates está bem dstate dos demas -0,3-0, -0,1 0,0 0,1 0, omoet 1 0,3 0,4
omoet Aálse de orresodêca strbução de fucoáros de acordo com o tabagsmo Hábto de Fumar Fucoáro Não Pouco Médo Muto Total Nível 1 4 3 11 Nível 4 3 7 4 18 Nível 3 5 10 1 4 51 Nível 4 18 4 33 13 88 Nível 5 10 6 7 5 Total 61 45 6 5 193 Reresetação Symmetrc dos erfs Plot lha e colua 0,4 0,3 0, 0,1 N4 F1 N5 Blot: Reresetação couta dos erfs da frequêca relatva das lhas e coluas da tabela 0,0 F N3 F0-0,1-0, -0,3 F3 N N1-0,3-0, -0,1 0,0 0,1 0, omoet 1 0,3 0,4
Aálse de orresodêca e scaloameto Multdmesoal Varável olua Varável ha 1 Total 1 11 1 1 1. 1. 1. Total.1.. m um gráfco de coordeadas rcas reresetado somete as categoras lha (ou colua), as dstâcas etre os otos são dstâcas ucldaas. Mas, em um gráfco ode ambos os esaços (lha e colua) estão reresetados smultaeamete, é recso ter cudado com a comaração etre categoras lha e colua os este caso a medda de dstâca ucldaa ode ão ser válda uma melhor aroxmação ode ser coseguda com a adrozação das coordeadas rcas (dvdr os valores ela raz quadrada da érca do comoete) coordeadas assmétrcas