PUC - SP ANÁLISE DE CONGLOMERADOS E OS INDICADORES DE GOVERANÇA MUNDIAL José Renato Lamberti Stella Milanez MESTRADO EM ADMINISTRAÇÃO DE EMPRESAS MÉTODOS QUANTITATIVOS PROF. DR. ARNOLDO HOYOS SÃO PAULO
. Introdução O presente trabalho tem como objetivo analisar e comparar diferentes tamanhos de amostras com relação a sua população. Para isso utilizaremos o WGI (Worldwide Governance Indicators) que envolve países. Estes países serão considerados como a população do universo e a partir desta população serão sorteadas amostras aleatórias com os tamanhos de e países, para cada uma das variáveis apresentadas pelo índice.. As variáveis e os indivíduos Os indicadores de governança mundial 9 - Worldwide Governance Indicators (WGI) apresenta relatórios sobre países e territórios no período de 99- ((indivíduos), por seis dimensões de governação (variáveis): a) Voz e Responsabilização b) Estabilidade Política e Ausência de Violência c) Eficácia do Governo d) Qualidade Regulatória e) Estado de Direito f) Controle da Corrupção. Tabela Link para tabela completa: http://info.worldbank.org/governance/wgi/pdf/wgidataset.xls
. PESQUISA POR AMOSTRAGEM A pesquisa por amostragem foi feita em duas amostras, uma de indivíduos, ou países e a outra com indivíduos.. Sumário. PESQUISA POR AMOSTRAGEM COMPONENTE PRINCIPAL.. Sumário População Frequency, VA PS GE, -,,,,,,, -,7,,7,, Histogram of VA; PS; GE; RQ; RL; CC Normal -,,, -,7,,7,, RQ RL CC,, -,7,,7,,,,, -,7,,7,,, -,,,, O histograma para a população apresenta uma curva próxima a normal... Sumário para amostra, VA Mean -,9 StDev, N 7 PS Mean -, StDev, N 7 GE Mean,9 StDev,9 N 7 RQ Mean,9 StDev, N 7 RL Mean -,7 StDev, N 7 CC Mean,79 StDev, N 7
Frequency 9 - Histogram of VA; PS; GE; RQ; RL; CC Normal VA PS GE -,, RQ RL CC,,, VA Mean -,9 StDev,99 N PS Mean -,9 StDev, N GE Mean -, StDev, N RQ Mean -, StDev, N RL Mean -, StDev,9 N CC Mean -,79 StDev,99 N Como as curvas para a amostra de são similares a da população é viável a utilização desta para efeito de análise... Sumário para amostra Frequency Histogram of VA; PS; GE; RQ; RL; CC Normal VA PS GE RQ RL CC,,,,, VA Mean,77 StDev,9 N PS Mean -, StDev,7 N GE Mean,7 StDev,9 N RQ Mean, StDev,99 N RL Mean,9 StDev, N CC Mean, StDev,9 N Na amostra de existe similaridade a amostra de e da população. Tende a ser mais vantajoso para um trabalho uma análise menor, devido ao custo ser menor e ser mais rapido de analisar, no entanto o pesquisador precisa ter cuidado para não estar com uma amostra tendênciosa.
. ANÁLISE DE DADOS. Para amostra de indivíduos Cluster Analysis of Observations: VA; PS; GE; RQ; RL; CC Euclidean Distance, Single Linkage Amalgamation Steps Number Number of obs. of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster 9 9,,7 7 97,79, 7 97,, 9,9, 7 9,,77 9 9 9,,99 9 7 9,99, 9,9,9 9 9,779,7 9,7,9 9 9,,7 9,,7 7 9,, 9 9,,9 9,,7 9,79, 7 9,7,7 9,7,7 9 9,7,9 9,9,99 9 9,9,9 9,7,79 7 9,,9 9 9,77,7 9 7 9,, 9,7,9 9 7 9,, 9,,7 9 9,,9 9,,999 9 9,,779 7 7 9,7,77 7 7 9,,77 9 9,,7 9,9,779 9,7,79 7 9,,9 9,,9 7 9 9,7, 9 9,9,7 7 7 9 9,9, 7 9,,9 9 7 9,9,9 9,7,977 9,, 7 9,9,7 7 7 9,77,997 9,97, 9 9 9 9,7, 7 7 9,9,9 9 7 9 9,,79 9,,9 9
7,7,7 7,,9,,7,9, 7 7,79,9,,99 9 9 79,, Final Partition Number of clusters: Within Average Maximum cluster distance distance Number of sum of from from observations squares centroid centroid Cluster,99,9,9 Cluster 9,9,,9 Cluster,9,,77 Cluster,,777,99 Cluster,,, Cluster,,, Cluster7,,, Cluster,,, Cluster9,,, Cluster,,, Cluster,,, Cluster,,, Cluster,,, Cluster,,, Cluster,,, Cluster,99,79,79 Cluster7,,, Cluster,,, Cluster9,,, Cluster,,, Cluster Centroids Variable Cluster Cluster Cluster Cluster Cluster Cluster VA -,79,77 -,9 -,77,,79 PS -,97,,99,,7,9 GE -,7999,7,797 -,97,9,9 RQ -,,,9 -,77,, RL -,,,77 -,997,97, CC -,,7,99 -,999,7,7 Variable Cluster7 Cluster Cluster9 Cluster Cluster Cluster VA,,97,79 -,7,77,7 PS,,99 -,79, -,7, GE -,7,97,7 -,9, -,797 RQ,7,99,79 -, -,, RL -,,,7 -,9 -, -,7797 CC -,,7,97 -, -,79 -,7 Variable Cluster Cluster Cluster Cluster Cluster7 Cluster VA, -,7,9,7,7 -,79 PS, -,,,,9,77 GE -,7,777,7 -,977,9,977 RQ,,99,779,,,7 RL -,7997,97, -,, -, CC -,7,9,77 -,797, -, Variable Cluster9 Cluster Grand centroid
VA, -,7 -,9 PS,977, -,9 GE,, -, RQ,7,97 -, RL,,7 -,9 CC,7, -,79 Distances Between Cluster Centroids Cluster Cluster Cluster Cluster Cluster Cluster Cluster7 Cluster,,9,79,,,9, Cluster,9,,9,99,77,97, Cluster,79,9,,97,79,7,77 Cluster,,99,97,,799,,79 Cluster,,77,79,799,,77,9 Cluster,9,97,7,,77,,7 Cluster7,,,77,79,9,7, Cluster,97,,97,9,9,, Cluster9, 7,9 7,,77,9,,9 Cluster,9,,9,79,7,7,99 Cluster,,977,,99,79,77,777 Cluster,77,9,7,77,,, Cluster,,9,7,9,79,, Cluster,79,7,97,,9,,77 Cluster,7,,,9977,,,9 Cluster,99,7,,97,,,9 Cluster7,,7,97, 7,7,7,97 Cluster,77,7,7,779,9,,77 Cluster9,,7,7,7,99 7,79,779 Cluster,,77,9,7 7,797,,7 Cluster Cluster9 Cluster Cluster Cluster Cluster Cluster,97,,9,,77, Cluster, 7,9,,977,9,9 Cluster,97 7,,9,,7,7 Cluster,9,7,79,99,77,9 Cluster,9,,7,79,,79 Cluster,,,7,77,, Cluster7,,9,99,777,, Cluster, 7,79,79,,9,7 Cluster9 7,797,,977,,7,9 Cluster,79,97,,,, Cluster,,,,,,9 Cluster,9,,,,, Cluster,7,9,,9,, Cluster,999,7,7,9,77,979 Cluster,777,9,,9,, Cluster,7,,97,79,9,7 Cluster7,,9,,,9,77 Cluster,7,7,,7,97,9 Cluster9, 9,77,9,99,9, Cluster,,,7,,9,799 Cluster Cluster Cluster Cluster7 Cluster Cluster9 Cluster,79,7,99,,77, Cluster,7,,7,7,7,7 Cluster,97,,,9,7,7 Cluster,,9977,97,,779,7 Cluster,9,, 7,7,9,99 Cluster,,,,7, 7,79 Cluster7,77,9,9,97,77,779 Cluster,999,777,7,7,7, Cluster9,77,9,,9,7 9,77 Cluster,7,,97,,,9 Cluster,9,9,79,,7,99 Cluster,77,,9,9,97,9 Cluster,979,,7,7,9, Cluster,,79,9,9,9,7 Cluster,79,,97,,7 7,9
Cluster,9,97,,,9,7 Cluster7,9,,99,,79, Cluster,9,7,9,,, Cluster9,7 7,9,7,,, Cluster,9,,,9,,99 Cluster Cluster, Cluster,7 Cluster,99 Cluster, Cluster 7,7 Cluster, Cluster7,7 Cluster, Cluster9, Cluster,7 Cluster, Cluster,9 Cluster,797 Cluster,9 Cluster, Cluster, Cluster7,9 Cluster, Cluster9, Pode-se atentar, na tabela acima, que há similaridade entre muitas observações. Desta forma, para melhor observação, utilizamos clusters. Destaca-se em amarelo. O centróide é o meio de um cluster e pode ser usado como uma medida de localização. Para um determinado cluster a distancia média do centróide é a média das distâncias entre as observações e o centróide. Observa-se a tabela abaixo: Within Average Maximum cluster distance distance Number of sum of from from observations squares centroid centroid Cluster,99,9,9 Cluster 9,9,,9 Cluster,9,,77 Cluster,,777,99 Cluster,,, Cluster,,, Cluster7,,, Cluster,,, Cluster9,,, Cluster,,, Cluster,,, Cluster,,, Cluster,,, Cluster,,, Cluster,,, Cluster,99,79,79 Cluster7,,, Cluster,,, Cluster9,,, Cluster,,, No Dendograma abaixo podemos visualizar a disposição dos países e verificar o nível de similaridade entre os países desta região
.. Dendograma Dendrogram with Single Linkage and Euclidean Distance 79, Similarity, 9,, 9 7 7 9 9 7 9 7 7 9 9 7 Observations Para uma melhor análise iremos agrupar em dois clusters conforme histograma abaixo.
.. Histograma Histogram of Cod Frequency Cod Temos desta forma dois grupos, sendo que o apresenta maior número de amostras... Box plot 7, Boxplot of PC vs Cod, PC,,, -, Cod
.. Gráfico D D Scatterplot of Cod vs Cod vs PC, Cod,, - PC Cod. Para amostra de indivíduos.. Cluster Analysis of Observations: VA; PS; GE; RQ; RL; CC Euclidean Distance, Single Linkage Amalgamation Steps Number Number of obs. of Similarity Distance Clusters New in new Step clusters level level joined cluster cluster 9 97,, 7 9,99,7 9 9 7 9,9, 7 9,, 9,,9 9,97,9 9 7 9,777,77 9 9,7,7 9 9,9,777 9,,9 9 9,,97 7 7 9,,77 7 9,7,7 9,7,,9,9 7,9,999 7 7,9,9 9 7,7,97 9 7,79,97,,7
9,9,7,,9 7 7,7, 9,,9,,,9,79 7,, 79,, 9 7,7,9 Final Partition Number of clusters: Within Average Maximum cluster distance distance Number of sum of from from observations squares centroid centroid Cluster,,, Cluster,,, Cluster,99,7,7 Cluster,9,9,9 Cluster,,99,99 Cluster,,, Cluster7,,, Cluster,7,7,7 Cluster9,,, Cluster,,, Cluster,,, Cluster,,79,79 Cluster,,, Cluster,,99,97 Cluster,,, Cluster,,99,799 Cluster7,,, Cluster,,, Cluster9,,, Cluster,,, Cluster Centroids Variable Cluster Cluster Cluster Cluster Cluster Cluster VA, -,,77 -,999,,7 PS,9 -,77,7,9,9,7 GE,9 -,7,7 -,9,,7 RQ -,9 -,99,7 -,7,,79 RL -, -,7,7 -,777,7,79 CC -, -,9, -,7,,77 Variable Cluster7 Cluster Cluster9 Cluster Cluster Cluster VA,9,99,,9 -,7,7 PS -,,7,,,, GE -,7, -,, -,9,7 RQ,9,7 -,7,9 -,,79 RL -, -,7,77,9 -,9,99 CC -, -,9,,9 -,,9 Variable Cluster Cluster Cluster Cluster Cluster7 Cluster VA -,979,9,777 -,9 -, -, PS,,7 -,9 -,7797 -,7, GE,9,9 -, -,79 -,97 -, RQ,,777,77 -,997,77, RL,799,797 -,9 -,797,9 -,7 CC,97,,7 -,77 -,7979 -,
Grand Variable Cluster9 Cluster centroid VA,979,999,779 PS -,, -, GE,,9,7 RQ,7,7,7 RL,,7,99 CC,7,9, Distances Between Cluster Centroids Cluster Cluster Cluster Cluster Cluster Cluster Cluster7 Cluster,,7,77,79,99,99,9997 Cluster,7,,79,7,,,9 Cluster,77,79,,9,99,9,77 Cluster,79,7,9,,777,9,7 Cluster,99,,99,777,,99,9 Cluster,99,,9,9,99,,99 Cluster7,9997,9,77,7,9,99, Cluster,9,,,79,,77,77 Cluster9,,9,799,99,7,979,9797 Cluster,97,9,777,9 7,,,77 Cluster,777,9,7,,77,,9 Cluster,9,7,77,,,79,7 Cluster,79,7,9,7,7,7,9 Cluster,9,,99, 7,77,9,7 Cluster,,,9,9,9,7, Cluster,7,7,9,9,,7, Cluster7,9,99,,,9,7,77 Cluster,,97,,7,7,9,99 Cluster9,97,7,,,999,7, Cluster,,,9,,7,9,9 Cluster Cluster9 Cluster Cluster Cluster Cluster Cluster,9,,97,777,9,79 Cluster,,9,9,9,7,7 Cluster,,799,777,7,77,9 Cluster,79,99,9,,,7 Cluster,,7 7,,77,,7 Cluster,77,979,,,79,7 Cluster7,77,9797,77,9,7,9 Cluster,,7,,,77, Cluster9,7,,,,79, Cluster,,,,7,9, Cluster,,,7,,9,7 Cluster,77,79,9,9,,77 Cluster,,,,7,77, Cluster,9,,9,,7,777 Cluster,9,,,7,7,999 Cluster,779,7,,99,, Cluster7,9,779,777,,, Cluster,7,9,77,9,7,9 Cluster9,9, 7,7,9,9, Cluster,,,9,97,9,7 Cluster Cluster Cluster Cluster7 Cluster Cluster9 Cluster,9,,7,9,,97 Cluster,,,7,99,97,7 Cluster,99,9,9,,, Cluster,,9,9,,7, Cluster 7,77,9,,9,7,999 Cluster,9,7,7,7,9,7 Cluster7,7,,,77,99, Cluster,9,9,779,9,7,9 Cluster9,,,7,779,9, Cluster,9,,,777,77 7,7 Cluster,,7,99,,9,9 Cluster,7,7,,,7,9 Cluster,777,999,,,9,
Cluster,,79,9,97,79 7, Cluster,79,,777,7,97, Cluster,9,777,,7,9, Cluster7,97,7,7,,,79 Cluster,79,97,9,,,9 Cluster9 7,,,,79,9, Cluster,9,99,799,7,9,77 Cluster Cluster, Cluster, Cluster,9 Cluster, Cluster,7 Cluster,9 Cluster7,9 Cluster, Cluster9, Cluster,9 Cluster,97 Cluster,9 Cluster,7 Cluster,9 Cluster,99 Cluster,799 Cluster7,7 Cluster,9 Cluster9,77 Cluster, Pode-se atentar, na tabela acima, que há similaridade entre muitas observações. Desta forma, para melhor observação, utilizamos clusters. Destaca-se em amarelo. O centróide é o meio de um cluster e pode ser usado como uma medida de localização. Para um determinado cluster a distancia média do centróide é a média das distâncias entre as observações e o centróide. Observa-se a tabela abaixo: Within Average Maximum cluster distance distance Number of sum of from from observations squares centroid centroid Cluster,,, Cluster,,, Cluster,99,7,7 Cluster,9,9,9 Cluster,,99,99 Cluster,,, Cluster7,,, Cluster,7,7,7 Cluster9,,, Cluster,,, Cluster,,, Cluster,,79,79 Cluster,,, Cluster,,99,97 Cluster,,, Cluster,,99,799 Cluster7,,, Cluster,,, Cluster9,,, Cluster,,, No Dendograma abaixo podemos visualizar a disposição dos países e verificar o nível de similaridade entre os países desta região.. Dendograma
Dendrogram with Single Linkage and Euclidean Distance 7, Similarity, 9,7, 7 7 9 9 9 7 Observations Para melhor análise iremos agrupar em clusters conforme histograma abaixo:.. Histograma
Histogram of Cod 9 7 Frequency Cod O histograma mostra grandes grupos (, e respectivamente)... Box plot Boxplot of PC vs Cod PC - - - Cod
.. Gráfico D D Scatterplot of Cod vs Cod vs PC, Cod,,,,,, PC, Cod. CONCLUSÕES Para melhor análise a amostra de apresenta grupos, já que as amostras estão mais distantes uma das outras conforme centroíde demonstrado acima. Desta forma obtemos um histograma e um boxplot que apresenta mais detalhes.