ESTUDOS CORRELACIONAIS E ESTUDOS CAUSAL-COMPARATIVOS. Ana Henriques Carla Neves Idália Pesquita Mestrado em Educação Didáctica da Matemática

1 ESTUDOS CORRELACIONAIS E ESTUDOS CAUSAL-COMPARATIVOS Ana Henriques Carla Neves Idália Pesquita Mestrado em Educação Didáctica da Matemática 1. Introdução A compreensão do comportamento humano tanto a nível individual como social, envolvendo as inúmeras relações que se estabelecem entre as imensas variáveis em jogo é ainda muito reduzida. Uma das preocupações da investigação social e da investigação educacional em particular é a identificação e o estabelecimento de relações entre estas variáveis. Por exemplo, saber se existe alguma relação entre o número de anos de formação académica de um indivíduo e os seus rendimentos. A utilização de métodos de investigação correlacionais é particularmente conveniente nos estudos realizados em ciências sociais pois, ao contrário de outros métodos, permite estudar e medir relações entre uma multiplicidade de variáveis simultaneamente. No método Causal-Comparativo, inserido na investigação Ex Post Facto, para além da relação pretende-se encontrar uma causa para um comportamento ou acontecimento observado que, por ter acontecido num passado mais ou menos longínquo, torna impossível a manipulação das variáveis envolvidas no fenómeno. Estes dois tipos de estudo diferem entre si, não tanto nos seus objectivos pois são utilizados para estudar fenómenos inerentes aos participantes através do estabelecimento de relações, mas nos métodos utilizados: o estudo causal-comparativo concentra-se em comparações de grupo enquanto que o estudo correlacional é predominantemente utilizado para estabelecer e quantificar relações entre variáveis. 2. Estudo Causal-Comparativo Os estudos causal-comparativos realizam-se quando não é possível fazer uma abordagem experimental, isto é, seleccionar, controlar e manipular as variáveis envolvidas num determinado fenómeno. É um estudo realizado a posteriori pois o fenómeno cuja consequência se pretende estudar já ocorreu. Este método permite que cada investigador estabeleça uma grande quantidade de hipóteses a serem estudadas, de acordo com a informação disponível. Na operacionalização destes estudos o investigador estabelece um grupo de controlo e procura as possíveis causas para o fenómeno em estudo por comparação entre o grupo que manifesta as características estudadas e aquele em que estas não estão presentes, através de métodos estatísticos. O estabelecimento de relação pode não determinar uma relação causa-efeito. É preciso não esquecer que há com certeza outras possibilidades, outras hipóteses a ser testadas. O estudo não se pode dar por concluído até porque, estabelecida a existência de uma relação é necessário descrevêla e quantificá-la. 3. Estudo Correlacional Os estudos correlacionais poderão ser efectuados com dois grandes objectivos: (1) estudar/estabelecer relações entre variáveis presentes e (2) predizer o comportamento de uma das variáveis (estudos de predição).

2 No primeiro caso (1) a investigação é conduzida com a intenção de testar a hipótese formulada pelo investigador de que existem relações entre as variáveis envolvidas no fenómeno em estudo. Saber se essa relação realmente existe, em que sentido se estabelece e qual a sua magnitude. No caso (2) o objectivo é estabelecer uma relação entre o comportamento da variável dependente em função da variável (ou variáveis) independente(s). Para avaliar e expressar em termos quantitativos o grau (intensidade) e o sentido da relação entre variáveis, utilizam-se coeficientes de correlação. Existem vários tipos de medidas de correlação e a sua escolha depende do tipo de variáveis que estamos a utilizar e das suas escalas de medida (Cohen et al.,2000). Correlação Linear Os gráficos de dispersão, que são uma representação gráfica da correlação entre duas variáveis (Figura 1), podem ser uma indicação clara para perceber da existência ou não de uma relação linear entre elas. Figura 1. Gráficos de correlação (Tuckman, 1972) Quando o gráfico apresenta a forma de uma recta indica que cada unidade de variação na variável do eixo dos xx é acompanhada de uma variação proporcional (directa ou inversa) na variável do eixo dos yy. Quanto mais estreita for essa linha, mais perfeita é a correlação. Outra possibilidade é não haver relação entre as duas variáveis, caso em que o gráfico apresenta a forma de uma nuvem de pontos dispersos. Raramente se encontram correlações perfeitas e raramente se encontram correlações nulas. Existem portanto, situações intermédias entre estas duas. A simples análise de um diagrama de dispersão não nos pode dar qualquer indicação, senão nos casos mais evidentes, da intensidade da relação e não nos permite quantificar nem tirar conclusões com conhecimento das suas possibilidades de erro. É necessário calcular o valor do coeficiente de correlação linear (r) que é uma expressão matemática concisa da relação. O coeficiente de correlação linear varia entre -1 e 1. O valor de r = 1 representa uma correlação perfeita e positiva, onde as variáveis se alteram no mesmo sentido. O valor de r = -1

3 representa uma correlação perfeita e negativa, onde as variáveis se alteram em sentidos opostos. Os valores de r pequenos ou perto de zero, indicam relações fracas ou ausência de correlação. Quando pretendemos usar o r da amostra para basearmos a inferência para uma população, devemos considerar a significância estatística. A significância estatística, quando aplicada ao coeficiente de correlação indica quando a correlação é diferente de zero ou não, a um determinado nível de confiança. Uma correlação estatisticamente significativa é indicativa de uma relação efectiva, em vez de uma devida ao acaso. Um meio simples para interpretar um coeficiente de correlação é considerar o seu quadrado. O r 2 (coeficiente de determinação) dá-nos a percentagem de variabilidade de uma variável que pode ser atribuída à sua relação linear com outra variável. Ou seja, indica a quantidade que as duas variáveis têm em comum. Quando se pretende fazer predições, estabelecemos o comportamento das duas variáveis através da recta de regressão linear (modelo matemático que representa a relação linear entre duas variáveis) cujos coeficientes são obtidos pelo método dos mínimos quadrados. O estudo preditivo realiza-se apenas em áreas nas quais já existe um seguro conhecimento de base e na certeza de que o coeficiente de correlação existente entre as variáveis é grande. A predição de acontecimentos, ou comportamentos, a curto prazo será sempre mais fiável não só porque a curto prazo será mais certo que todos ou a maior parte dos factores em causa estão ainda presentes (é preciso não esquecer que nos interessam fundamentalmente estudos sociais ou educacionais e que são muitas as variáveis que conduzem a determinado comportamento) mas também porque a curto prazo haverá menor probabilidade de estas variáveis sofrerem alterações. Quando a relação entre duas variáveis não é perfeita, as predições não são totalmente seguras. O grau de precisão e a eficácia dos estudos de predição dependem da intensidade da relação entre as duas variáveis. Em estudos de predição em educação raramente se atingem níveis de correlação acima dos 0,85, valor indicativo de relações muito fortes entre as duas variáveis. Segundo alguns autores, uma correlação acima de 0,60 é considerada adequada para predições. Correlação não Linear A análise de correlação é baseada no pressuposto de uma relação linear entre duas variáveis. O facto de se obter um coeficiente de correlação linear baixo ou perto de zero apenas indica que não existe relação linear. Independentemente das estatísticas usadas, o investigador deve sempre começar por uma representação gráfica dos dados mesmo tendo razão para acreditar que a relação não é linear. Se o gráfico mostrar uma relação curvilínea, terá que escolher outro tipo de análise estatística. Correlação Múltipla Em ciências da educação encontramo-nos quase sempre em situações complexas em que a variável que nos interessa é dependente ou função de várias variáveis e não só de uma. A correlação múltipla indica o grau de associação entre várias variáveis. Está relacionada não só com as variáveis dependentes mas com as intercorrelações entre as variáveis dependentes. Muitas vezes, se tivermos em conta várias variáveis podemos melhorar consideravelmente as previsões. Correlação Parcial A correlação parcial estabelece o grau de associação entre duas variáveis depois da influência de uma terceira ter sido controlada ou posta parcialmente de fora.

4 4. Exemplo Para ilustrar o exposto, recorremos ao exemplo seguinte: O matemático Arthur Engel recolheu, na cidade alemã de Oldenburg no período de 1930 a 1936, os dois conjuntos de dados que se apresentam na tabela 1: Tabela 1 Variação do nº casais de cegonhas e habitantes (Viana, 2002) Ano 1930 1931 1932 1933 1934 1935 1936 Casais de Cegonhas 132 142 166 188 240 250 252 Habitantes 55400 58400 65000 67700 69800 72300 76000 Estudo Causal-Comparativo Hipótese: O aumento do número de casais de cegonhas é a causa do aumento do número de habitantes. Estudo Correlacional Questões de Investigação: 1. Existe alguma relação (correlação) entre o número de casais de cegonhas e o número de habitantes? Em que sentido se estabelece a relação e qual a sua intensidade? 2. Como é que o número de casais de cegonhas influencia o número de habitantes? 3. Qual seria o número de habitantes da cidade de Oldenburg, se detectássemos a presença de 500 casais de cegonhas? Coeficiente de correlação Figura 2. Coeficiente de correlação número de casais de cegonhas e número de habitantes Advertência: Quando estabelecemos um coeficiente de correlação elevado entre o número de casais de cegonhas e o número de habitantes na cidade alemã não podemos esquecer que: pode o número de casais de cegonhas ser responsável pelo aumento do número de habitantes (possibilidade fortemente apoiada pela tradição) pode o número de habitantes ser o responsável pelo aumento de casais de cegonhas

5 ou pode efectivamente existir uma terceira causa ou conjunto de causas responsáveis por estas duas situações. Não podemos assim, estabelecer uma relação de causa-efeito entre as duas variáveis estudadas! 5. conclusões Tabela 2 Comparação: Estudo Correlacional e Estudo Causal Comparativa Estudo Correlacional Objectivos estudar/estabelecer relações entre variáveis predizer o comportamento de uma variável a partir do comportamento de outra variável (predição) Vantagens permite analisar relações entre um grande número de variáveis num único estudo fornece informação sobre o grau de relação entre as variáveis Desvantagens não permite estabelecer uma relação de causa-efeito Estudo Causal-Comparativo estabelecer relações de causalidade entre variáveis realizam-se quando não é possível fazer uma abordagem experimental é uma fonte de criação de hipóteses que poderão ser posteriormente estudadas falta de controlo da variável independente e impossibilidade de formar aleatoriamente a amostra não permite estabelecer uma relação de causa-efeito Bibliografia D Hainaut, L. (1992). Conceitos e métodos da estatística. Lisboa: Fundação Calouste Gulbenkian. Mertens, D. (1998). Research methods in education and psychology. London: Sage Publication. Gall, M., Borg, W. e Gall, J. (1996). Educational research: an introduction. 6ª Edição. New York: Longman. Cohen, L., Manion, L. e Morrison, K. (2000). Research methods in education. 5ª Edição. Londres: Routledge.