Aula 5 do módulo I Dr. Sidney Rosa Vieira 29/03/2005 a 04/04/2005 Programa para cálculo de estatística convencional STAT Programa para cálculo de estatística convencional: Arquivo de parâmetros STAT.PAR, Descrição dos resultados de saida: Variável, Unidade, Número de valores, Média, Variância, D.P., C.V., Mínimo, Máximo, Assimetria, Curtose. Prática:Criar, imprimir e interpretar as estatísticas de um arquivo de dados. Obs:Antes de iniciar esta aula os programas enviados (arquivo GEOEST_09_12_04.ZIP) deverão ser descompactados num diretório (por exemplo, PROGRAMAS) para execução das aulas práticas. Programa STAT calcula estatísticas para um arquivo de dados. ENTRADAS: Parâmetros no arquivo STAT.PAR Dados de entrada no ARQUIVO1.TXT SAÍDAS: Arquivo com nome ARQUIVO1.STA, contendo uma tabela com as estatísticas dos dados, uma com a matriz de covariâncias e outra com a matriz de correlações entre pares de variáveis. SUB ROTINAS: DELPO: Elimina dados perdidos. 1. Arquivo STAT.PAR http://10.5.130.8/aulas/geoestatistica/aula5/aula5.asp (1 of 5)29/3/2005 12:30:51
a. Primeira linha: TÍTULO: Variabilidade 20 caracteres em formato livre. b. Segunda linha: NOME DO ARQUIVO DE DADOS: IRMPAD87.DAT Nome do arquivo TEM QUE TER 8 CARACTERES + EXTENSÃO e formato deve ser igual ao mostrado na aula 2. c. Terceira linha: i. 9 número de colunas (variáveis) no arquivo. ii. 1: Opção para cálculo das matrizes de covariâncias e de correlações entre pares de variáveis (1=SIM, 2=NÃO). iii. -1.0: identificador de dados perdidos. d. Quarta linha: Opção para cálculo de logaritmos (1=SIM, 2=NÃO). Por exemplo, caso queira calcular as estatísticas dos logaritmos para a segunda coluna de dados, então na posição 2 deve ser trocado o número 2 por 1. 2. Rodando o programa STAT: Para rodar o programa STAT usando o arquivo de parâmetros recém criado, usando o Windows Explorer vá para a pasta onde estão os programas ( e arquivo IRMPAD87.DAT) e clique sobre o aplicativo STAT. Dentro de alguns segundos verá que o programa criou um arquivo novo com o nome: IRMPAD87.STA. Para ver o arquivo IRMPAD87.STA, clique duas vezes sobre ele e associe-o ao Notepad. O arquivo que verá na tela é o seguinte: http://10.5.130.8/aulas/geoestatistica/aula5/aula5.asp (2 of 5)29/3/2005 12:30:51
3. Descrição dos resultados de saída: Variável, Unidade, Número de valores, Média, Variância, D.P., C.V., Mínimo, Máximo, Assimetria, Curtose. a. Variável (Name): Estes nomes são os dados para cada uma das colunas. Veja que cada nome tem 5 (cinco) caracteres. Esta é uma exigência dos programas, principalmente porque alguns programas usam o nome da variável para compor o nome do arquivo de saída. b. Unidade (Unit): É a unidade de cada uma das colunas (variáveis). c. Número de valores (Number): É o número de valores de cada coluna. Veja que, se por acaso uma coluna (variável) tiver dados perdidos, este número será diferente das outras. d. Média (Mean): É a média aritmética de cada uma das variáveis. e. Variância (Variance): É a variância de cada uma das variáveis. Calculada dividindo os desvios da média por N-1, onde N é o número de valores. f. Desvio Padrão (Std. Dev): Raiz quadrada da variância. g. C.V.: É o coeficiente de variação, ou seja, o Desvio Padrão dividido pela média vezes 100. h. Mínimo e Máximo: São os valores extremos. Estes dois valores, podem não ser os ideais para indicar dispersão dos dados por não serem robustos, uma vez que pode ser apenas um valor. Porém, são úteis para se verificar se está tudo certo com o arquivo de dados uma vez que se conhece quais devem os máximos e mínimos dos dados. Assim, caso este valores estejam fora do que se espera, pode ser que o arquivo de dados esteja com algum problema. http://10.5.130.8/aulas/geoestatistica/aula5/aula5.asp (3 of 5)29/3/2005 12:30:51
i. Assimetria e curtose: Estes dois coeficientes são úteis para se analisar se os dados tem distribuição normal de freqüências ou não. Para uma distribuição normal, este coeficientes devem ser iguais a zero (0). À medida em que a assimetria aumenta acima de zero (0), a distribuição tende a log normal. j. Matriz de covariâncias: Se, na terceira linha do arquivo STAT.PAR, for colocada a opção 1 indicando que se quer calcular as matrizes de covariância e correlação, então elas serão calculadas. A matriz de covariâncias é especialmente útil quando se vai fazer cokrigagem, quando o patamar do cross semivariograma deve ser no valor da covariância. Veja que as variáveis que tem variação inversa, ou seja, uma varia da direção contrária a outra, tem covariâncias negativas. k. Matriz de correlações: Esta matriz revela os pares variáveis que tem possibilidade de serem usadas em cokrigagem. Assim, é inútil usar em cokrigagem variáveis que tem correlação menor do que 0.4. Note-se, por exemplo, que a correlação entre as variáveis OC29F e OC29S é de 0.9545. Estas duas variáveis são umidades do solo medidas com um aparelho TDR, no mesmo dia e nos mesmos locais, apenas com dois equipamentos diferentes. Prática: Criar, imprimir e interpretar as estatísticas de um arquivo de dados. http://10.5.130.8/aulas/geoestatistica/aula5/aula5.asp (4 of 5)29/3/2005 12:30:51
Usando os dados constantes da figura acima, crie um arquivo segundo o que foi mostrado na aula 2, salve-o como texto com a extensão TXT, lembrando que o nome TEM QUE TER 8 CARACTERES (por exemplo, CAMPINAS.TXT). Esta lição será considerada completa com a impressão (envio para o professor) do arquivo CAMPINAS.STA correto. http://10.5.130.8/aulas/geoestatistica/aula5/aula5.asp (5 of 5)29/3/2005 12:30:51