ESTATÍSTICA - 2016 Aula #04 14/09/16 R - UMA INTRODUÇÃO
R - INTRODUÇÃO ferramenta de análise estatística de dados com muitos recursos e possibilidades; é constantemente atualizado e revisado incluindo novas técnicas e métodos; é um programa de domínio público: http://cran.r-project.org
http://cran.r-project.org Download and Install R Precompiled binary distributions of the base system and contributed packages, Windows and Mac users most likely want one of these versions of R: Download R for Linux Download R for (Mac) OS X Download R for Windows R is part of many Linux distributions, you should check with your Linux package management system in addition to the link above.
R for windows This directory contains binaries for a base distribution and packages to run on Windows (NT, 95 and later) on Intel and clones (but not NT on Alpha and other platforms). Note: CRAN does not have Windows systems and cannot check these binaries for viruses. Use the normal precautions with downloaded executables. Subdirectories: base Binaries for base distribution (managed by Duncan Murdoch) contrib Binaries of contributed packages (managed by Uwe Ligges) You may also want to read the R FAQ and R for Windows FAQ.
R-3.2.2 for Windows (32/64 bit) Download R 3.2.2 for Windows (62 megabytes, 32/64 bit) Installation and other instructions New features in this version
R - INTRODUÇÃO Para solicitar uma tarefa do R podemos digitar uma linha de comando ou, se a tarefa é complexa, digitar várias linhas de comando, respeitando-se a sintaxe do R. Podemos digitar uma sequência de comandos em um editor de textos, o Bloco de Notas, por exemplo, e depois colar na tela de comandos do R para que o mesmo execute as tarefas solicitadas. Esta sucessão de comandos é chamada um programa ou código ou função. Tal programa ou função, pode conter apenas uma linha com uma única tarefa a ser executada como conter várias páginas com comandos a serem executados.
R - INTRODUÇÃO Os programas em R, bem como os dados a serem explorados, podem ser armazenados em arquivos de texto (extensão.txt). Os dados também podem ser armazenados em uma planilha de cálculo e depois, salvos como arquivo texto para que possam ser lidos no R.
Exemplos x1=4 x2=6 z=x1+x2 Operações soma: + subtração: - divisão: / multiplicação: * potenciação: ** ou ^ raiz quadrada de n: sqrt(n) logaritmo natural: log(n)
Concatenação Exemplo 1: x=c(1:100) O efeito do comando acima será atribuir à x, os 100 primeiros inteiros positivos. Para acessar valores de diferentes posições do vetor x, a forma é a seguinte: x[i], desde que i seja um numero inteiro entre 1 e 100. Caso contrário, ele retornará NA que é o símbolo usado no R para dados não disponíveis.
vetores Para acessar um intervalo de valores, por exemplo, de 10 a 25: x[10:25] [1] 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
R - HELP O Help no R tem um papel fundamental pois é bastante completo e auto-suficiente. Quando precisamos aplicar alguma técnica cujo comando não conhecemos, basta chamarmos a função help da seguinte forma: help(palavra-chave)
R - Usando o help Suponha, por exemplo, que estejamos interessados em conhecer as possibilidades do comando mean (média). Chamando a função help(mean) obtemos: mean package:base R Documentation Arithmetic Mean (Média Aritmética) Descrição: Função genérica para média aritmética (podada). Como usar: mean(x,...) mean.default(x, trim = 0, na.rm = FALSE,...)
Comando mean: alguns detalhes. Argumentos: x: um objeto do R. trim: a fração ( de 0 à 0.5) das observações a serem podadas de cada extremo de x antes da média ser calculada. Obs. Se `trim' é não-nula, uma média podada simetricamente é calculada com uma fração de observações excluídas de cada extremo igual ao valor de trim. na.rm: um valor lógico (T ou F, conforme verdadeiro ou falso) indicando se valores ausentes (NA) devem ser desconsiderados antes de realizar o cálculo. Valor: Se `trim' é zero (default), a média aritmética dos valores em `x' é calculada.
Exemplo 2: Cálculo da média aritmética do vetor contendo os dados sobre salários da tabela 2.1 do livro-texto. dados=read.table( e:\\geografia\\ciamb.txt, header =T) Comando para ler o arquivo de dados do exemplo 2.1 do livro texto. O arquivo ciamb.txt está disponibilizado.
mean(dados$sal) mean(dados$sal) [1] 11.12222
Histograma dos salários hist(dados$sal) (será construído usando os parâmetros default do R).
O parâmetro breaks na função hist serve tanto para indicar os intervalos como para indicar a quantidade de intervalos. Observe: hist(sal,breaks=6,main= Histograma dos salários,xlab= salários mínimos,ylab= Freq. Absoluta )
hist(dados$sal,breaks=c(3,6.5,10,13.5,17,20.5,24),main="histograma dos salários",xlab="salários mínimos",ylab="freq. Absoluta",xlim=c(- 1,25),ylim=c(0,14))
Parâmetros da função hist hist {graphics} R Documentation Histograms Description The generic function hist computes a histogram of the given data values. If plot = TRUE, the resulting object of class "histogram" is plotted by plot.histogram, before it is returned. Usage hist(x,...)
continuação ## Default S3 method: hist(x, breaks = "Sturges", freq = NULL, probability =!freq, include.lowest = TRUE, right = TRUE, density = NULL, angle = 45, col = NULL, border = NULL, main = paste("histogram of", xname), xlim = range(breaks), ylim = NULL, xlab = xname, ylab, axes = TRUE, plot = TRUE, labels = FALSE, nclass = NULL, warn.unused = TRUE,...)
> hist(dados$sal,breaks=6,plot=f) $breaks [1] 0 5 10 15 20 25 (limites dos intervalos de classe) $counts [1] 2 16 11 6 1 (frequência absoluta de cada intervalo) $mids [1] 2.5 7.5 12.5 17.5 22.5 (pontos médios de cada intervalo) $xname [1] "sal" $equidist [1] TRUE > mean(dados$sal) (média dos salários) [1] 11.12222
Exemplo 3: gráficos para variáveis qualitativas Suponha que tenhamos levantado o tipo sanguíneo de um grupo de 57 pessoas obtendo 25 do tipo O, 15 do tipo A, 10 do tipo AB e 7 do tipo B. No R um vetor com 57 entradas registrou os tipos sanguíneos observados.
tipo=c(1:57) > A="A" > O="O" > C="AB" > B="B" > tipo[1:25]=o > tipo[26:40]=a > tipo[41:50]=c > tipo[51:57]=b > tipo [1] "O" "O" "O" "O" "O" "O" "O" "O" "O" "O" "O" "O" "O" "O" "O" [16] "O" "O" "O" "O" "O" "O" "O" "O" "O" "O" "A" "A" "A" "A" "A" [31] "A" "A" "A" "A" "A" "A" "A" "A" "A" "A" "AB" "AB" "AB" "AB" "AB" [46] "AB" "AB" "AB" "AB" "AB" "B" "B" "B" "B" "B" "B" "B" >
Tabela de frequências > table(tipo) tipo A AB B O 15 10 7 25
Gráfico de setores pie(table(tipo), main= Distribuição de frequências de tipo sanguíneo )
Gráfico de barras barplot(table(tipo), main= Distribuição de frequências de tipo sanguíneo )