ESTATÍSTICA Aula de 07/08/2017. Introdução ao R Variáveis Qualitativas: gráficos

Documentos relacionados
Aula 2: Tipos de variáveis

Estatística-2017/2 aula de 14/08 TURMA: IGA

Excel Intermediário. Prof. Wagner Machado do Amaral. Aula 02 Fórmulas e Funções Básicas

Aula 1: Uma introdução ao pacote estatístico R

Introdução ao R. Anderson Castro Soares de Oliveira

Aula 01 Microsoft Excel 2016

Linguagem R R-Gui e R-Commander

Novas Tecnologias no Ensino da Matemática

Introdução ao SciLab. SciLab O que é? Onde obter o programa:

Importação e Exportação de dados

Novas Tecnologias no Ensino da Matemática

Formulas em Planilhas Eletrônicas. Prof. André Aparecido da Silva Disponível em: Aulas 16, 17, e 18

Introdução ao software MatLab

Iteração e Pontos Fixos

Introdução à Computação

ADA 1º BIMESTRE CICLO I MATEMÁTICA 9º ANO DO ENSINO FUNDAMENTAL 2018

Apostila 1 - Excel Recursos das planilhas eletrônicas para elaboração de conteúdos digitais para o ensino da matemática no ensino médio

Introdução à Lógica de Programação e Aplicativos Instrumentais

Importação e Exportação de dados

3. Análise Descritiva (ou Análise Exploratória)

RADICIAÇÃO, POTENCIAÇÃO, LOGARITMAÇÃO. Potência POTENCIAÇÃO, RADICIAÇÃO E LOGARITMAÇÂO NOS NÚMEROS REAIS. Potenciação 1

Hewlett-Packard FUNÇÃO EXPONENCIAL. Aulas 01 e 06. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz

EXPRESSÕES ARITMÉTICAS PARTE 1

Aula 4 Introdução ao C

Universidade Federal de Ouro Preto - UFOP Departamento de Computação - DECOM Programação de Computadores I - BCC701

Resumo para iniciar a trabalhar no R Lisbeth Cordani R instalar o R Rcmdr R Commander

UNIVERSIDADE REGIONAL DO NOROESTE DO ESTADO DO RIO GRANDE DO SUL DEPARTAMENTO DE FÍSICA, ESTATÍSTICA E MATEMÁTICA

DISCIPLINA SÉRIE CAMPO CONCEITO

Hewlett-Packard FUNÇÃO EXPONENCIAL. Aulas 01 a 06. Elson Rodrigues, Gabriel Carvalho e Paulo Luiz

EXCEL Atividade Prática

Prática 10 - Funções

Os logaritmos decimais

Ambiente Scilab Variáveis, expressões, comando de atribuição Entrada e Saída básica

Entendendo e usando permissões no Linux. Orientador de Curso: Rodrigo Caetano Filgueira

Linguagem Computacional

aparecem os números, na parte de cima da máquina)

Crie um novo projeto conforme abaixo, encerrando com o botão Finalizar :

MEDIDAS E INCERTEZAS

BrOffice Calc e Planilhas de Cálculos. Por: André Aparecido da Silva

Exercícios online de matemática 8 ano 1 trimestre

11 - Estrutura de um programa em C

UNIVERSIDADE FEDERAL RURAL DA AMAZONIA ICIBE INSTITUTO CIBER ESPACIAL PROFº JOÃO SANTANNA

Fundamentos IV. Introdução a OCTAVE. Clarimar Coelho. Departamento de Computação. August 11, 2014

Algoritmo e Programação Matemática

Aula 4: Introdução à Linguagem C++

Aplicações Computacionais em Exploração e Análise de Dados. Primeiro Passo. Introdução 14/08/2013. Introdução ao R

ALGORITMOS E TÉCNICAS DE PROGRAMAÇÃO

Introdução à Computação

Aula 4. Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro

LÓGICA DE PROGRAMAÇÃO PARA ENGENHARIA AMBIENTE DE PROGRAMAÇÃO. Prof. Dr. Daniel Caetano

Unidade I MATEMÁTICA. Prof. Celso Ribeiro Campos

Programação de Computadores I BCC 701 Lista de Exercícios Módulo

Material Didático Unificado.

CURSO EXCEL NÍVEL I 16/09/ FÓRMULAS E REFERÊNCIAS 4. FÓRMULAS E REFERÊNCIAS 4. FÓRMULAS E REFERÊNCIAS 4. FÓRMULAS E REFERÊNCIAS

FTAD Formação Técnica em Administração. Aula 02 Prof. Arlindo Neto

Unidade 20: Funções Matemáticas

Introdução a Tecnologia da Informação

MATEMÁTICA 6º ANO A/B. Números e cálculo. Geometria

ESTATÍSTICA PARA GEOGRAFIA AULA DE 23/08/2017

Análise matricial de estruturas usando Matlab

Números Racionais. Geometria. 2º Bimestre 2018 CONTEÚDO DO BIMESTRE CRITÉRIOS DE AVALIAÇÃO TÓPICOS DO CONTEÚDO CONTEÚDO DO BIMESTRE

O objetivo dessa apostila é apresentar os comandos básicos do software R, especialmente os voltados para a estimação de modelos econométricos.

UNIJUI:UNIVERSIDADE REGIONAL DO NOROESTE DO ESTADO DO RIO GRANDE DO SUL DCEEng: DEPARTAMENTO DE CIÊNCIAS EXATAS E ENGENHARIAS

CIÊNCIA DA COMPUTAÇÃO I Excel. Núm1; núm2;... são de 1 a 255 argumentos numéricos cuja média você deseja obter.

Estatística para Geografia. Rio, 30/08/2017

Percentual de acertos NOME Nᴼ 09/06/2017 Durante a semana 20/06/2017 TURMA: Data para tirar dúvidas em sala de aula

EMGI Programação. Ficha Excel 2- Resolução. Utilizando a folha de cálculo Microsoft Excel

QI Escolas e Faculdades

Multiplicação Divisão

TUTORIAL DO SOFTWARE LIVRE GRAPH

BAC004 Informática Teórica T2 Professora: Fabiana Costa Guedes Lista 05 Vetores e Matrizes Vetores

Colégio Adventista de Porto Feliz

Exercícios Repetição

Organização de Sistemas Computacionais Processadores: Organização da CPU

PLANO CURRICULAR DISCIPLINAR. MATEMÁTICA 4.º Ano. Números e Operações. Relações numéricas. Números Naturais. Numeração Romana.

Mini apostila de Python - Oficina de Vestibulandos. PET Computação - UFPR September 2016

Algoritmos. Conceitos e Comandos

TEXTO (Função TEXTO) Descrição. Sintaxe. Este artigo descreve a sintaxe da fórmula e o uso da função TEXTO no Microsoft Excel.

Predisposição para procurar e explorar padrões geométricos e o gosto por investigar propriedades e relações geométricas.

Vetores, Matrizes e Gráficos

Estruturas de Repetição

GAAL Conhecendo alguns comandos básicos do Maple 17

Prof. Dr. Marco Antonio Leonel Caetano

Classes o Objetos. Classes, objetos, métodos e variáveis de instância

CCO 016 / COM 110 Fundamentos de Programação

Ciência da Computação A&P

Estatística-2018/2. Turma: Geografia

Informática Portugol IDE Revisão 1

APRESENTAÇÃO DO SPSS

Exercícios de programação

Aula 03 - Introdução ao Scilab (p2)

1 - Como abrir o programa KmPlot

Laboratório de Física I. Prof. Paulo Vitor de Morais

Monster. Concursos. Matemática 1 ENCONTRO

BrOffice Calc e Planilhas de Cálculos. Por: André Aparecido da Silva

Transcrição:

ESTATÍSTICA Aula de 07/08/2017 Introdução ao R Variáveis Qualitativas: gráficos

O Programa R É um software de análise estatística de dados, de domínio público. Como baixar o programa? Vá no site: https://cran.r-project.org/ Escolha a versão adequada para você: windows, linux ou MAC. Instale o programa base.

O Programa R No base vamos encontrar todas as funções importantes para a disciplina. Para técnicas mais sofisticadas, bastará pesquisar o pacote em que elas estão para então baixar esse pacote.

Como carregar no R o conjunto de dados? Vamos começar com um exemplo no qual apenas observamos variáveis qualitativas. Suponha que num grupo de 80 estudantes observou-se tipo sanguíneo e nível de instrução da mãe. Vimos que tipo sanguíneo é uma variável qualitativa nominal e nível de instrução é uma variável qualitativa ordinal.

Como carregar no R o conjunto de dados? Os dados, fictícios, foram digitados numa planilha excel. Tipos sanguíneos: O, A, AB e B Nível de Instrução: F (fundamental completo), M (médio completo), S (superior completo) e SPG (pósgraduação completa).

Parte da planilha: tipo_s A A A A O O O O O B B AB AB O O O O nivel_mae F F M M M M M M S S S SPG SPG F F F M

Como carregar no R o conjunto de dados? Observe que a primeira linha da planilha contém o nome das variáveis: tipo_s e nivel_mae. Para um conjunto organizado dessa forma, em que cada coluna é uma variável e a quantidade de dados é igual em todas as linhas o comando adequado para carregar o conjunto de dados é o comando read.table(...)

Como carregar no R o conjunto de dados? Nesse exemplo, os dados estão salvos no arquivo de nome mad231_r_exemplo1.txt Comando: dados=read.table( c://geografia//mad231_r_exemplo1.txt, header=t) Com esse comando o R carregará a planilha de dados que receberá o nome dados. Depois de ler o arquivo com o comando acima, se você digitar dados o R listará o conjunto que foi lido.

Como trabalhar com as variáveis individualmente? Como indicamos os nomes das variáveis, dados$tipo_s ou dados[,1] correspondem aos dados de tipo sanguíneo dados$nivel_mae ou dados[,2] correspondem aos dados de nível de instrução da mãe. Se você leu o conjunto de dados, mas não sabe quantas são as variáveis e qual é o número de observações digite dim(dados). Ele retornará, no caso desse exemplo, 80 2, informando que há duas colunas com 80 dados em cada uma delas.

Como trabalhar com as variáveis individualmente? Se você digitar dados[40,2], o R retornará o nível de instrução da mãe da observação de número 40. Outra possibilidade para obter essa informação é digitar dados$nivel_mae[40] > dados[40,2] [1] SPG Levels: F M S SPG > dados$nivel_mae[40] [1] SPG Levels: F M S SPG Observação: Levels são os níveis assumidos pela variável qualitativa. Para o R entender que a variável é qualitativa, as entradas na planilha devem ser não-numéricas.

Como obter as frequências? No caso de variáveis qualitativas, a função table(), retornará as frequências absolutas de cada resposta possível. Por exemplo, table(dados$tipo_s) A AB B O 24 17 6 33

Como obter as frequências? Para calcular as frequências relativas você pode usar table(dados$tipo_s)/80, em que / é o símbolo da divisão no R. A AB B O 0.3000 0.2125 0.0750 0.4125 Observação: o padrão nacional é representar as unidades decimais após a vírgula. Porém, no R o padrão adotado é o americano que usa o ponto no lugar da vírgula. Se você for carregar um banco de dados numéricos no padrão nacional no R, lembre antes de substituir as vírgulas por pontos.

Como obter as frequências? Na tabulação anterior as respostas ficaram com quatro casas decimais e são exatas. Mas há situações em que o número de casas decimais pode ser bem maior que quatro. Em geral o R retornará as respostas com oito casos decimais o que é exagerado para fins de descrição de frequências relativas. A função round(x,digit=2) resolve essa questão, arredondando x para duas (2) casas decimais. Você pode escolher o número de casas decimais.

Como obter as frequências? round(table(dados$tipo_s)/80,digit=2) A AB B O 0.30 0.21 0.08 0.41 round(table(dados$tipo_s)/80,digit=2) F M S SPG 0.19 0.42 0.24 0.15

Como construir o gráfico de setores? A função pie() no R constrói o gráfico de setores. Você deve indicar a distribuição de frequências a partir da qual será construído o gráfico. pie(table(dados$tipo_s))

Como construir o gráfico de setores? Observe que no gráfico obtido não há título, as cores não foram escolhidas... Existem argumentos na função pie() que podem ser usados para incluir títulos, alterar o preenchimento dos setores.

Argumentos da função pie() main: é usado para indicar o título. pie(table(dados$tipo_s),main= Distribuição de frequências de Tipo Sanguíneo )

Argumentos da função pie() col: é usado para indicar o vetor de cores de preenchimento dos setores. pie(table(dados$tipo_s),main= Distribuição de frequências de Tipo Sanguíneo,col=c( blue, red, yellow, pink ))

Argumentos da função pie() col: é usado para indicar o vetor de cores de preenchimento dos setores. pie(table(dados$tipo_s),main= Distribuição de frequências de Tipo Sanguíneo,col=gray(seq(0, 1.0, length = 4)))

Argumentos da função pie() radius altera o tamanho do raio do círculo. pie(table(dados$tipo_s),main= Distribuição de frequências de Tipo Sanguíneo,radius=0.5)

Gráfico de Setores para a variável nível de instrução da mãe pie(table(dados$nivel_mae),main="distribuição de frequências de Nível de Instrução da Mãe",col= gray(seq(0.4, 1.0, length = 4)),radius=1)

Gráfico de barras Quando as diferenças nas frequências são pequenas ou quando há muitas respostas, o gráfico de barras é mais adequado do que o gráfico de setores. Pequenas diferenças de ângulo no gráfico de setores não são detectáveis. A função barplot() constrói o gráfico de barras da distribuição de frequências de uma variável qualitativa.

Gráfico de barras barplot(table(dados$nivel_mae),main="distribuição de frequências de Nível de Instrução da Mãe")

Argumentos da função barplot() Com a função help(), usando help( barplot ) é possível obter todos os argumentos possíveis desde cor das barras até largura e espaçamento delas. Vamos construir um gráfico de barras da distribuição de frequências da variável tipo sanguíneo.

Atividade Proposta Instale o R em alguma máquina de seu laboratório. Se você não tiver permissão para isso, peça ao responsável. Pesquise ou crie um banco de dados com variáveis qualitativas. (em planilha) Leia no R os seus dados e construa os correspondentes gráficos de setores e de barras.

Funções do R read.table() table() pie() barplot() help() Operações Matemáticas Adição: + Subtração: Multiplicação: * Divisão: / Raiz quadrada: sqrt() Potência: a^b (a elevado a b) Log. Natural: log(a) Função exponencial: exp(a)