Trabalho 1 - Relatório Técnico

Tamanho: px
Começar a partir da página:

Download "Trabalho 1 - Relatório Técnico"

Transcrição

1 Trabalho 1 - Relatório Técnico Aluno: Adenir Pedro da Silva Junior Orientador: Heitor Silvério Lopes Co-orientador: Celso Antonio Alves Kaestner Disciplina: Mineração de Dados - PPGCA fase 3 / Objetivo O presente relatório tem o objetivo de exercitar o conteúdo ministrado na primeira e segunda aula da disciplina Mineração de Dados. O exercício consiste em aplicar a mesma sistemática dos capítulos 1, 2 e 3 de "R and Data Mining: Examples and Case Studies" sobre o dataset Breast Cancer Wisconsin. 2. Base de Dados Este relatório utilizará os dados do repositório UCI - Machine Learning Repository, Breast Cancer Wisconsin (Diagnostic) Data Set [2]. Trata-se de uma base de dados de câncer de mama obtido na University of Wisconsin Hospitals, Madison e mantidos por Dr. William H. Wolberg. As instâncias possuem características (atributos) do núcleo celular extraídas de imagens digitalidas a partir de nódulos na mama submetidos ao procedimento de biópsia conhecido como FNA (Fine-needle aspiration). Cada instância possui dois possíveis diagnósticos: câncer maligno ou benigno. A Tabela 1 apresenta o resumo dos dados. Base de Dados Número de instâncias 699 Número de atributos Fonte Breast Cancer Wisconsin (Diagnostic) atributo classe iagnostic%29 Tabela Pré-Processamento Antes de importar o dataset no RStudio, a extensão do arquivo foi alterada para.r, os nomes dos atributos foram adicionados na primeira linha e as instâncias com atributos indefinidos foram removidas (um total de 16). Reduzindo assim, o número de instâncias para 683.

2 3. Exploração dos Dados 3.1 Observando os Dados A dimensão dos dados é verificada pelo comando dim(breast.cancer.wisconsin): que é interpretado como sendo uma base de dados de 683 instâncias e 11 colunas (attributos). Os nomes das variáveis, adicionadas na primeira linha do arquivo, são retornados pela função names() 3.2 Explorando Variáveis Individualmente O comando summary() retorna um relatório da distribuição dos dados. Pode-se comprovar o domínio dos atributos (através de Min e Max) com valores normalizados entre 1 e 10, com exceção da classe que assume valores 2 e 4. Quantitativamente avaliandos as informações acima é possível observar, por exemplo, a uniformidade do tamanho da célula (Uniformity of Cell Size) possui metade de suas ocorrências com valores iguais a 1 e 75% são menores que 5. Dai uma média relativamente baixa, de 3,151. Para uma melhor visualização dos dados deste atributo, a função abaixo ajuda a entender que valores maiores que 5 somente acontecem para em 20% das ocorrências: Ainda sobre o mesmo atributo, calculado-se a variância temos:

3 o que significa que os valores em geral estão distantes da média (3,151). Por outro lado, a mitose (Mitoses) possui uma distribuição mais concentrada ao redor da média: fica fácil chegar a esta conclusão ao observar os quartis desta variável e a sua média (1.603): Através de um histograma podemos observar a distribuição dos dados da espessura da célula (Clump Thickness): Pode-se observar que o histograma reflete o cálculo do terceiro quartil (6,00), mostrando que valores menores que 6 são mais frequêntes na população. A função table() retorna o número de ocorrências para cada valor de um atributo específico. Executando esta função para o atributo classe: vemos que 444 instâncias são classificadas como câncer benigno e 239 maligno. Da mesma forma, podemos verificar a frenquência dos valores para o atributo Uniformity of Cell Size: A visualização fica mais fácil se utilizarmos a saída da função table() como entrada para geração de gráficos (pie e barplot). Resultados podem ser vistos na Tabela 2.

4 Class Uniformity of Cell Size Tabela Explorando Multiplas Variáveis A partir deste ponto podemos iniciar uma análise qualitativa dos dados visto a relação entre os atributos refletem comportamento e padrões de um dataset. A covariância e correlação são valores que mostram quão forte é o relacionamento entre duas variáveis. A imagem abaixo mostra a covariância entre os 10 atributos. Vale a pena destacar a forte relação entre o tamanho e formato das células (Uniformity of Cell Size e Uniformity of Cell Shape) destacado em vermelho. Em azul são destacados os atributos que variam de maneira independente entre si.

5 A imagem abaixo mostra o calculo da correlação. A correlação nada mais é que a medida padronizada da relação entre duas variáveis. Quando próximo de 1 ou -1 os atributos variam juntos através do tempo. Quando próximo de zero, a relação é menor. Podemos então concluir que o tamanho e formato das células variam juntos positivamente, ou seja, quando um cresce o outro também aumenta. Já a mitose (Mitoses) quase não tem relação com a textura da célula (Bland Chromatin). Ao agrupar dois atributos e plotar os dados dos quartis em um gráfico boxplot temos alguns resultados interessantes. No gráfico abaixo, por exemplo, é possível dizer que núcleos de células (Bland. Chromatin) com texturas mais grossas ( > 6 ), acontecem em instâncias onde a classe de câncer é maligna. Nos gráficos abaixo ficam ainda mais evidente o diagnóstico de câncer maligno para valores maiores de tamanho e forma das células. Da mesma forma, o gráfico abaixo nos apresenta as mesmas evidências encontradas acima. Para valores menores de tamanho e formato das células (Uniformity of Cell Size e Uniformity of Cell

6 Shape), temos instâncias classificadas como câncer benigno (triangulo vermelho). Para valores maiores dos mesmos atributos vemos a predominância de instâncias diagnosticadas como câncer maligno (X azul). O resultado acima esta simplificado e as instâncias com resultados próximos estão sobrepostas. A imagem abaixo apresenta uma melhor visualização da distribuição destes dados. Agora, avaliando diferentes atributos com um gráfico de densidade:

7 Notamos que a mitose (Mitoses) é mais frequênte com valores menores que 2 (já apresentado anteriormente através de sua mediana que é 1). Quanto à espessura das células (Clump Thickness), os dados estão mais dispersos, como pode ser observado também no gráfico abaixo: 3.4 Outras Formas de Visualização Por fim, a vizualização de todos os atributos em um gráfico de coordenadas paralelas. A cor vermelha representação a classe de câncer benigno e a azul maligno. Na primeira imagem, os atributos Clump Thickness, Uniformity of Cell Size, Uniformity of Cell Shape, Marginal Adhesion apresentam clara tendência a produzirem um diagnóstico de câncer maligno quando os seu valores são elevados. Na segunda image, os atributos são menos homogêneos, porém para valores acima de 9 todos eles diagnoticaram a mesma classe.

8 4. Conclusão A dase de dados de câncer de mama analisada apresenta atributos que tendem a ser dependentes entre si, com exceção do atributo Mitoses. Dessa forma, a presença de valor elevado em um atributo eleva a probabilidade de outro atributo também seguir a mesma tendência. Isso pôde ser visualizado no cálculo da covariância dos atributos. É evidente que para todos os atributos (exceto Mitoses), o aumento de seus valores caracteriza uma maior chance de diagnóstico do câncer ser maligno. Alguns atributos analisados separadamente exibem clara influência (homogeneidade) na classificação das instâncias, por exemplo, os atributos Uniformity of Cell Size, Uniformity of Cell Shape, como foi mostrados no decorrer do relatório.

9 Por todos esses aspectos, pode-se dizer que a biópsia por FNA (Fine-needle aspiration) fornece um resultado decisivo nos casos em que os parametros extraidos apresentam os valores elevados ou baixos, próximo de valor máximo ou mínimo. O exame pode exibir dados não conclusivos caso os valores dos atributos estejam próximos às médias aritméticas aqui encontradas. Nestes casos o diagnóstico não é exato e necessitaria a análise de outras características não presente nesta base.

Silva (2014) faz a classificação dos elementos no trabalho Data Mining sobre um dataset de Câncer de Mama:

Silva (2014) faz a classificação dos elementos no trabalho Data Mining sobre um dataset de Câncer de Mama: UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --

Leia mais

Estatística Descritiva (II)

Estatística Descritiva (II) Estatística Descritiva (II) Arquivo PULSE do Minitab Experimento envolvendo alunos. Cada um tem altura, peso, sexo, hábito de fumar e nível de atividade física anotados. Todos jogam moedas: se CARA, é

Leia mais

SCC0173 Mineração de Dados Biológicos

SCC0173 Mineração de Dados Biológicos SCC073 Mineração de Dados Biológicos Análise Exploratória de Dados Parte A: Revisão de Estatística Descritiva Elementar Prof. Ricardo J. G. B. Campello SCC / ICMC / USP Tópicos Análise Exploratória de

Leia mais

Estatística Descritiva (II)

Estatística Descritiva (II) Estatística Descritiva (II) Exemplo: Um experimento feito por alunos. Cada um deles registrou sua altura, peso, sexo, hábito de fumar e nível de atividade física. Depois, todos eles jogaram moedas e aqueles

Leia mais

Lista de Exercícios Cap. 2

Lista de Exercícios Cap. 2 Lista de Exercícios Cap. 2 ) Considere os dados de Sexo e Raça para os dados abaixo: Sexo F M M F M F F F M M M M M M F F F M F F F F M M F M M Raça B B B B B B B B B B B B B B B B B P B B B A B B B B

Leia mais

Relatório Técnico - SVM na base Breast Cancer Wisconsin

Relatório Técnico - SVM na base Breast Cancer Wisconsin Relatório Técnico - SVM na base Breast Cancer Wisconsin Matheus Gutoski Universidade Tecnológica Federal do Paraná - CPGEI/PPGCA Mineração de Dados 4 de novembro de 2016 1 Objetivo O objetivo deste trabalho

Leia mais

PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados -- Profs. Celso Kaestner e Heitor Lopes Trabalho #2 Regras de Associação

PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados -- Profs. Celso Kaestner e Heitor Lopes Trabalho #2 Regras de Associação UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ (UTFPR) Mineração de Dados 2016/3 Professores Celso e Heitor Jean Avila Rangel 1801317 - PPGCA PPGCA/UTFPR câmpus Curitiba -- CAIA003 - Mineração de Dados --

Leia mais

Estudando com o MATLAB

Estudando com o MATLAB Estudando com o MATLAB Curso de Extensão Docentes: > Fabiano Araujo Soares > Marcelino M. de Andrade Monitor: >Luan Felipe Aula 4: Aplicações - Parte II 1ª Parte - Estatística Aula 4-1ª Parte: Estatística

Leia mais

MAE116 Noções de Estatística

MAE116 Noções de Estatística Exercício 01 MAE116 Noções de Estatística base freq. absoluta Antes do treinamento freq. relativa (%) densidade de freq. freq. absoluta Depois do treinamento freq relativa (%) densidade de freq. 0 -- 2

Leia mais

Variável Salário: Quantitativa contínua. Para construir os histogramas solicitados temos,

Variável Salário: Quantitativa contínua. Para construir os histogramas solicitados temos, 1 Exercício 1 Variável Salário: Quantitativa contínua Para construir os histogramas solicitados temos, Tabela 1: Distribuição de frequências da variável salário Classe de Salário n i f i Amplitude i Densidade

Leia mais

DATA MINING & MACHINE LEARNING (I) Thiago Marzagão

DATA MINING & MACHINE LEARNING (I) Thiago Marzagão DATA MINING & MACHINE LEARNING (I) Thiago Marzagão Média xi N É influenciada por valores extremos. Moda É valor mais freqüente. Não é muito informativa quando a distribuição é multimodal. Mediana É valor

Leia mais

Grupo A - 1 semestre de 2012 Lista de exercícios 2 - Estatística Descritiva II C A S A (gabarito)

Grupo A - 1 semestre de 2012 Lista de exercícios 2 - Estatística Descritiva II C A S A (gabarito) Exercício 1. (1,0 ponto) Considere os dados abaixo sobre a distribuição de salário em (reais) num grupo de 1000 indivíduos. Tabela 1: Distribuição de frequências dos salários Classe de Salário Total Frequência

Leia mais

Trabalho de Modelos Lineares Generalizados

Trabalho de Modelos Lineares Generalizados Universidade Federal do Paraná Trabalho de Modelos Lineares Generalizados Ananda Bordignon 1, Brendha Lima 2, Giovanna Lazzarin 3 12 de Novembro de 2018 1 GRR20149157 2 GRR20149163 3 GRR20149088 1 SUMÁRIO

Leia mais

Excel INTERMEDIÁRIO Estatística. Prof. Cassiano Isler Turma 3

Excel INTERMEDIÁRIO Estatística. Prof. Cassiano Isler Turma 3 Excel INTERMEDIÁRIO Prof. Cassiano Isler 2017.1 - Turma 3 s s Prof. Cassiano Isler Excel INTERMEDIÁRIO - Aula 4 2 / 29 s COSTA NETO, P. L. O.. 2. ed. São Paulo: Edgard Blücher (2002). GÓMEZ, Luis Alberto.

Leia mais

Módulo VII: Estatística elementar

Módulo VII: Estatística elementar Módulo VII: Estatística elementar 166 Revisão 167 Palavras-chave em estatística A estatística é composta por um conjunto de métodos destinados à coleta, à apresentação, à análise e à interpretação de dados,

Leia mais

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 2019 Estatística Descritiva e Análise Exploratória Etapas iniciais. Utilizadas para descrever e resumir os dados. A disponibilidade de uma grande quantidade

Leia mais

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos.

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos. Na Criptologia, assim como em outras ciências, são realizados estudos experimentais ou obser vacionais que resultam numa coleção de dados numéricos. O propósito da investigação é responder uma questão

Leia mais

PARTE 1. Profa. Dra. Alessandra de Ávila Montini

PARTE 1. Profa. Dra. Alessandra de Ávila Montini PARTE 1 Programa de Pós-graduação do Departamento de Administração PPGA Agenda 2 14:00 15:30 Fundamentação Teórica 15:30 15:45 Coffee break 15:45 17:00 Fundamentação Teórica 17:00 18:00 Exercícios de Fixação

Leia mais

Apostila de estatística básica Minitab Organizador: Daniel Magalhães Lima. Autores:

Apostila de estatística básica Minitab Organizador: Daniel Magalhães Lima. Autores: Apostila de estatística básica Minitab Organizador: Daniel Magalhães Lima Autores: Sumário Importando dados... 3 Explorando dados Tendência central, dispersão e gráficos... 3 Teste de normalidade... 3

Leia mais

Grupo A - I semestre de 2014 Lista de exercícios 2 - Introdução à Estatística Descritiva C A S A (gabarito)

Grupo A - I semestre de 2014 Lista de exercícios 2 - Introdução à Estatística Descritiva C A S A (gabarito) Exercício 1. (2,0 pontos). Um pesquisador pretende comparar o tempo de reação (segundos) para dois tipos diferentes de estímulos visuais, A e B. Na tabela abaixo, esses tempos foram obtidos para 20 e 19

Leia mais

Software para detecção de melanoma para ios

Software para detecção de melanoma para ios Software para detecção de melanoma para ios Aluno: Thiago Pradi Orientador: Aurélio Faustino Hoppe Motivação Câncer configura-se como um problema de saúde pública mundial Cânceres de pele tiveram um crescimento

Leia mais

Usar minigráficos para mostrar tendências de dados

Usar minigráficos para mostrar tendências de dados Página 1 de 5 Excel > Planilhas > Exibindo dados Novidade no Microsoft Excel 2010, um minigráfico é um pequeno gráfico em uma célula de planilha que fornece uma representação visual de dados. Use minigráficos

Leia mais

Capítulo 1. Análise Exploratória de Dados

Capítulo 1. Análise Exploratória de Dados Capítulo 1 Análise Exploratória de Dados Introdução A finalidade da Análise Exploratória de Dados (AED) é examinar os dados previamente à aplicação de qualquer técnica estatística. Desta forma o analista

Leia mais

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina (Machine Learning) Ciência da Computação Aprendizado de Máquina (Machine Learning) Aula 09 Árvores de Decisão Max Pereira Classificação É a tarefa de organizar objetos em uma entre diversas categorias pré-definidas. Exemplos

Leia mais

Estatística Aplicada à Administração com o software KNIME. Prof. Dr. Evandro Marcos Saidel Ribeiro

Estatística Aplicada à Administração com o software KNIME. Prof. Dr. Evandro Marcos Saidel Ribeiro UNIVERSIDADE DE SÃO PAULO FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE ADMINISTRAÇÃO Estatística Aplicada à Administração com o software KNIME Prof. Dr. Evandro

Leia mais

USO DE TÉCNICAS DE SEGMENTAÇÃO NA ANÁLISE DE IMAGENS DE TOMOGRAFIA COMPUTADORIZADA DE PULMÕES COM DPOC

USO DE TÉCNICAS DE SEGMENTAÇÃO NA ANÁLISE DE IMAGENS DE TOMOGRAFIA COMPUTADORIZADA DE PULMÕES COM DPOC USO DE TÉCNICAS DE SEGMENTAÇÃO NA ANÁLISE DE IMAGENS DE TOMOGRAFIA COMPUTADORIZADA DE PULMÕES COM DPOC 1 2 3 Fausta Joaquim Faustino, Álisson Gomes Linhares, John Hebert Da Silva Felix Resumo: O uso das

Leia mais

Prof. Heitor Silvério Lopes

Prof. Heitor Silvério Lopes Prof. Heitor Silvério Lopes WEKA WEKA: Waikato Environment for Knowledge Analysis Iniciado em 1992, versão estável atual: 3.8.1 É um software para mineração de dados desenvolvido em Java com código aberto

Leia mais

Medidas Descritivas de Posição, Tendência Central e Variabilidade

Medidas Descritivas de Posição, Tendência Central e Variabilidade Medidas Descritivas de Posição, Tendência Central e Variabilidade Prof. Gilberto Rodrigues Liska UNIPAMPA 29 de Agosto de 2017 Material de Apoio e-mail: [email protected] Local: Sala dos professores

Leia mais

Descrevendo Distribuições com Números TADI

Descrevendo Distribuições com Números TADI Descrevendo Distribuições com Números TADI 1 Quanto ganha quem tem curso superior? Entrevistamos 15 pessoas que responderam (em milhares de R$/mês): 11 2,5 5 5 5,5 3 3,5 3 0,4 3,2 5 3 3,2 7,4 6 Salário

Leia mais

Estatística I Aula 2. Prof.: Patricia Maria Bortolon, D. Sc.

Estatística I Aula 2. Prof.: Patricia Maria Bortolon, D. Sc. Estatística I Aula 2 Prof.: Patricia Maria Bortolon, D. Sc. Análise Exploratória de Dados Consiste em resumir e organizar os dados coletados Utiliza-se tabelas, gráficos ou medidas numéricas para resumir

Leia mais

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU

Aula 6 Mineração Streams Representação dos Dados. Profa. Elaine Faria UFU Aula 6 Mineração Streams Representação dos Dados Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof. Andre C. P. L. F. Carvalho Agradecimentos

Leia mais

Elementos de Estatística

Elementos de Estatística Elementos de Estatística Lupércio F. Bessegato & Marcel T. Vieira UFJF Departamento de Estatística 2013 Medidas Resumo Medidas Resumo Medidas que sintetizam informações contidas nas variáveis em um único

Leia mais

Bio Estatística Aula 4

Bio Estatística Aula 4 Bio Estatística 2011 - Aula 4 Claus Aranha 19 de Agosto de 2011 Percentis, Box Plot, Histograma e similares Revisão: Independência e Prob. Condicional Se eu jogo dois dados normais, D 1 e D 2. Quais dos

Leia mais

Tipos de gráficos disponíveis

Tipos de gráficos disponíveis Tipos de gráficos disponíveis Mostrar tudo O Microsoft Office Excel 2007 oferece suporte para vários tipos de gráficos com a finalidade de ajudar a exibir dados de maneiras que sejam significativas para

Leia mais

Tutorial para o desenvolvimento das Oficinas

Tutorial para o desenvolvimento das Oficinas Tutorial para o desenvolvimento das Oficinas 1 Métodos Quantitativos Profa. Msc. Regina Albanese Pose 2 Objetivos Objetivo Geral Este tutorial tem como objetivo parametrizar o desenvolvimento da oficina

Leia mais

DISCIPLINA: ESTATÍSTICA I (CÓD. ENEC60015) PERÍODO: 3º PERÍODO

DISCIPLINA: ESTATÍSTICA I (CÓD. ENEC60015) PERÍODO: 3º PERÍODO PLANO DE AULA DISCIPLINA: ESTATÍSTICA I (CÓD. ENEC60015) PERÍODO: 3º PERÍODO TOTAL DE SEMANAS: 20 SEMANAS TOTAL DE ENCONTROS: 40 AULAS Aulas Conteúdos/ Matéria Tipo de aula Textos, filmes e outros materiais

Leia mais

Pontifícia Universidade Católica do Rio de Janeiro. Departamento de Informática. Fundamentos de Computação Gráfica

Pontifícia Universidade Católica do Rio de Janeiro. Departamento de Informática. Fundamentos de Computação Gráfica 1. Imagens sísmicas Pontifícia Universidade Católica do Rio de Janeiro Departamento de Informática Fundamentos de Computação Gráfica Aluno: Stelmo Magalhães Barros Netto Relatório do trabalho Imagens Sísmicas

Leia mais

APONTAMENTOS DE SPSS

APONTAMENTOS DE SPSS Instituto de Ciências Biomédicas de Abel Salazar APONTAMENTOS DE SPSS Rui Magalhães 2010-1 - - 2 - Menu DATA Opção SPLIT FILE Permite dividir, de uma forma virtual, o ficheiro em diferentes ficheiros com

Leia mais

CURSO RÁPIDO. E l a b o r a ç ã o : W a n d e r s o n K l e b e r d e O l i v e i r a W i l d o N a v e g a n t e s d e A r a u j o

CURSO RÁPIDO. E l a b o r a ç ã o : W a n d e r s o n K l e b e r d e O l i v e i r a W i l d o N a v e g a n t e s d e A r a u j o CURSO RÁPIDO E l a b o r a ç ã o : W a n d e r s o n K l e b e r d e O l i v e i r a W i l d o N a v e g a n t e s d e A r a u j o 1 9 / 0 7 / 2 0 1 5 RSTUDIO CURSO RÁPIDO INSTALAÇÃO R (Linguagem de programação)

Leia mais

Estatística Descritiva

Estatística Descritiva C E N T R O D E M A T E M Á T I C A, C O M P U T A Ç Ã O E C O G N I Ç Ã O UFABC Estatística Descritiva Centro de Matemática, Computação e Cognição March 17, 2013 Slide 1/52 1 Definições Básicas Estatística

Leia mais

Conceito de Estatística

Conceito de Estatística Conceito de Estatística Estatística Técnicas destinadas ao estudo quantitativo de fenômenos coletivos, observáveis. Unidade Estatística um fenômeno individual é uma unidade no conjunto que irá constituir

Leia mais

Relatório de estatística - Análise dos registros de alunos no Prouni no ano de 2016

Relatório de estatística - Análise dos registros de alunos no Prouni no ano de 2016 Relatório de estatística - Análise dos registros de alunos no Prouni no ano de 2016 Bruno H. Meyer & Gabriel Olescki Estatística II - CE003 Turma K Prof. Paulo Justiniano Ribeiro Lima 12 de dezembro de

Leia mais

Medidas de Posição. Tendência Central. É um valor que representa uma entrada típica, ou central, de um conjunto de dados. média. mediana.

Medidas de Posição. Tendência Central. É um valor que representa uma entrada típica, ou central, de um conjunto de dados. média. mediana. Tendência Central É um valor que representa uma entrada típica, ou central, de um conjunto de dados. média mediana moda Análise exploratória de dados Histograma Simétrico Uniforme Média = Mediana Assimétrico

Leia mais

DESENVOLVIMENTO DE UM ALGORITMO PARA REDUÇÃO DE ERROS EM MAPAS DE RENDIMENTO OBTIDOS EM AGRICULTURA DE PRECISÃO

DESENVOLVIMENTO DE UM ALGORITMO PARA REDUÇÃO DE ERROS EM MAPAS DE RENDIMENTO OBTIDOS EM AGRICULTURA DE PRECISÃO DESENVOLVIMENTO DE UM ALGORITMO PARA REDUÇÃO DE ERROS EM MAPAS DE RENDIMENTO OBTIDOS EM AGRICULTURA DE PRECISÃO Aluno: Leandro M. Gimenez Orientador: Prof. Dr. José Paulo Molin INTRODUÇÃO A geração de

Leia mais

Material Teórico - Módulo Matrizes e Sistemas Lineares. Sistemas Lineares - Parte 2. Terceiro Ano do Ensino Médio

Material Teórico - Módulo Matrizes e Sistemas Lineares. Sistemas Lineares - Parte 2. Terceiro Ano do Ensino Médio Material Teórico - Módulo Matrizes e Sistemas Lineares Sistemas Lineares - Parte 2 Terceiro Ano do Ensino Médio Autor: Prof Fabrício Siqueira Benevides Revisor: Prof Antonio Caminha M Neto 1 A representação

Leia mais

Data Mining sobre um dataset de Câncer de Mama

Data Mining sobre um dataset de Câncer de Mama Data Mining sobre um dataset de Câncer de Mama Fabio Luis Silva 1 1 Programa de PósGraduação em Computação Aplicada da Universidade Tecnológica Federal do Paraná Curitiba, PR Brasil [email protected]

Leia mais

Estatística Descritiva (II)

Estatística Descritiva (II) Estatística Descritiva (II) Exemplo 1 Projeto Qualidade de Vida Dados CEA15P01: Projeto Avaliação da fadiga em mulheres com câncer de mama durante o tratamento quimioterápico Estudo realizado pela Escola

Leia mais

PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA

PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA DESCRITIVA Prof.ª Sheila Regina Oro Projeto Recursos Educacionais Digitais Autores: Bruno Baierle e Maurício Furigo ESTATÍSTICA DESCRITIVA A Estatística Descritiva

Leia mais

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Análise de Dados. Sylvio Barbon Junior 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1

Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II. Análise de Dados. Sylvio Barbon Junior 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1 Tópicos Especiais: INTELIGÊNCIA DE NEGÓCIOS II Análise de Dados Sylvio Barbon Junior [email protected] 29 de julho de 2016 DC-UEL Sylvio Barbon Jr 1 Sumário Introdução Caracterização de Dados Exploração de

Leia mais

Medidas de localização (ou de tendência central) Média: definida como o centro de massa (ou ponto de equilíbrio) do conjunto.

Medidas de localização (ou de tendência central) Média: definida como o centro de massa (ou ponto de equilíbrio) do conjunto. Aula 02 01 de abril Medidas de localização (ou de tendência central) Média: definida como o centro de massa (ou ponto de equilíbrio) do conjunto. No geral, a melhor média é a que mais se aproxima do centro

Leia mais

Instituições de Ensino Superior Docentes Pertencentes a Unidades FCT. Indicadores Bibliométricos 2008-2012. Física e Astronomia

Instituições de Ensino Superior Docentes Pertencentes a Unidades FCT. Indicadores Bibliométricos 2008-2012. Física e Astronomia Instituições de Ensino Superior Docentes Pertencentes a Unidades FCT Indicadores Bibliométricos 2008-2012 INTRODUÇÃO A presente publicação resume os principais resultados de um estudo bibliométrico realizado

Leia mais

Distribuição Normal. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011

Distribuição Normal. Prof a Dr a Alcione Miranda dos Santos. Abril, 2011 Distribuição Normal Prof a Dr a Alcione Miranda dos Santos Universidade Federal do Maranhão Programa de Pós-Graduação em Saúde Coletiva email:[email protected] Abril, 2011 1 / 18 Sumário Introdução

Leia mais

Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine)

Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine) Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine) Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc. Chap 6-1 Objetivos: Neste capítulo, você aprenderá:

Leia mais

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012 1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à

Leia mais

Estatística I Aula 3. Prof.: Patricia Maria Bortolon, D. Sc.

Estatística I Aula 3. Prof.: Patricia Maria Bortolon, D. Sc. Estatística I Aula 3 Prof.: Patricia Maria Bortolon, D. Sc. Estatística: Prof. André Carvalhal Dados quantitativos: medidas numéricas Propriedades Numéricas Tendência Central Dispersão Formato Média Mediana

Leia mais

8 JÚLIO CESAR R. PEREIRA

8 JÚLIO CESAR R. PEREIRA SUMÁRIO Lista de Tabelas... 09 Lista de Figuras... 11 Agradecimentos... 15 Apresentação... 17 Prefácio... 19 1. O Dado Qualitativo... 21 O Dado e o Evento... 21 A Análise de Dados Qualitativos e a Pesquisa

Leia mais

AULA 8 Experimentos multinomiais e tabelas de contingência

AULA 8 Experimentos multinomiais e tabelas de contingência 1 AULA 8 Experimentos multinomiais e tabelas de contingência Ernesto F. L. Amaral 05 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas

Leia mais

Estatística: Objetivos e fundamentos

Estatística: Objetivos e fundamentos AULA/TEMA Estatística Básica Estatística: Objetivos e fundamentos Profa. Vanessa Ziotti Conteúdo Programático Estatística. O que é? Inferência estatística Estatística descritiva e experimental Termos estatísticos

Leia mais

METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA

METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA A FASE ANALÍTICA TCOR ENGEL SILVA COSTA [email protected]/226013 2 METODOLOGIA DE INVESTIGAÇÃO CIENTÍFICA Previamente ao início da recolha de dados, o investigador

Leia mais

Estatísticas Descritivas. Estatística

Estatísticas Descritivas. Estatística Estatística Estatísticas descritivas: usadas para mostrar/descrever algumas informações da amostra, ou seja, servem para fazer um resumo ou descrição dos dados. Não consideram a origem dos dados. Exemplos:

Leia mais

Estatística Descritiva

Estatística Descritiva Flávio B. Gonçalves Baseado no material do Prof. Marcos Prates 2018/01 1 Introdução O que é Estatística População e Amostra O papel da Inferência Estatística 2 Tipos de Variáveis Gráficos e Tabelas Sintese

Leia mais

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação

Física Geral - Laboratório. Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação Física Geral - Laboratório Aula 2: Organização e descrição de dados e parâmetros de dispersão e correlação 1 Física Geral - Objetivos Ao final do período, o aluno deverá ser capaz de compreender as principais

Leia mais