Tutorial CRISP-DM. Conteúdo. 2. Entendimento dos Dados. 1. Entendimento do Negócio. Objetivo; Descrição.
|
|
- Lucca de Almeida Barateiro
- 6 Há anos
- Visualizações:
Transcrição
1
2 Tutorial CRISP-DM Conteúdo 1. Entendimento do Negócio Objetivo; Descrição. 2. Entendimento dos Dados Carregamento dos dados; Descrição estatística; Visualização.
3 Tutorial CRISP-DM Conteúdo 3. Preparação dos Dados Missing data ; Engenharia de features. 4. Modelagem Construção do modelo. 5. Avaliação Desempenho do modelo; Importância das features (características); Seleção de Modelos. 6. Deployment Submissão dos resultados.
4 1- Entendimento do negócio Qual é a pergunta? É possível prever se um passageiro do Titanic irá sobreviver ao naufrágio?
5 1- Entendimento do negócio Descrição No naufráugio do Titanic em 1912, 1502 dos 2224 passageiros morreram na tragédia; O motivo principal das mortes foi a falta de coletes salvavidas em número suficiente para os passageiros e tripulação; Tirando o fator sorte, foi constatado que alguns grupos de pessoas apresentaram taxas de sobrevivência maiores em relação a outros grupos: Mulheres; Crianças; Passageiros da 1ª classe. O objetivo da análise é tentar prever se um passageiro escolhido de forma aleatória irá sobreviver ao naufágio.
6 1- Entendimento do negócio Pergunta: Na sua opinião, quais os fatores que mais contribuíram para a sobrevivência de alguns passageiros?
7 2- Entendimento dos dados Carregamento dos dados No site do tutorial, baixe os arquivos train.csv e test.csv em uma pasta com o nome input. O arquivo de treinamento será usado para a tarefa de mineração. É a partir dele que iremos treinar o nosso modelo. O arquivo de testes será usado para prever a sobrevivência de um certo grupo de passageiros. Os dados desse arquivo não podem ser usados no treinamento do modelo. Por quê?
8 2- Entendimento dos dados Descrição estatística Vamos estudar primeiro as variáveis, visualizando as primeiras linhas do arquivo de treinamento.
9 2- Entendimento dos dados Descrição estatística O arquivo de treinamento possui 1309 passageiros, com 12 variáveis: Survived: Sobreviveu (1) or Não Sobreviveu (0) Pclass: A classe do passageiro (1, 2 e 3) Name: O nome do passageiro Sex: O sexo do passageiro Age: A idade do passageiro SibSp: Número de irmãos ou cônjuges a bordo Parch: Number of pais ou crianças a bordo Ticket: Número da passagem Fare: Valor da passagem Cabin: Identificação do Quarto/Cabine Embarked: Porto de embarque (C = Cherbourg, Q = Queenstown, S = Southampton)
10 2- Entendimento dos dados Descrição estatística Média, mediana, desvio padrão dos dados numéricos Algum número chamou a sua atenção?
11 2- Entendimento dos dados Descrição estatística Matriz de covariância
12 2- Entendimento dos dados Descrição estatística Distribuição da idade e sexo dos passageiros
13 2- Entendimento dos dados Qual a idade de homens e mulheres com a maior probabilidade de sobrevivência?
14 2- Entendimento dos dados Entendimento dos dados Repetir a análise da frequência para cada variável numérica. Tentar estimar as probabilidades de sobrevivência para cada variável.
15 2- Entendimento dos dados Entendimento dos dados Repetir a análise da frequência para cada variável numérica. Tentar estimar as probabilidades de sobrevivência para cada variável.
16 2- Entendimento dos dados Entendimento dos dados Repetir a análise da frequência para cada variável numérica. Tentar estimar as probabilidades de sobrevivência para cada variável.
17 2- Entendimento dos dados Entendimento dos dados Repetir a análise da frequência para cada variável numérica. Tentar estimar as probabilidades de sobrevivência para cada variável.
18 2- Entendimento dos dados Entendimento dos dados Plotar a frequência das variáveis categóricas
19 2- Entendimento dos dados Entendimento dos dados Repetir a análise para outras variáveis categóricas: Sexo do passageiro, Classe, Número de cônjuges/irmãos, pais/filhos.
20 3- Preparação dos dados Transformação das variáveis categóricas Porto de embarque, classe e sexo do passageiro podem ser convertidas para valores numéricos. Alguns algoritmos de mineração só tratam dados numéricos. sex = pd.series( np.where( full.sex == 'male', 1, 0 ), name = 'Sex' )
21 3- Preparação dos dados Missing data Olhando os dados, verificou-se que vários passageiros não informaram a idade. As informações sobre o valor da passagem não estão disponíveis para todos os passageiros. O que fazer com os dados que faltam?
22 3- Preparação dos dados Missing data Solução simples: colocar a média nos dados em falta
23 3- Preparação dos dados Engenharia de features Criar outras variáveis a partir da conjunto original. Objetivo: enriquecer o conjunto de treinamento. É uma arte! Você consegue criar outras variáveis, olhando o quadro abaixo?
24 3- Preparação dos dados Engenharia de features Soluções (criativas) dos participantes do desafio do Kaggle: Extrair o título de nobreza dos passageiros pelo nome Ex.: Major -> Oficial, Sir -> Realeza, Lady -> Realeza, Mr -> Passageiro Comum, etc...
25 3- Preparação dos dados Engenharia de features Soluções (criativas) dos participantes do desafio do Kaggle: Extrair a categoria da cabine através do número Ex.: Primeira letra da cabine define a categoria: A, B, E, U. etc.
26 3- Preparação dos dados Engenharia de features Soluções (criativas) dos participantes do desafio do Kaggle: Extrair a classe da passagem pelo número Ex.: A, A4, A5, AQ3, etc.
27 3- Preparação dos dados Engenharia de features Soluções (criativas) dos participantes do desafio do Kaggle: Extrair o tamanho da família pela quantidade de filhos/irmãos/cônjuge/
28 3- Preparação dos dados Engenharia de features
29 3- Preparação dos dados Juntando tudo em um único conjunto Das variáveis comuns, idade e preço da passagem apresentam as maiores correlações com a taxa de sobrevivência. Juntar idade e preço com as novas variáveis
30 3- Preparação dos dados Avaliando a importância das novas variáveis Quais estão mais fortemente correlacionadas com a sobrevivência do passageiro?
31 4- Modelagem Seleção da técnica de mineração de dados Separar aleatoriamente os dados em treinamento e teste. Escolher a técnica de aprendizagem de máquina mais adequada ao problema. Exemplos: Random Forest Support Vector Machines Gradient Boosting K-nearest neighbors Gaussian Naive Bayes Logistic Regression
32 5- Avaliação O conjunto de testes não deve ser usado no treinamento. Avaliação estatística: repetir a avaliação diversas vezes e obter a média e desvio dos desempenhos. Escolher a técnica de aprendizagem de máquina que obtém os melhores resultados no conjunto de teste: Random Forest: 76% de acerto Support Vector Machines: 68% de acerto Gradient Boosting: 83% de acerto K-nearest neighbors: 65% de acerto Gaussian Naive Bayes: 67% de acerto Logistic Regression: 79% de acerto
33 6- Deployment Um dos modelos alcançou 83% de taxa de acerto. Voltando à pergunta original: É possível prever se um passageiro do Titanic irá sobreviver ao naufrágio? Se sim, o modelo poderá ser utilizado para prever a probabilidade de sobrevivência de outros passageiros. Se não, as variáveis não conseguem explicar (prever) a sobrevivência.
34 Tutorial CRISP-DM Código completo em
35 Outras competições atuais do Kaggle Previsão do nível de ameaça de um passageiro de avião, baseado na imagem de scanner corporal. Prêmio de US$ 1.5M!
36 Outras competições atuais do Kaggle Previsão do preço de avaliação de imóveis do mercado americano Prêmio de US$ 1.2M!
Estatística e Matemática Aplicadas a Data Science. Diógenes Justo BM&FBOVESPA & Professor FIAP
Estatística e Matemática Aplicadas a Data Science Diógenes Justo BM&FBOVESPA & Professor FIAP Agenda Modelagem para Data Science (Matemática e Estatística) Detecção de Fraudes Forecast (financeiro) Conclusões
Leia maisWEKA: Prática Carregando a base de dados no Weka
WEKA: Prática 2 1. Introdução O objetivo desta prática é utilizar a ferramenta Weka para comparar dois algoritmos de aprendizagem de máquina em um problema de detecção de SPAM. Os algoritmos a serem comparados
Leia maisClassificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si
Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si Classificação de Dados Os modelos de classificação de dados são preditivos, pois desempenham inferências
Leia maisPlano. Aspectos Relevantes de HMMs. Teoria de HMMs. Introdução aos Modelos Escondidos de Markov
Plano Esta apresentação é para pessoas sem conhecimento prévio de HMMs Introdução aos Modelos Escondidos de Markov 2004 Objetivos: Ensinar alguma coisa, não tudo (Visão geral, sem muitos detalhes). Tentar
Leia maisFACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS
FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS PROJETO PEDAGÓGICO CAMPO LIMPO PAULISTA 2015 1. Público
Leia maisProf. Daniela Barreiro Claro
O volume de dados está crescendo sem parar Gigabytes, Petabytes, etc. Dificuldade na descoberta do conhecimento Dados disponíveis x Análise dos Dados Dados disponíveis Analisar e compreender os dados 2
Leia maisComo usar Tabela Dinâmica (Pivot Table) Exemplo Prático. Este conteúdo faz parte da série: Excel Tabelas e Tabelas Dinâmicas Ver 5 posts dessa série
Este conteúdo faz parte da série: Excel Tabelas e Tabelas Dinâmicas Ver 5 posts dessa série O Excel é um aplicativo poderoso do pacote Microsoft Office que pode ser empregado em diversas áreas do conhecimento:
Leia maisDISCIPLINA: ESTATÍSTICA I (CÓD. ENEC60015) PERÍODO: 3º PERÍODO
PLANO DE AULA DISCIPLINA: ESTATÍSTICA I (CÓD. ENEC60015) PERÍODO: 3º PERÍODO TOTAL DE SEMANAS: 20 SEMANAS TOTAL DE ENCONTROS: 40 AULAS Aulas Conteúdos/ Matéria Tipo de aula Textos, filmes e outros materiais
Leia maisMétodos Estatísticos Básicos
Aula 1 - Conceitos introdutórios Departamento de Economia Universidade Federal de Pelotas (UFPel) Março de 2014 Importância da estatística na economia A economia, em geral, é uma ciência não-experimental.
Leia maisAprendizagem de Máquina
Aprendizagem de Máquina Avaliação de Paradigmas Alessandro L. Koerich Mestrado/Doutorado em Informática Pontifícia Universidade Católica do Paraná (PUCPR) Mestrado/Doutorado em Informática Aprendizagem
Leia maisAnexo 1 - Revisões de Teoria das Probabilidades e Processos Estocásticos
1 Anexo 1 - Revisões de Teoria das Probabilidades e Processos Estocásticos Documento auxiliar à disciplina de Modelação, Identificação e Controlo Digital Alexandre Bernardino IST-Secção de Sistemas e Controlo
Leia maisVISÃO COMPUTACIONAL. Marcelo Henrique dos Santos
VISÃO COMPUTACIONAL Marcelo Henrique dos Santos marcelosantos@outlook.com São Paulo SP, Agosto/2013 INTRODUÇÃO Processamento de imagens é um processo onde a entrada do sistema é uma imagem e a saída é
Leia maisFilho, não é um bicho: chama-se Estatística!
Paulo Jorge Silveira Ferreira Filho, não é um bicho: chama-se Estatística! Estatística aplicada uma abordagem prática FICHA TÉCNICA EDIÇÃO: Paulo Ferreira TÍTULO: Filho, não é um bicho: chama-se Estatística!
Leia maisMáquinas de suporte vetorial e sua aplicação na detecção de spam
e sua aplicação na detecção de spam Orientador: Paulo J. S. Silva (IME-USP) Universidade de São Paulo Instituto de Matemática e Estatística Departamento de Ciência da Computação MAC499 Trabalho de Formatura
Leia maisAnálise de Risco de Crédito Bancário
UNIVERSIDADE FEDERAL DE CAMPINA GRANDE UFCG Curso de Mestrado em Informática Aluno: Francisco Fabian de Macedo Almeida Disciplina: Mineração de Dados Professor: Marcos Sampaio Data: 20 de dezembro de 2007
Leia maisMATERIAL COMPLEMENTAR: SPSS
MATERIAL COMPLEMENTAR: SPSS O Statistical Package for Social Sciences (SPSS) é um software para criação de modelos estatísticos de análise a partir de uma base de dados. Seu layout é semelhante ao do Microsoft
Leia maisDCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...
DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar
Leia maisINF 1771 Inteligência Artificial
Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 24 Aprendizado Por Reforço Formas de Aprendizado Aprendizado Supervisionado Árvores de Decisão. K-Nearest Neighbor (KNN).
Leia maisPesquisa e Desenvolvimento de um Método de Aprendizagem de Máquina com Aprendizado Incremental
Universidade de Brasília - UnB Faculdade UnB Gama - FGA Engenharia de Software Pesquisa e Desenvolvimento de um Método de Aprendizagem de Máquina com Aprendizado Incremental Autores: Gustavo Corrêia de
Leia maisLes Estatística Aplicada II AMOSTRA E POPULAÇÃO
Les 0407 - Estatística Aplicada II AMOSTRA E POPULAÇÃO AULA 1 04/08/16 Prof a Lilian M. Lima Cunha Agosto de 2016 Estatística 3 blocos de conhecimento Estatística Descritiva Levantamento e resumo de dados
Leia maisANÁLISE DE SOBREVIVÊNCIA. Airlane P. Alencar IME-USP Alessandra C. Goulart FM-USP
ANÁLISE DE SOBREVIVÊNCIA Airlane P. Alencar IME-USP Alessandra C. Goulart FM-USP Objetivo Estudar o tempo desde um instante inicial até a ocorrência de um evento (alha). Estudar o tempo de sobrevida de
Leia maisInfluência do Tamanho do Bloco na DCT
LICENCIATURA EM ENGENHARIA ELECTROTÉCNICA E DE COMPUTADORES TELEVISÃO DIGITAL 2005/06 Influência do Tamanho do Bloco na DCT Autores: Carlos Graf Nuno Lima Grupo 4 Novembro de 2005 ÍNDICE 1. INTRODUÇÃO...
Leia maisPopulação e Amostra. População: O conjunto de todas as coisas que se pretende estudar. Representada por tudo o que está no interior do desenho.
População e Amostra De importância fundamental para toda a análise estatística é a relação entre amostra e população. Praticamente todas as técnicas a serem discutidas neste curso consistem de métodos
Leia maisRESOLUÇÃO DA PROVA DE RACIOCÍCNIO LÓGICO, MATEMÁTICA E ESTATÍSTICA P/ PAPILOSCOPISTA
RESOLUÇÃO DA PROVA DE RACIOCÍCNIO LÓGICO, MATEMÁTICA E ESTATÍSTICA P/ PAPILOSCOPISTA Olá galera!!!! Hoje estou postando a resolução da prova de Raciocínio Lógico para agente penitenciário do DF, ocorrida
Leia maisFace Recognition using RGB-D Images
Face Recognition using RGB-D Images Helder C. R. de Oliveira N.USP: 7122065 Polyana Nunes N.USP: 9043220 Sobre o Artigo Publication: 2013 IEEE Sixth International Conference Author(s) Goswami, G. (Índia
Leia maisMineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.
Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães. O que é mineração de dados Mineração de Dados é um passo no processo de KDD que consiste na aplicação de análise de dados e algoritmos
Leia maisMOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel
MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,
Leia maisModelo de Variáveis discretas. Regressão com uma variável dependente Binária. Variáveis dependentes Binárias. Modelo de Probabilidade Linear
Regressão com uma variável dependente Binária Capítulo 9 Stock e Watson. Econometria. Modelo de Variáveis discretas P(y = 1 x) = G(β 0 + xβ) y* = β 0 + xβ + u, y = max(0,y*) 1 2 Variáveis dependentes Binárias
Leia maisMAE116 Noções de Estatística
Exercício 01 MAE116 Noções de Estatística base freq. absoluta Antes do treinamento freq. relativa (%) densidade de freq. freq. absoluta Depois do treinamento freq relativa (%) densidade de freq. 0 -- 2
Leia maisMaldição da dimensionalidade
EXTRAÇÃO E SELEÇÃO DE ATRIBUTOS Maldição da dimensionalidade 2 Maldição da dimensionalidade (ou Curse of dimensionality) Termo que se refere a vários fenômenos que surgem na análise de dados em espaços
Leia maisINCORPORARAÇÃO DA GEOESTATÍSTICA A PREVISÕES DE ESCOLHA MODAL
INCORPORARAÇÃO DA GEOESTATÍSTICA A PREVISÕES DE ESCOLHA MODAL Viviani Antunes Gomes Cira Souza Pitombo INCORPORARAÇÃO DA GEOESTATÍSTICA A PREVISÕES DE ESCOLHA MODAL Viviani Antunes Gomes Cira Souza Pitombo
Leia maisCapítulo 3: Elementos de Estatística e Probabilidades aplicados à Hidrologia
Departamento de Engenharia Civil Prof. Dr. Doalcey Antunes Ramos Capítulo 3: Elementos de Estatística e Probabilidades aplicados à Hidrologia 3.1 - Objetivos Séries de variáveis hidrológicas como precipitações,
Leia mais17/10/2012. dados? Processo. Doutorado em Engenharia de Produção Michel J. Anzanello. Doutorado EP - 2. Doutorado EP - 3.
Definição de Data Mining (DM) Mineração de Dados (Data Mining) Doutorado em Engenharia de Produção Michel J. Anzanello Processo de explorar grandes quantidades de dados à procura de padrões consistentes
Leia maisCurso de IPE Aula 1 de Estatística Descritiva. Prof. Dr. Valdecir Marvulle 2013
Curso de IPE Aula 1 de Descritiva Prof. Dr. Valdecir Marvulle 2013 Dados: Coleção de fatos numéricos observados. Exemplos: Peso dos pacientes atendidos numa unidade de saúde. Freqüência respiratória após
Leia maisAnexo 1 - Revisões de Teoria das Probabilidades e Processos Estocásticos
1 Anexo 1 - Revisões de Teoria das Probabilidades e Processos Estocásticos Documento auxiliar à disciplina de Modelação, Identificação e Controlo Digital Alexandre Bernardino 003/005 IST-Secção de Sistemas
Leia maisEstatística Descritiva (I)
Estatística Descritiva (I) O que é Estatística Para muitos, a Estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são as pessoas que coletam esses dados. A Estatística originou-se
Leia maisSumário. Apresentação...17 Prefácio à 5ª edição...19 Prefácio...21
Sumário Apresentação...17 Prefácio à 5ª edição...19 Prefácio...21 1 Simulação...25 1.1 Modelagem de sistemas...25 1.2 Aspectos históricos...26 1.2.1 Teoria das filas...26 1.2.2 Simulação...26 1.3 Aplicações
Leia maisUNIVERSIDADE FEDERAL DA PARAÍBA CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I
UNIVERSIDADE FEDERAL DA PARAÍBA CÁLCULO DAS PROBABILIDADES E ESTATÍSTICA I Departamento de Estatística Tarciana Liberal CONCEITOS FUNDAMENTAIS DE ESTATÍSTICA O que a Estatística significa para você? Pesquisas
Leia maisExemplo Cupons com Desconto
Exemplo Cupons com Desconto Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2013 G. A. Paula (IME-USP) Cupons com Desconto 2 o Semestre 2013 1 / 21 Cupons
Leia maisMEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso
MEDIDAS DE POSIÇÃO E DE DISPERSÃO Profª Andréa H Dâmaso Bioestatística e Delineamento Experimental - 2012 Tópicos da aula Medidas de tendência central e dispersão Variáveis contínuas: distribuição normal
Leia maisAmostragem e distribuições por amostragem
Amostragem e distribuições por amostragem Carla Henriques e Nuno Bastos Departamento de Matemática Escola Superior de Tecnologia de Viseu Contabilidade e Administração População, amostra e inferência estatística
Leia maisAFRF Exercícios Tele-Transmitido. Prof. Sérgio Altenfelder Estatística - 01
01. Para dados agrupados representados por uma curva de freqüências, as diferenças entre os valores da média, da mediana e da moda são indicadores da assimetria da curva. Indique a relação entre essas
Leia maisResolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.
de Matemática Financeira e Estatística do ISS Teresina, aplicada em 8/08/016. 11 - (ISS Teresina 016 / FCC) Joana aplicou todo seu capital, durante 6 meses, em bancos ( e Y). No Banco, ela aplicou 37,5%
Leia maisProbabilidade e Estatística. stica. Introdução. Prof.Ms. Carlos Henrique J.Costa.
Probabilidade e Estatística stica Introdução Prof.Ms. Carlos Henrique J.Costa Email: carloshjc@yahoo.com.br OS NÚMEROS NÃO MENTEM, MAS OS MENTIROSOS USAM NÚMEROS!!! ESTATÍSTICA Alguma definições... Ciência
Leia maisClassificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística
Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística Gilberto Rodrigues Liska 1 5 Fortunato Silva de Menezes 2 5 Marcelo Ângelo Cirillo 3 5 Mario Javier Ferrua
Leia maisPLANO DE ENSINO IDENTIFICAÇÃO DA DISCIPLINA
PLANO DE ENSINO IDENTIFICAÇÃO DA DISCIPLINA Curso: CST em Sistemas de Telecomunicações, Tecnologia Nome da disciplina: Teoria da Estatística Código: TEL026 Carga horária: 83 horas Semestre previsto: 3º
Leia maisCapítulo 6 Estatística não-paramétrica
Capítulo 6 Estatística não-paramétrica Slide 1 Teste de ajustamento do Qui-quadrado Testes de independência e de homogeneidade do Qui-quadrado Algumas considerações Slide 2 As secções deste capítulo referem-se
Leia maisIntrodução a Sistemas Inteligentes
Introdução a Sistemas Inteligentes Conceituação Prof. Ricardo J. G. B. Campello ICMC / USP Créditos Parte do material a seguir consiste de adaptações e extensões dos originais gentilmente cedidos pelo
Leia maisEstudando com o MATLAB
Estudando com o MATLAB Curso de Extensão Docentes: > Fabiano Araujo Soares > Marcelino M. de Andrade Monitor: >Luan Felipe Aula 4: Aplicações - Parte II 1ª Parte - Estatística Aula 4-1ª Parte: Estatística
Leia maisEstatística Descritiva (I)
Estatística Descritiva (I) 1 O que é Estatística Origem relacionada com a coleta e construção de tabelas de dados para o governo. A situação evoluiu: a coleta de dados representa somente um dos aspectos
Leia maisAgregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta
Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta (luizfsc@icmc.usp.br) Sumário 1. Motivação 2. Bagging 3. Random Forest 4. Boosting
Leia maisEstatística Descritiva
C E N T R O D E M A T E M Á T I C A, C O M P U T A Ç Ã O E C O G N I Ç Ã O UFABC Estatística Descritiva Centro de Matemática, Computação e Cognição March 17, 2013 Slide 1/52 1 Definições Básicas Estatística
Leia maisEstatística. Professora: Eliana Carvalho Estatística e Probabilidade 1
Estatística Fonte bibliográfica: FARIAS, Alberto Alves Introdução a Estatística MEYER, Paul L. Probabilidade: Aplicações à Estatística MONTGOMERY, Douglas C; Estatística aplicada e probabilidade para engenheiros.
Leia maisExemplo Cupons com Desconto
Exemplo Cupons com Desconto Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2016 G. A. Paula (IME-USP) Cupons com Desconto 2 o Semestre 2016 1 / 22 Cupons
Leia maisEstatística descritiva básica: Medidas de associação ACH2021 Tratamento e Análise de Dados e Informações
Estatística descritiva básica: Medidas de associação ACH2021 Tratamento e Análise de Dados e Informações Marcelo de Souza Lauretto marcelolauretto@usp.br www.each.usp.br/lauretto Referências Bergamaschi,
Leia maisAula 4 Conceitos Básicos de Estatística
Aula 4 Conceitos Básicos de Estatística A Estatística é a ciência de aprendizagem a partir de dados. Trata-se de uma disciplina estratégica, que coleta, analisa e interpreta informações numéricas para
Leia maisIntrodução ao SPSS 17.0
Introdução ao SPSS 17.0 Metodologias de Análise Quantitativas Liliana Abreu CIPEM Novembro de 2009 Fase lógica da pesquisa Identificação do problema: Pergunta de partida; Exploração do domínio; Escolha
Leia maisTécnicas Experimentais Aplicadas à Zootecnia UNIDADE 1. NOÇÕES DE PLANEJAMENTO EXPERIMENTAL
Técnicas Experimentais Aplicadas à Zootecnia UNIDADE 1. NOÇÕES DE PLANEJAMENTO EXPERIMENTAL Experimentos (testes) são realizados por pesquisadores em todos os campos de investigação, usualmente para descobrir
Leia mais1 Introdução aos Métodos Estatísticos para Geografia 1
1 Introdução aos Métodos Estatísticos para Geografia 1 1.1 Introdução 1 1.2 O método científico 2 1.3 Abordagens exploratória e confirmatória na geografia 4 1.4 Probabilidade e estatística 4 1.4.1 Probabilidade
Leia maisFigura 1. Tela de inicialização do WEKA. 2. Será apresentada a seguinte janela, que iremos utilizar para testar as respostas do WEKA.
WEKA: Prática 1 Nesta primeira prática vamos usar o Explorer, para treinar o WEKA e depois testarmos a eficiência das respostas de acordo com a base de conhecimento informada. 1. Iniciando o WEKA Explorer
Leia maisINSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E tecnologia PARAÍBA. Ministério da Educação
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E tecnologia PARAÍBA Ministério da Educação Instituto Federal de Educação, Ciência e Tecnologia da Paraíba - Campus Cajazeiras Diretoria de Ensino / Coord. do Curso
Leia maisINTRODUÇÃO À PROBABILIDADE
INTRODUÇÃO À PROBABILIDADE Foto extraída em http://www.alea.pt Profª Maria Eliane Universidade Estadual de Santa Cruz USO DE PROBABILIDADES EM SITUAÇÕES DO COTIDIANO Escolhas pessoais Previsão do tempo
Leia maisTópicos em Mineração de Dados
Tópicos em Mineração de Dados Descoberta de agrupamentos Método k-médias 1. Introdução A descoberta de agrupamentos é uma tarefa descritiva que procura agrupar dados utilizando a similaridade dos valores
Leia maisUm Wrapper para Seleção de Eletrodos em Interfaces Cérebro Computador Baseadas em Imaginação de Movimento
Um Wrapper para Seleção de Eletrodos em Interfaces Cérebro Computador Baseadas em Imaginação de Movimento Maria B Kersanach Luisa F S Uribe Thiago B S Costa Romis Attux 2015-2016 Interface Cérebro Computador:
Leia maisUniversidade Federal do Pará Instituto de Tecnologia ESTATÍSTICA APLICADA. Campus de Belém Curso de Engenharia Mecânica
Universidade Federal do Pará Instituto de Tecnologia ESTATÍSTICA APLICADA Plano da Disciplina Campus de Belém Curso de Engenharia Mecânica 1 IDENTIFICAÇÃO Nome da disciplina: Estatística Aplicada I Código
Leia maisNÍVEL DE ENSINO: CARGA HORÁRIA: PROBABILIDADE EST PROFESSOR-AUTOR:
ESTATÍSTICA E PROBABILIDADE NÍVEL DE ENSINO: Graduação CARGA HORÁRIA: 80h PROFESSOR-AUTOR: Bráulio Roberto Gonçalves Marinho Couto Janaína Giovani Noronha de Oliveira Octávio Alcântara Torres Reinaldo
Leia maisExtração de Conhecimento & Mineração de Dados
Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática
Leia maisAula 7 Medidas de Distância. Profa. Elaine Faria UFU
Aula 7 Medidas de Distância Profa. Elaine Faria UFU - 2017 Agradecimentos Este material é baseado No livro Tan et al, 2006 Nos slides do prof Andre C. P. L. F. Carvalho Agradecimentos Ao professor André
Leia maisESTATÍSTICA. PROF. RANILDO LOPES U.E PROF EDGAR TITO
ESTATÍSTICA PROF. RANILDO LOPES http://ueedgartito.wordpress.com U.E PROF EDGAR TITO Introdução à Estatística Básica 1- O que é Estatística? A Estatística é uma ciência exata que visa fornecer subsídios
Leia maisResolução das Questões Discursivas
COMISSÃO PERMANENTE DE SELEÇÃO COPESE PRÓ-REITORIA DE GRADUAÇÃO PROGRAD CONCURSO PISM III - TRIÊNIO 008-010 Prova de Matemática Resolução das Questões Discursivas São apresentadas abaixo possíveis soluções
Leia maisFILTROS ESPACIAIS PASSA-BAIXA
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL PROGRAMA DE PÓS-GRADUAÇÃO EM COMPUTAÇÃO CMP65 - INTRODUÇÃO AO PROCESSAMENTO DE IMAGENS PROFESSOR JACOB SCARCHANSKI FILTROS ESPACIAIS PASSA-BAIXA POR DANIEL NEHME
Leia mais1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.
1 1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. Modelo de Resultados Potenciais e Aleatorização (Cap. 2 e 3
Leia maisUnidade I ESTATÍSTICA APLICADA. Prof. Mauricio Fanno
Unidade I ESTATÍSTICA APLICADA Prof. Mauricio Fanno Estatística indutiva Estatística descritiva Dados no passado ou no presente e em pequena quantidade, portanto, reais e coletáveis. Campo de trabalho:
Leia maisIntrodução à estatística univariada através da linguagem R
Introdução à estatística univariada através da linguagem R 1. Profesores Professora Doutora Maite Mascaró (mmm@ciencias.unam.mx) (Universidad Nacional Autónoma de México) Doutora Marta Rufino (marta.m.rufino@gmail.com)
Leia maisContabilometria. Aula 9 Regressão Linear Inferências e Grau de Ajustamento
Contabilometria Aula 9 Regressão Linear Inferências e Grau de Ajustamento Interpretação do Intercepto e da Inclinação b 0 é o valor estimado da média de Y quando o valor de X é zero b 1 é a mudança estimada
Leia maisO Valor da Analítica Avançada no Apoio à Tomada de Decisão
O Valor da Analítica Avançada no Apoio à Tomada de Decisão Adelaide Leitão Sales & Marketing Director adelaide.leitao@habber.com Patrícia Narciso Operations Director patricia.narciso@habber.com Elsa Tavares
Leia maisVISÃO COMPUTACIONAL PARA RECONHECIMENTO DE FACES APLICADO NA IDENTIFICAÇÃO E AUTENTICAÇÃO DE USUÁRIOS NA WEB. Márcio Koch
VISÃO COMPUTACIONAL PARA RECONHECIMENTO DE FACES APLICADO NA IDENTIFICAÇÃO E AUTENTICAÇÃO DE USUÁRIOS NA WEB Márcio Koch Orientador: Jacques Robert Heckmann ROTEIRO Introdução Objetivos do trabalho Fundamentação
Leia maisBUSSINES ANALYTICS: ANÁLISE DE DADOS PARA TOMADA DE DECISÃO1
BUSSINES ANALYTICS: ANÁLISE DE DADOS PARA TOMADA DE DECISÃO1 Termos como Big Data e Business Intelligence estão na moda. Mas o que, exatamente, está por trás destes conceitos e o que gigantes como Google
Leia maisCompetição e a estrutura de comunidades
1 Competição e a estrutura de comunidades 1. Interações ecológicas e comunidades 2. Competição: definição, pressupostos e previsões 3. Evidências 4. Quebrando os pressupostos 5. Resumo 6. Para saber mais
Leia maisCURSO: ENGENHARIA DE PRODUÇÃO EMENTAS º PERÍODO
CURSO: ENGENHARIA DE PRODUÇÃO EMENTAS - 2016.1 1º PERÍODO DISCIPLINA: INTRODUÇÃO AO CÁLCULO DISCIPLINA: FUNDAMENTOS DE FÍSICA DISCIPLINA: REPRESENTAÇÃO GRÁFICA DISCIPLINA: INTRODUÇÃO À ENGENHARIA DISCIPLINA:
Leia maisPROGRAMAÇÃO PARA DESIGNERS - PENSAR COMO O INIMIGO
PROGRAMAÇÃO PARA DESIGNERS - PENSAR COMO O INIMIGO Introdução "Para derrotar o inimigo é preciso pensar como ele" Actionscripting na perspectiva de um designer não é muito fácil porque vê-em o mundo em
Leia maisWeka. Universidade de Waikato - Nova Zelândia. Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining
Weka Universidade de Waikato - Nova Zelândia Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining implementado em Java open source software http://www.cs.waikato.ac.nz/ml/weka/
Leia maisFACULDADE DE TECNOLOGIA DE GUARATINGUETÁ
FACULDADE DE TECNOLOGIA DE GUARATINGUETÁ ESTATÍSTICA II Nota de aula 1 Prof. MSc. Herivelto T Marcondes dos Santos Fevereiro /2009 1 Modelos de probabilidade 1.1 Variável aleatória Definição: Sejam ε um
Leia maisA computação aplicada à resolução de sistemas lineares
Universidade Federal de Campina Grande Centro de Engenharia Elétrica e Informática Departamento de Sistemas e Computação Programa de Educação Tutorial (PET) A computação aplicada à resolução de sistemas
Leia maisEstatística. Professor Jair Vieira Silva Júnior.
Estatística Professor Jair Vieira Silva Júnior Ementa da Disciplina Estatística descritiva; Interpretação de gráficos e tabelas; Amostras, representação de dados amostrais e medidas descritivas de uma
Leia maisAprendizado Bayesiano Anteriormente...
Aprendizado Bayesiano Anteriormente... Conceito de Probabilidade Condicional É a probabilidade de um evento A dada a ocorrência de um evento B Universidade de São Paulo Instituto de Ciências Matemáticas
Leia maisANÁLISE DE SOBREVIVÊNCIA
ANÁLISE DE SOBREVIVÊNCIA M Eduarda D. S. Matos Coimbra, 9 de Abril de O que é a análise de sobrevivência? A análise de sobrevivência é um conjunto de processos estatísticos, utilizados na análise dos dados,
Leia maisUnidade I ESTATÍSTICA. Prof. Celso Ribeiro Campos
Unidade I ESTATÍSTICA Prof. Celso Ribeiro Campos Visão geral da estatística Estatística: Conjunto de métodos e processos destinados a permitir o entendimento de um universo submetido a certas condições
Leia maisIntrodução à Inferência Estatística
Introdução à Inferência Estatística Capítulo 10, Estatística Básica (Bussab&Morettin, 7a Edição) 2a AULA 02/03/2015 MAE229 - Ano letivo 2015 Lígia Henriques-Rodrigues 2a aula (02/03/2015) MAE229 1 / 16
Leia mais9 Previsão da taxa de câmbio no Brasil
84 9 Previsão da taxa de câmbio no Brasil Uma questão deixada em aberto pelos modelos apresentados nos Capítulos anteriores diz respeito à capacidade dos mesmos de prever os movimentos futuros da taxa
Leia maisEstatística
Estatística 1 2016.2 Sumário Capítulo 1 Conceitos Básicos... 3 MEDIDAS DE POSIÇÃO... 3 MEDIDAS DE DISPERSÃO... 5 EXERCÍCIOS CAPÍTULO 1... 8 Capítulo 2 Outliers e Padronização... 12 VALOR PADRONIZADO (Z)...
Leia maisMAE Introdução à Probabilidade e Estatística II Resolução Lista 5
MAE 229 - Introdução à Probabilidade e Estatística II Resolução Lista 5 Professor: Pedro Morettin e Profa. Chang Chian Exercício 1 (a) De uma forma geral, o desvio padrão é usado para medir a dispersão
Leia mais5 Experimentos Corpus
5 Experimentos 5.1. Corpus A palavra corpus significa corpo em latim. No contexto de Aprendizado de Máquina, corpus se refere a um conjunto de dados utilizados para experimentação e validação de modelos.
Leia maisSummary of Comments on VQEB_tutorial_LC50_prob_stat_2011.pdf
1 2 3 4 5 Summary of Comments on VQEB_tutorial_LC50_prob_stat_2011.pdf Page: 1 Number: 1 Author: mrebelo Subject: Sticky Note Date: 27/03/11 14:19:35 Oi, seja bem vindo ao meu tutorial para calcular a
Leia maisProbabilidade e Estatística
Aula 3 Professora: Rosa M. M. Leão Probabilidade e Estatística Conteúdo: 1.1 Por que estudar? 1.2 O que é? 1.3 População e Amostra 1.4 Um exemplo 1.5 Teoria da Probabilidade 1.6 Análise Combinatória 3
Leia maisConteúdo: Aula 2. Probabilidade e Estatística. Professora: Rosa M. M. Leão
Aula 2 Professora: Rosa M. M. Leão Probabilidade e Estatística Conteúdo: 1.1 Por que estudar? 1.2 O que é? 1.3 População e Amostra 1.4 Um exemplo 1.5 Teoria da Probabilidade 1.6 Análise Combinatória 3
Leia maisModelos de Probabilidade e Inferência Estatística
Modelos de Probabilidade e Inferência Estatística Departamento de Estatística Universidade Federal da Paraíba Prof. Tarciana Liberal (UFPB) Aula Probabilidade Condicional 03/14 1 / 48 É provável que você
Leia maisSUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20
SUMÁRIO Prefácio, 1 3 1 CÁLCULO DAS PROBABILIDADES, 15 1.1 Introdução, 15 1.2 Caracterização de um experimento aleatório, 15 1.3 Espaço amostrai, 16 1.4 Evento, 17 1.5 Eventos mutuamente exclusivos, 17
Leia maisIntrodução à Mineração de Dados com Aplicações em Ciências Espaciais
Introdução à Mineração de Dados com Aplicações em Ciências Espaciais Escola de Verão do Laboratório Associado de Computação e Matemática Aplicada Rafael Santos Dia 3: 1 /54 Programa Dia 1: Apresentação
Leia maisAnálise de Sobrevivência
Análise de Sobrevivência Modelagem paramétrica Valeska Andreozzi 1 valeska.andreozzi@fc.ul.pt & Marilia Sá Carvalho 2 cavalho@fiocruz.br 1 Centro de Estatística e Aplicações da Universidade de Lisboa,
Leia mais