Análise do acidente do Titanic
|
|
|
- Mateus Correia de Almada
- 8 Há anos
- Visualizações:
Transcrição
1 Análise do acidente do Titanic Alexandre Morales Diaz Eduardo Pereira Lima Pedro Guilherme Guimaraes Vinicius Larangeiras Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido ao professor Cesar Augusto Taconeli. Curitiba 2017
2 Sumário 1. Resumo Introdução Material e métodos Definição da Base de Dados Análise descritiva da base Ajuste de Modelos Ajuste usando a base com imputação dos dados faltantes Ajuste usando a base com dados faltantes removidos Escolha do modelo Avaliando o poder preditivo do modelo Conclusão REFERÊNCIAS BIBLIOGRÁFICAS... 15
3
4 4 1. Resumo O trabalho consiste em analisar os dados de diversos passageiros e construir um estudo sobre o acidente do Titanic, com uma aplicação de regressão para dados binários para descobrir o que influenciou na morte ou não dos passageiros do Titanic. Palavras chave: Regressão, Dados Binários, Modelos, Ajustes, Titanic. 2. Introdução Neste trabalho será apresentado modelos para análise de dados binários com resposta binária, essa resposta possui duas alternativas, 0 ou 1 (sucesso ou fracasso), no caso desse trabalho a variável resposta a ser considerada, é se o passageiro sobreviveu (1) ou não sobreviveu (0). A base de dados utilizada foi retirada do site: Esse site hospeda diversas base de dados para competições de Data Science. A base contém diversas informações do passageiro, com 12 variáveis como idade, sexo e classe de viagem, entre outras que serão apresentadas mais adiante. Esse grande navio levou 2 anos para ficar pronto, afundou no Oceano Atlântico em 14 de abril de 1912, quando colidiu contra um iceberg, o número exato de mortos é incerto, porque havia passageiros que não pagaram e alguns que desistiram de embarcar de última hora. O navio saiu da Inglaterra com direção a Nova York, com mais de 1500 pessoas a bordo. O Titanic foi feito para ser considerado o navio mais luxuoso e seguro daquela época. Com isso o objetivo desse trabalho é aproveitar essa base de dados disponível e fazer uma regressão para dados binários e como já foi dito levando em consideração como variável resposta se o passageiro sobreviveu ou não ao acidente. E achar um bom modelo que seja satisfatório, através de métodos e testes estatísticos que auxiliem no ajuste do modelo.
5 5 3. Material e métodos 3.1 Definição da Base de Dados Como já foi dito essa base de dados contém 12 variáveis com informações dos passageiros do Titanic. Mas algumas variáveis como ID do passageiro, nome, número da passagem, porque são informações que não são de interesse e cabine porque havia muitos dados faltantes dos passageiros, foram removidas porque não vai influenciar de nenhuma forma no estudo. Com isso temos a seguinte base de dados: Sobreviveu = 1 se sobreviveu, 0 se não sobreviveu Classe = 1 - primeira classe, 2 - segunda classe, 3 - terceira classe. Sexo = male - masculino, fale feminino. Idade = idade do passageiro em anos. IrmaosConjuge = a quantidade de irmãos e cônjuges que o indivíduo possuía na embarcação. Paiscriancas = quantidade de crianças e idosos (pais) relativos ao passageiro. Tarifa = valor da passagem. Embarque = local onde o passageiro embarcou. S = Southampton, C = Cherbourg-Octeville e Q = Queenstown. Lembrando que essa base não tem o registro de todos os passageiros que estavam no navio, a base contém 891 observações. Além disso, 177 observações não tem a idade na base, com isso usamos uma técnica de imputação multivariada, com a função mice do R, e também analisamos a base excluindo esses registros, para então decidir qual base usaremos para ajustar o modelo final.
6 6 3.2 Análise descritiva da base Podemos observar que do total de passageiros a bordo, 38,4% sobreviveram e 61,6% não sobreviveram ao desastre. Após realizar a imputação dos dados faltantes, podemos observar na tabela abaixo que a média e outras medidas de dispersão não sofreram alterações que possam comprometer a análise dos dados. Como dito anteriormente, iremos ajustar modelos levando em conta a base que foram removidos os dados faltantes, e num segundo momento ajustaremos modelos com a base que os dados faltantes foram imputados com valores através de técnicas de multivariada. Como forma de avaliar o poder preditivo do modelo, nos dois casos iremos separar uma base de validação. No caso da base com os dados faltantes removidos, iremos usar como base de validação 200 observações, com isso a base de treino ficará com 514 observações. Para a base que os dados faltantes foram imputados valores, usaremos como base de validação 250 observações, com isso a base de treino ficará com 641 observações. 3.3 Ajuste de Modelos Nesta seção iremos ilustrar detalhadamente passo a passo para escolha do melhor modelo Ajuste usando a base com imputação dos dados faltantes
7 7 Num primeiro momento, ajustamos um modelo utilizando todas as variáveis da base. Como podemos observar na tabela abaixo, a variáveis que o ajuste indicou como significativas foram Classe, Sexo, Idade e IrmaosConjuge. Com isso iremos ajustar um modelo somente com as variáveis significativas. Num primeiro momento, tentamos ajustar um modelo com as quatro variáveis significativas, e testando todas as interações possíveis para esse conjunto de quatro variáveis. Como podemos observar abaixo, quase todas as interações foram significativas ao modelo, com isso teríamos que ajustar um modelo com todas elas, sendo assim, seria um modelo muito complexo com limitações às interpretações dos parâmetros. Para tentar ajustar um modelo que seja de melhor interpretação, iremos utilizar um modelo com efeitos
8 8 aditivos, ou seja, sem interação entre as variáveis. Podemos observar na tabela abaixo que todas as variáveis continuam como significativas, porém o AIC (Critério de Informação de Akaike) do modelo com interações é menos, ou seja, melhor. Com isso decidimos que iremos analisar os resíduos dos dois modelos para então decidir qual se ajusta melhor ao nosso propósito. Abaixo segue os gráficos para análise de resíduos do modelo com interações. Abaixo segue os gráficos para análise de resíduos do modelo sem interações.
9 9 Analisando os gráficos, podemos concluir que os pressupostos do resíduos estão bem melhor atendidos pelo modelo que não tem interações. A normalidade dos resíduos parece estar bem melhor no modelo sem interações. O mesmo acontece com os possíveis outliers e pontos de alavancagem, que estão bem menores no segundo modelo. Para melhor analisar a normalidade utilizamos o envelope simulado para verificar pontos que estejam fora do intervalo de confiança. Segue os gráficos abaixo.
10 10 Podemos verificar que no segundo modelo, sem interações, tem alguns pontos fora do envelope, porém como o intervalo de confiança é de 95%, é aceitável que alguns pontos fiquem fora do envelope Ajuste usando a base com dados faltantes removidos Nesta etapa, ajustamos um modelo utilizando todas as variáveis da base. Como podemos observar na tabela abaixo, a variáveis que o ajuste indicou como significativas foram Classe, Sexo, Idade e IrmaosConjuge. Com isso iremos ajustar um modelo somente com as variáveis significativas. Num primeiro momento, tentamos ajustar um modelo com as quatro variáveis significativas, e testando todas as interações possíveis para esse conjunto de quatro variáveis. Como podemos observar abaixo, todas as interações foram não significativas ao modelo, ou seja, as interações não irão ajudar no poder preditivo do modelo
11 11 Na tabela abaixo podemos observar que o modelo com efeitos aditivos, ou seja, sem interações, que todas as variáveis foram significativas ao modelo. Abaixo segue os gráficos para análise de resíduos do modelo com interações.
12 Abaixo segue os gráficos para análise de resíduos do modelo sem interações. 12
13 13 Visualmente, não notamos muita diferença na normalidade dos resíduos entre os modelos com e sem interação, porém a distância de cook do e o valor chapéu segundo modelo indica que não temos candidatos a outliers nem a pontos de alavancagem. Utilizando o envelope simulado, verificamos que o segundo modelo se ajusta melhor aos dados, pois tem menos pontos fora do envelope Escolha do modelo Conseguimos observar que, levando em conta normalidade dos resíduos, possíveis outliers e pontos de alavancagem, complexidade do modelo (utilizar interação das variáveis), decidimos que o modelo que melhor se ajusta aos dados é o modelo em que não utilizamos interação e que os dados faltantes são removidos da base em vez de imputar os valores utilizando técnicas estatísticas.
14 Avaliando o poder preditivo do modelo Para avaliar o poder preditivo do modelo iremos utilizar algumas medidas, como especificidade, sensibilidade, acurácia, e também a curva ROC. Para proceder a essas técnicas, temos que definir pontos de corte para analisar qual seria o que melhor prevê a sobrevivência ou não dos indivíduos. Após ajustado o modelo, mensuramos a probabilidade de sobrevivência de cada indivíduo da base de validação, para avaliar o poder preditivo do modelo. Feito isso definimos que indivíduos com probabilidade maior ou igual a 50% de sobrevivência vamos definir como predição que eles vão sobreviver, e abaixo de 50% não vão sobreviver. Posteriormente, realizamos o mesmo procedimento para probabilidades de 40% e 60%. Na tabela abaixo podemos observar a sensibilidade, especificidade e acurácia para os diferentes pontos de corte. Outro método para análise seria a curva ROC e o cálculo da área abaixo da curva. Segue abaixo a curva ROC. Para escolha do melhor ponto de corte, devemos escolher o ponto mais esquinado, pois será o ponto mais próximo de sensibilidade e especificidade igual a 1. Visualmente podemos verificar que o ponto de corte 0.5 aparenta ser o ponto mais esquinado. A área sob a curva ROC é mais próximo de 1 para modelos com alto pode preditivo. Após feito os cálculo, a área sob a curva é de 0,85, sendo que em muitas bibliografias, áreas maiores que 0.8 são consideradas excelentes.
15 15 4. Conclusão Podemos concluir que o ponto de corte com maior equilíbrio entre sensibilidade e especificidade seria o de 0.5, ou seja, que indivíduos com 50% de chance de sobrevivência, sendo esta calculada a partir do modelo escolhido, vão ser classificados como sobreviventes. Além disso, levando em conta complexidade do modelo (interações entre variáveis, imputações de valores faltantes), análise de pressupostos dos resíduos, análise de outliers e pontos de alavancagem, acurácia do modelo, acabamos escolhendo o modelo que não tem interações e que os dados faltantes são removidos da modelagem. 5. REFERÊNCIAS BIBLIOGRÁFICAS PAULA, Gilberto A. MODELOS DE REGRESSÃO com apoio computacional
Análise dados de diagnóstico de câncer de mama
Análise dados de diagnóstico de câncer de mama Alexandre Morales Diaz Eduardo Pereira Lima Pedro Henrique Moraes Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido
Análise de dados de contagem para jogadores de futebol americano
Análise de dados de contagem para jogadores de futebol americano Alexandre Morales Diaz Eduardo Pereira Lima Pedro Guilherme Guimaraes Vinicius Larangeiras Trabalho de Modelos Lineares Generalizados (CE-225),
Análise de dados de Contagem
Análise de dados de Contagem Alexandre Morales Diaz Eduardo Pereira Lima Pedro Henrique Moraes Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido ao professor
UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR )
UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152), Cinthia Zamin Cavassola(GRR20149075) e Luiza Hoffelder da Costa(GRR20149107) AJUSTE DE MODELO DE REGRESSÃO LOGÍSTICA REFERENTE À PRESENÇA DE
Tutorial CRISP-DM. Conteúdo. 2. Entendimento dos Dados. 1. Entendimento do Negócio. Objetivo; Descrição.
Tutorial CRISP-DM Conteúdo 1. Entendimento do Negócio Objetivo; Descrição. 2. Entendimento dos Dados Carregamento dos dados; Descrição estatística; Visualização. Tutorial CRISP-DM Conteúdo 3. Preparação
Relatório GLM - Predição de doênça coronária cardíaca através do modelo de regressão generalizado com resposta Binomial
UNIVERSIDADE FEDERAL DO PARANÁ Rafael Morciani Alves da Silva Maike Willian Martins dos Santos Mateus Gemelli Ramos Relatório GLM - Predição de doênça coronária cardíaca através do modelo de regressão
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR -20149072 DENNIS LEÃO GRR - 20160239 LUAN FIORENTIN GRR - 20160219 MODELAGEM DA QUANTIDADE DE MATRÍCULAS NO ENSINO REGULAR NO ESTADO DO
UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski
UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA Jayme Gomes dos Santos Junior Luciana Helena Kowalski MODELAGEM DA EXPECTATIVA DE VIDA NOS MUNICÍPIOS DO PARANÁ A PARTIR DE COVARIÁVEIS DO CENSO 2010
UNIVERSIDADE FEDERAL DO PARANÁ. Departamento de Estatística
UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Modelo estatístico ligado a tipos de vinhos e classificação de qualidade CE225 - Modelos Lineares Generalizados Prof. Cesar Augusto Taconeli Andrea
Análise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com [email protected] Turma: 2º / 2016 1 Agenda
Disciplina de Modelos Lineares
Disciplina de Modelos Lineares 2012-2 Seleção de Variáveis Professora Ariane Ferreira Em modelos de regressão múltipla é necessário determinar um subconjunto de variáveis independentes que melhor explique
Adriane Machado Cinthia Zamin Cavassola Luiza Hoffelder da Costa REGRESSÃO EM DADOS DE CONTAGEM: UM ESTUDO SOBRE A QUANTIDADE DE BICICLETAS ALUGADAS
Adriane Machado Cinthia Zamin Cavassola Luiza Hoffelder da Costa REGRESSÃO EM DADOS DE CONTAGEM: UM ESTUDO SOBRE A QUANTIDADE DE BICICLETAS ALUGADAS Relatório técnico apresentado como atividade avaliativa
Regressão linear simples
Regressão linear simples Universidade Estadual de Santa Cruz Ivan Bezerra Allaman Introdução Foi visto na aula anterior que o coeficiente de correlação de Pearson é utilizado para mensurar o grau de associação
UNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ) Cinthia Zamin Cavassola (GRR ) Luiza Hoffelder da Costa (GRR )
UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152) Cinthia Zamin Cavassola (GRR20149075) Luiza Hoffelder da Costa (GRR20149107) INFLUÊNCIA DE CARACTERÍSTICAS RELACIONADAS À ESCOLA, DEMOGRÁFICAS
Trabalho de Modelos Lineares Generalizados
Universidade Federal do Paraná Trabalho de Modelos Lineares Generalizados Ananda Bordignon 1, Brendha Lima 2, Giovanna Lazzarin 3 12 de Novembro de 2018 1 GRR20149157 2 GRR20149163 3 GRR20149088 1 SUMÁRIO
Aula 8: Árvores. Rafael Izbicki 1 / 33
Mineração de Dados Aula 8: Árvores Rafael Izbicki 1 / 33 Revisão Vimos que a função de risco é dada por R(g) := E[I(Y g(x))] = P (Y g(x)), Nem sempre tal função nos traz toda informação sobre g. É comum
Métodos Quantitativos para Avaliação de Políticas Públicas
ACH3657 Métodos Quantitativos para Avaliação de Políticas Públicas Aula 11 Análise de Resíduos Alexandre Ribeiro Leichsenring [email protected] Alexandre Leichsenring ACH3657 Aula 11 1 / 26
Mais Informações sobre Itens do Relatório
Mais Informações sobre Itens do Relatório Amostra Tabela contendo os valores amostrados a serem utilizados pelo método comparativo (estatística descritiva ou inferencial) Modelos Pesquisados Tabela contendo
Utilizando a função auto.arima em modelos de séries temporais
Utilizando a função auto.arima em modelos de séries temporais Erasnilson Vieira Camilo 1 2 Marina Rodrigues Maestre 1 Rick Anderson Freire Mangueira 1 Elias Silva de Medeiros 1 Cristian Villegas 1 1 Introdução
5 Estudo de Caso e Resultados
5 Estudo de Caso e Resultados 5.1. Introdução Finalizado o desenvolvimento da ferramenta, é indispensável testar suas funcionalidades e a eficácia da aplicação conjunta dos seus módulos de geração de experimentos
Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística
Classificação de dados em modelos com resposta binária via algoritmo boosting e regressão logística Gilberto Rodrigues Liska 1 5 Fortunato Silva de Menezes 2 5 Marcelo Ângelo Cirillo 3 5 Mario Javier Ferrua
MORTALIDADE DE IDOSOS POR DOENÇAS CARDIOLÓGICAS NA CIDADE DE JOÃO PESSOA-PB
MORTALIDADE DE IDOSOS POR DOENÇAS CARDIOLÓGICAS NA CIDADE DE JOÃO PESSOA-PB Msc. Elídio Vanzella- Ensine Faculdades; Estácio. INTRODUÇÃO No ano de 1990 o governo brasileiro, pelo menos no campo das intenções,
SELEÇÃO DE VARIÁVEIS
SELEÇÃO DE VARIÁVEIS objetivo incluir tantas covariáveis quantas forem necessárias para auxiliar na predição do modelo? (1) buscar o menor subconjunto de covariáveis capaz de explicar adequadamente a variação
AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012
1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à
Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística
Uso de Algoritmo Genético para a otimização do ponto de corte da probabilidade de sucesso estimada do modelo de Regressão Logística José Edson Rodrigues Guedes Gondim 1 Joab de Oliveira Lima 2 1 Introdução
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR LUAN FIORENTIN GRR
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR - 20160239 LUAN FIORENTIN GRR - 20160219 MODELAGEM DE DADOS DE ÓBITOS POR AGRESSÕES NO ESTADO DE SÃO PAULO NO ANO DE 2016 CURITIBA Novembro
Metodologia Aplicada a Computação.
Metodologia Aplicada a Computação [email protected] Pré-processamento de dados Técnicas utilizadas para melhorar a qualidade dos dados; Eliminam ou minimizam os problemas como ruídos, valores incorretos,
1 Introdução aos Métodos Estatísticos para Geografia 1
1 Introdução aos Métodos Estatísticos para Geografia 1 1.1 Introdução 1 1.2 O método científico 2 1.3 Abordagens exploratória e confirmatória na geografia 4 1.4 Probabilidade e estatística 4 1.4.1 Probabilidade
Exemplo Regressão Binomial Dados Emparelhados
Exemplo Regressão Binomial Dados Emparelhados Gilberto A. Paula Departamento de Estatística IME-USP, Brasil [email protected] 2 o Semestre 2013 G. A. Paula (IME-USP) Desenvolvimento de Diabetes 2 o Semestre
ENTENDENDO OS CONCEITOS DE RISCO E RETORNO - (Parte II)
ENTENDENDO OS CONCEITOS DE RISCO E RETORNO - (Parte II)! Como calcular o retorno usando dados históricos?! Como calcular a variância e o desvio padrão?! A análise do retorno através da projeção de retornos
6 ESCALONAMENTO DE CPU
6 ESCALONAMENTO DE CPU O escalonamento de CPU é ponto chave da multiprogramação. Ela permite que haja mais de um processo em execução ao mesmo tempo. Em ambientes com um único processador, o escalonador
CE071 - Análise de Regressão Linear
CE071 - Análise de Regressão Linear Cesar Augusto Taconeli 30 de maio, 2018 Cesar Augusto Taconeli CE071 - Análise de Regressão Linear 30 de maio, 2018 1 / 21 Aula 7 - Regressão linear com covariáveis
Exemplos Equações de Estimação Generalizadas
Exemplos Equações de Estimação Generalizadas Bruno R. dos Santos e Gilberto A. Paula Departamento de Estatística Universidade de São Paulo, Brasil [email protected] Modelos Lineares Generalizados dos
MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS
UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS Thalita do Bem Mattos Clécio da
CÁLCULO NUMÉRICO. Profa. Dra. Yara de Souza Tadano
CÁLCULO NUMÉRICO Profa. Dra. Yara de Souza Tadano [email protected] Aula 4 Ajuste de Curvas AJUSTE DE CURVAS Cálculo Numérico 3/55 Introdução Em geral, experimentos geram uma gama de dados que devem
DCBD. Avaliação de modelos. Métricas para avaliação de desempenho. Avaliação de modelos. Métricas para avaliação de desempenho...
DCBD Métricas para avaliação de desempenho Como avaliar o desempenho de um modelo? Métodos para avaliação de desempenho Como obter estimativas confiáveis? Métodos para comparação de modelos Como comparar
AULA 07 Regressão. Ernesto F. L. Amaral. 05 de outubro de 2013
1 AULA 07 Regressão Ernesto F. L. Amaral 05 de outubro de 2013 Centro de Pesquisas Quantitativas em Ciências Sociais (CPEQS) Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas
Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina.
Caros Alunos, segue a resolução das questões de Estatística aplicadas na prova para o cargo de Auditor Fiscal da Receita Municipal de Teresina. De forma geral, a prova manteve o padrão das questões da
Prof. Dr. Marcone Augusto Leal de Oliveira UFJF CURSO INTRODUTÓRIO DE 12 HORAS OFERECIDO PARA A PÓS-GRADUAÇÃO DA UFABC EM NOVEMBRO DE 2017
Prof. Dr. Marcone Augusto Leal de Oliveira UFJF CURSO INTRODUTÓRIO DE 2 HORAS OFERECIDO PARA A PÓS-GRADUAÇÃO DA UFABC EM NOVEMBRO DE 207 SUMÁRIO - BREVE DESCRIÇÃO, FUNDAMENTOS, CONCEITOS, CARACTERÍSTICAS,
Aula 2 Uma breve revisão sobre modelos lineares
Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar
Testes de Aderência, Homogeneidade e Independência
Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais O que é um teste de hipótese? Queremos saber se a evidência que temos em mãos significa
PROVAS Ciência da Computação. 2 a Prova: 13/02/2014 (Quinta) Reavaliação: 20/02/2014 (Quinta)
PROVAS Ciência da Computação 2 a Prova: 13/02/2014 (Quinta) Reavaliação: 20/02/2014 (Quinta) Ajuste de Curvas Objetivo Ajustar curvas pelo método dos mínimos quadrados 1 - INTRODUÇÃO Em geral, experimentos
Exemplo Vida Útil de Ferramentas
Exemplo Vida Útil de Ferramentas Gilberto A. Paula Departamento de Estatística IME-USP, Brasil [email protected] 2 o Semestre 2016 G. A. Paula (IME-USP) Vida útil de Ferramentas 2 o Semestre 2016 1 /
Modelos de Regressão Linear Simples - parte I
Modelos de Regressão Linear Simples - parte I Erica Castilho Rodrigues 19 de Agosto de 2014 Introdução 3 Objetivos Ao final deste capítulo você deve ser capaz de: Usar modelos de regressão para construir
MAE Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4
MAE0217 - Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4 Exercício 1 Uma rede de supermercados decidiu dar um bônus aos clientes
Na aula do dia 24 de outubro analisamos duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas.
Regressão Múltipla Na aula do dia 24 de outubro analisamos duas variáveis quantitativas conjuntamente com o objetivo de verificar se existe alguma relação entre elas. 1. definimos uma medida de associação
Modelos de Regressão Linear Simples parte I
Modelos de Regressão Linear Simples parte I Erica Castilho Rodrigues 27 de Setembro de 2017 1 2 Objetivos Ao final deste capítulo você deve ser capaz de: Usar modelos de regressão para construir modelos
Esse material foi extraído de Barbetta (2007 cap 13)
Esse material foi extraído de Barbetta (2007 cap 13) - Predizer valores de uma variável dependente (Y) em função de uma variável independente (X). - Conhecer o quanto variações de X podem afetar Y. Exemplos
Testes de Aderência, Homogeneidade e Independência
Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais O que é um teste de hipótese? Queremos saber se a evidência que temos em mãos significa
Teste de hipótese de variância e Análise de Variância (ANOVA)
Teste de hipótese de variância e Análise de Variância (ANOVA) Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais Testes sobre variâncias Problema: queremos saber se há diferenças estatisticamente
MEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS
Universidade Federal do Paraná Departamento de Estatística MEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS CE225 - Modelos Lineares Generalizados Francielle Przibiciem de Mattos GRR20124686 Guilherme
Análise de Regressão EST036
Análise de Regressão EST036 Michel Helcias Montoril Instituto de Ciências Exatas Universidade Federal de Juiz de Fora Regressão sem intercepto; Formas alternativas do modelo de regressão Regressão sem
Testes de Aderência, Homogeneidade e Independência
Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais O que é um teste de hipótese? Queremos saber se a evidência que temos em mãos significa
Correlação e Regressão Linear
Correlação e Regressão Linear Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais CORRELAÇÃO LINEAR Coeficiente de correlação linear r Mede o grau de relacionamento linear entre valores
MAE Introdução à Probabilidade e Estatística II Resolução Lista 5
MAE 229 - Introdução à Probabilidade e Estatística II Resolução Lista 5 Professor: Pedro Morettin e Profa. Chang Chian Exercício 1 (a) De uma forma geral, o desvio padrão é usado para medir a dispersão
