Análise dados de diagnóstico de câncer de mama
|
|
- Armando Olivares
- 5 Há anos
- Visualizações:
Transcrição
1 Análise dados de diagnóstico de câncer de mama Alexandre Morales Diaz Eduardo Pereira Lima Pedro Henrique Moraes Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido ao professor Cesar Augusto Taconeli. Curitiba 2018
2 Sumário 1. Resumo Introdução Material e métodos Definição da Base de Dados Análise descritiva da base Ajuste de Modelos Avaliando o poder preditivo do modelo Conclusão REFERÊNCIAS BIBLIOGRÁFICAS... 10
3 3 1. Resumo O trabalho consiste em analisar os dados de diversas pacientes que tem um tumor na mama, e passam por exames para diagnosticar se esse tumor é benigno ou se é um câncer de mama. Com esse diagnóstico e esses dados dos exames, ajustaremos um modelo para identificar se o tumor é benigno ou maligno, sendo este um câncer de mama. Palavras chave: GLM, modelos lineares generalizados, probito, dados binários, câncer de mama, tumor benigno. 2. Introdução Neste trabalho será apresentado modelos para análise de dados binários com resposta binária, essa resposta possui duas alternativas, 0 ou 1 (sucesso ou fracasso), no caso desse trabalho a variável resposta a ser considerada é se o tumor é maligno (1) ou benigno (0). A base de dados utilizada foi retirada do site: Esse site hospeda diversas base de dados para competições de Data Science. A base contém informações do tumor, com 5 variáveis explicativas, como tamanho e densidade do tumor, entre outras que serão apresentadas mais adiante. Em todo o mundo, câncer de mama o tipo de câncer mais comum entre as mulheres e com a segunda maior taxa de mortalidade. Os exames para diagnosticar o câncer de mama são realizados quando é identificado um caroço, através de raio-x ou exame de toque, ou então um pequeno cisco de cálcio, através de raio-x. Quando um caroço é identificado, o médico irá realizar um diagnóstico para determinar se esse tumor é cancerígeno, e caso seja, se o câncer se espalhou para outras partes do corpo (metástase). Com isso o objetivo desse trabalho é aproveitar essa base de dados disponível e fazer uma regressão para dados binários, e levar em consideração como variável resposta se o tumor é cancerígeno ou não. Um bom ajuste no modelo pode ajudar no diagnóstico preciso de câncer de mama.
4 4 3. Material e métodos 3.1 Definição da Base de Dados Como já foi dito essa base de dados contém 5 variáveis explicativas com informações do tumor identificado no paciente, a variável de interesse, que é o diagnóstico do paciente. Na tabela 1 temos as variáveis contidas na base: Tabela 1 - Variáveis da base Sendo: Diagnosis: 1 se maligno, 0 se benigno mean_radius: distância média do centro do tumor até pontos do perímetro. mean_texture: densidade média do tumor. mean_perimeter: tamanho médio da área do tumor. mean_area: volume médio do tumor. mean_smoothness: média da variação do tamanho do raio. 3.2 Análise descritiva da base Na figura 1 podemos observar que 357 pacientes foram diagnosticados com câncer de mama, enquanto 212 pacientes foram diagnosticados com tumor benigno.
5 5 Figura 1 - Distribuição dos diagnósticos de tumor maligno (1) e benigno (2) Na figura 2 podemos observar a distribuição das covariáveis. Decidimos por nenhuma transformação pois a distribuição parecem bem simétricas, sendo que com transformação houve pouco ganho no ajuste modelo.
6 6 Figura 2 - Distribuição das covariáveis 3.3 Ajuste de Modelos O modelo escolhido para essa análise foi um modelo linear generalizado com função de ligação probito, sem nenhuma interação entre as covariáveis, pois o modelo com interação houve pouco ganho de predição levando em conta a perda de graus de liberdade. Na figura 3 podemos observar os gráficos de diagnóstico do modelo, ou seja, se há observações que sejam outliers ou pontos de alavancagem, ou seja, estão distorcendo a análise. Nesse caso, nenhuma observação foi diagnosticada como tal.
7 7 Figura 3 - Gráficos de diagnóstico Próximo passo para avaliação do modelo é se o resíduos estão normalizados, ou seja, se conseguimos capturar todas as tendências dos dados. Na figura 4 podemos observar o envelope simulado, sendo que todas as observações estão contidas dentro do mesmo.
8 8 Figura 4 - Envelope simulado Avaliando o poder preditivo do modelo Para avaliar o poder preditivo do modelo iremos utilizar algumas medidas, como especificidade, sensibilidade, acurácia, e também a curva ROC, em que usamos o modelo que foi ajustado com os dados de treino e inferimos para a base de validação. Na figura 5 temos a curva ROC, que avalia o quanto o modelo está acertando, sendo esse caso que a área abaixo da curva é quase 1, ou seja, o modelo está acertando quase todos os diagnósticos.
9 9 Figura 5 - Curva ROC A sensibilidade do modelo, ou a habilidade dele prever os pacientes que tem cancer de mama, é de 96,1%. A especificidade do modelo, ou a habijlidade dele prever os pacientes que não tem cancer de mama, é de 93,9%. 4. Conclusão Concluímos de que o modelo mais parcimonioso que ajustamos foi o que não tem interação, pois não há um ganho significativo que justifique as interações. Também entendemos de que o modelo ficou com um poder preditivo alto, pois o índice de acerto do modelo é próximo de 95%.
10 10 5. REFERÊNCIAS BIBLIOGRÁFICAS
Análise do acidente do Titanic
Análise do acidente do Titanic Alexandre Morales Diaz Eduardo Pereira Lima Pedro Guilherme Guimaraes Vinicius Larangeiras Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná,
Leia maisAnálise de dados de Contagem
Análise de dados de Contagem Alexandre Morales Diaz Eduardo Pereira Lima Pedro Henrique Moraes Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido ao professor
Leia maisTrabalho de Modelos Lineares Generalizados
Universidade Federal do Paraná Trabalho de Modelos Lineares Generalizados Ananda Bordignon 1, Brendha Lima 2, Giovanna Lazzarin 3 12 de Novembro de 2018 1 GRR20149157 2 GRR20149163 3 GRR20149088 1 SUMÁRIO
Leia maisAnálise de dados de contagem para jogadores de futebol americano
Análise de dados de contagem para jogadores de futebol americano Alexandre Morales Diaz Eduardo Pereira Lima Pedro Guilherme Guimaraes Vinicius Larangeiras Trabalho de Modelos Lineares Generalizados (CE-225),
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ), Cinthia Zamin Cavassola(GRR ) e Luiza Hoffelder da Costa(GRR )
UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152), Cinthia Zamin Cavassola(GRR20149075) e Luiza Hoffelder da Costa(GRR20149107) AJUSTE DE MODELO DE REGRESSÃO LOGÍSTICA REFERENTE À PRESENÇA DE
Leia maisRegressão para Dados Binários - Estudo de Dengue
Universidade Federal do Paraná Departamento de Estatística Regressão para Dados Binários - Estudo de Dengue CE225 - Modelos Lineares Generalizados Francielle Przibiciem de Mattos GRR20124686 Guilherme
Leia maisAlexandre Morales Diaz Eduardo Pereira Lima Vinicius Larangeiras
Análise de Desempenho de Jogadores de Basquete Alexandre Morales Diaz Eduardo Pereira Lima Vinicius Larangeiras Trabalho de Modelos Lineares Generalizados (CE-225), Universidade Federal do Paraná, submetido
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ. Departamento de Estatística
UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Modelo estatístico ligado a tipos de vinhos e classificação de qualidade CE225 - Modelos Lineares Generalizados Prof. Cesar Augusto Taconeli Andrea
Leia maisRelatório GLM - Predição de doênça coronária cardíaca através do modelo de regressão generalizado com resposta Binomial
UNIVERSIDADE FEDERAL DO PARANÁ Rafael Morciani Alves da Silva Maike Willian Martins dos Santos Mateus Gemelli Ramos Relatório GLM - Predição de doênça coronária cardíaca através do modelo de regressão
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA
06 UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA CAROLINE MARTINS SELIS GRR: 20137507 MILTON ABRAAO FERREIRA GRR: 20137581 NATHALIE DO AMARAL PORTO MARTINS GRR: 20137583 RELATÓRIO DE ANÁLISE
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA
06 UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA CAROLINE MARTINS SELIS GRR: 20137507 MILTON ABRAAO FERREIRA GRR: 20137581 NATHALIE DO AMARAL PORTO MARTINS GRR: 20137583 RELATÓRIO DE ANÁLISE
Leia maisTrabalho de GLM 2. Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER. 17 de outubro de 2017
Trabalho de GLM 2 Adi M. ARAÚJO, Kristiany J. MARTINI, Konstanz W. TONEGAWA, Leonardo H. KRÜGER 17 de outubro de 2017 1 - Resumo Para o trabalho, foi extraída do site kaggle.com uma base com uma amostra
Leia maisNúmero de Consultas ao Médico
UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA CURSO DE ESTATÍSTICA João Matheus S. K. T. Hneda Lineu Alberto Cavazani de Freitas Número de Consultas ao Médico Análise
Leia maisAjuste e validação de modelos preditivos
Ajuste e validação de modelos preditivos 1 O modelo de regressão logística é frequentemente utilizado com o objetivo de predizer (classificar) indivíduos com base nos valores de suas covariáveis. Modelos
Leia maisÓbitos por Acidentes de Transporte em Santa Catarina no ano de 2016
Óbitos por Acidentes de Transporte em Santa Catarina no ano de 2016 Modelos Lineares Generalizados Lais Hoffmam Simone Matsubara Willian Meira Yasmin Fernandes Curitiba 2018 Sumário 1. Resumo... 3 2. Introdução...
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA
UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA BRUNO GERONYMO - GRR20159232 HERMANN MOGIZ DELGADO - GRR20159211 MARIA HELENA OLIVEIRA - GRR20159213 VINICIUS CESAR PEDROSO
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ. Adi M. A. Junior Leonardo H. B. Krüger Kristiany J. Martini Konstanz T. Winter
UNIVERSIDADE FEDERAL DO PARANÁ Adi M. A. Junior Leonardo H. B. Krüger Kristiany J. Martini Konstanz T. Winter ESTUDO DO NÚMERO DE PONTOS EFETUADOS EM UMA TEMPORADA DE BASQUETEBOL CURITIBA 27 de novembro
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR RODOLFO PIROLO GATZKE - GRR THAYS COSTA S. SOUZA - GRR
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA - GRR 20149072 RODOLFO PIROLO GATZKE - GRR 20149150 THAYS COSTA S. SOUZA - GRR 20159231 MODELAGEM PARA O SUCESSO DE CAMPANHA DE MARKETING CURITIBA
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA
6 UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA AGATHA DE MELO GRR: 20137524 ELIAS SANTIAGO DINIZ GRR: 20135636 NATHALIE DO AMARAL PORTO MARTINS GRR: 20137583 RELATÓRIO DE ANÁLISE DE DADOS
Leia maisRegression and Clinical prediction models
Regression and Clinical prediction models Seção 18 Performance e validação Marcel de Souza Borges Quintana marcel.quintana@ini.fiocruz.br 2018 Estrutura 1. Avaliação do desempenho do modelo (Cap 15) Medidas
Leia maisAnalise de sobreviventes em acidentes de carros
Analise de sobreviventes em acidentes de carros Modelos Lineares Generalizados Lais Hoffmam GRR20159455 Simone Matsubara GRR20124663 Willian Meira GRR20159077 Yasmin Fernandes ISO20180365 Curitiba 2018
Leia maisESTUDO SOBRE A TAXA ANUAL DE CÂNCER NASAL EM UMA REFINARIA DE NÍQUEL NO PAÍS DE GALES
Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística ESTUDO SOBRE A TAXA ANUAL DE CÂNCER NASAL EM UMA REFINARIA DE NÍQUEL NO PAÍS DE GALES CE225 - Modelos Lineares Generalizados
Leia maisTrabalho 1 Regressão para dados binários
Universidade Federal do Paraná - Departamento de Estatística Disciplina: CE225 Modelos Lineares Generalizados Prof. Cesar Augusto Taconeli Orientação - Trabalhos Os alunos deverão constituir grupos de
Leia maisRegressão Logística: Um Estudo sobre o Uso de Tabaco entre Alunos da Universidade Federal do Paraná Curitiba
UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Regressão Logística: Um Estudo sobre o Uso de Tabaco entre Alunos da Universidade Federal do Paraná Curitiba CE225 - Modelos Lineares Generalizados
Leia maisRegressão para Dados de Contagem - Segurança e privatização ferroviária na Grã-Bretanha
Universidade Federal do Paraná Departamento de Estatística Regressão para Dados de Contagem - Segurança e privatização ferroviária na Grã-Bretanha CE22 - Modelos Lineares Generalizados Francielle Przibiciem
Leia maisModelos Lineares Generalizados - Regressão Logística
Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 26 de Maio de 2014 AIC 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos de modelo. Mede
Leia maisINCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO
Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística INCIDÊNCIA DE DENGUE EM UMA CIDADE DA COSTA MEXICANA: UM ESTUDO PREDITIVO CE225 - Modelos Lineares Generalizados Eduardo
Leia mais3.33pt. AIC Introdução
1 3.33pt 1 Modelos Lineares Generalizados - Regressão Logística Erica Castilho Rodrigues 01 de Julho de 2016 2 3.33pt 3 Vamos ver um critério para comparação de modelos. É muito utilizado para vários tipos
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR DENNIS LEÃO GRR LUAN FIORENTIN GRR
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA CALEB SOUZA GRR -20149072 DENNIS LEÃO GRR - 20160239 LUAN FIORENTIN GRR - 20160219 MODELAGEM DA QUANTIDADE DE MATRÍCULAS NO ENSINO REGULAR NO ESTADO DO
Leia maisModelos de Regressão para Dados de Contagem
UNIVERSIDADE FEDERAL DO PARANÁ Departamento de Estatística Modelos de Regressão para Dados de Contagem CE225 - Modelos Lineares Generalizados Professor Cesar Taconelli Andrea A Alves, GRR: 20096668 NathanM
Leia maisMÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS
UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS Thalita do Bem Mattos Clécio da
Leia maisAdriane Machado Cinthia Zamin Cavassola Luiza Hoffelder da Costa REGRESSÃO EM DADOS DE CONTAGEM: UM ESTUDO SOBRE A QUANTIDADE DE BICICLETAS ALUGADAS
Adriane Machado Cinthia Zamin Cavassola Luiza Hoffelder da Costa REGRESSÃO EM DADOS DE CONTAGEM: UM ESTUDO SOBRE A QUANTIDADE DE BICICLETAS ALUGADAS Relatório técnico apresentado como atividade avaliativa
Leia maisRelatório Técnico - SVM na base Breast Cancer Wisconsin
Relatório Técnico - SVM na base Breast Cancer Wisconsin Matheus Gutoski Universidade Tecnológica Federal do Paraná - CPGEI/PPGCA Mineração de Dados 4 de novembro de 2016 1 Objetivo O objetivo deste trabalho
Leia maisRELACÃO DO CRIME EM CIDADES PEQUENAS COM CUSTO, IDADE E ANOS DE ESTUDO DE ESTADOS DA AMERICA DO NORTE
Universidade Federal do Paraná Setor de Ciências Exatas Departamento de Estatística RELACÃO DO CRIME EM CIDADES PEQUENAS COM CUSTO, IDADE E ANOS DE ESTUDO DE ESTADOS DA AMERICA DO NORTE CE225 - Modelos
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ. Adriane Machado (GRR ) Cinthia Zamin Cavassola (GRR ) Luiza Hoffelder da Costa (GRR )
UNIVERSIDADE FEDERAL DO PARANÁ Adriane Machado (GRR20149152) Cinthia Zamin Cavassola (GRR20149075) Luiza Hoffelder da Costa (GRR20149107) INFLUÊNCIA DE CARACTERÍSTICAS RELACIONADAS À ESCOLA, DEMOGRÁFICAS
Leia maisRoteiro. PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores. Estimativa da Acurácia. Introdução. Estimativa da Acurácia
Roteiro PCC142 / BCC444 - Mineração de Dados Avaliação de Classicadores Introdução Luiz Henrique de Campos Merschmann Departamento de Computação Universidade Federal de Ouro Preto luizhenrique@iceb.ufop.br
Leia maisExemplos Regressão Dados Binários
Exemplos Regressão Dados Binários p. 1/28 Exemplos Regressão Dados Binários Gilberto A. Paula Departamento de Estatística IME-USP MAE5763 - Modelos Lineares Generalizados 2 o semestre de 2011 Exemplos
Leia maisValidade interna e externa em estudos epidemiológicos. Sensibilidade; Especificidade; Valor Preditivo Positivo; Valor Preditivo Negativo
Validade interna e externa em estudos epidemiológicos Sensibilidade; Especificidade; Valor Preditivo Positivo; Valor Preditivo Negativo Qualidade da Informação Existem dois conceitos fundamentais, em termos
Leia maisUNIVERSIDADE FEDERAL DO RIO DE JANEIRO CENTRO DE CIÊNCIAS DA SAÚDE INSTITUTO DE ESTUDOS EM SAÚDE COLETIVA DISCIPLINA: MÉTODO EPIDEMIOLÓGICO
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO CENTRO DE CIÊNCIAS DA SAÚDE INSTITUTO DE ESTUDOS EM SAÚDE COLETIVA DISCIPLINA: MÉTODO EPIDEMIOLÓGICO Validade em Estudos Epidemiológicos II Universidade Federal do
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA MATEUS GEMELLI RAMOS GUSTAVO S. SCHUTT
UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA MATEUS GEMELLI RAMOS GUSTAVO S. SCHUTT MODELO DE REGRESSÃO MULTIPLA: UM ESTUDO SOBRE O DESEMPENHO DOS JOGADORES DA NBA CURITIBA 2018 MATEUS GEMELLI RAMOS
Leia maisTestes Diagnósticos. HEP Cassia Maria Buchalla
Testes Diagnósticos HEP 176 2017 Cassia Maria Buchalla Os testes são utilizados no diagnóstico clínico, na triagem e na pesquisa Concebido como um teste laboratorial, também se aplica à informação obtida
Leia maisCÂNCER PREVINIR É O MELHOR REMÉDIO
CÂNCER PREVINIR É O MELHOR REMÉDIO Drª Cléria Santiago de Ávila O QUE É O CÂNCER? Câncer é o nome dado a doenças que têm em comum o crescimento desordenado de células, que se dividem rapidamente são agressivas
Leia maisUNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO DE CIÊNCIAS DA SAÚDE DEPARTAMENTO DE SAÚDE PÚBLICA AULA TESTES DIAGNÓSTICOS Eleonora D Orsi Lúcio
UNIVERSIDADE FEDERAL DE SANTA CATARINA CENTRO DE CIÊNCIAS DA SAÚDE DEPARTAMENTO DE SAÚDE PÚBLICA AULA TESTES DIAGNÓSTICOS Eleonora D Orsi Lúcio Botelho Sérgio Freitas DIAGNÓSTICO Processo de decisão clínica
Leia maisEFICIÊNCIA DE UM TRATAMENTO APLICADO A PACIENTES COM LEUCEMIA
Universidade Federal do Paraná Departamento de Estatística EFICIÊNCIA DE UM TRATAMENTO APLICADO A PACIENTES COM LEUCEMIA CE225 - Modelos Lineares Generalizados Jhenifer Caetano Veloso - GRR20137558 Rogério
Leia maisAula 8: Árvores. Rafael Izbicki 1 / 33
Mineração de Dados Aula 8: Árvores Rafael Izbicki 1 / 33 Revisão Vimos que a função de risco é dada por R(g) := E[I(Y g(x))] = P (Y g(x)), Nem sempre tal função nos traz toda informação sobre g. É comum
Leia maisAplicação do modelo de Quase-Verossimilhança
Aplicação do modelo de Quase-Verossimilhança Fábio Hideto Oki 1 1 Introdução O câncer é uma doença de proporção mundial, atingindo só no Brasil cerca de 350 mil pessoas por ano e é caracterizado pela mutação
Leia maisFDG PET no Câncer de Pulmão: Influências das doenças granulomatosas
FDG PET no Câncer de Pulmão: Influências das doenças granulomatosas Bruno Hochhegger MD, PhD Médico Radiologista do Pavilhão Pereira Filho e Hospital São Lucas da PUCRS Professor de Radiologia da UFCSPA
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ SETOR CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA ANÁLISE DE SOBREVIDA EM 90 HOMENS COM CÂNCER DE LARINGE
UNIVERSIDADE FEDERAL DO PARANÁ SETOR CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA ANÁLISE DE SOBREVIDA EM 90 HOMENS COM CÂNCER DE LARINGE Aluna: Scheylla Calazans Orientadora: Profa. Dra. Nívea S. Matuda
Leia maisAprendizado de Máquina
Aprendizado de Máquina UFMG EST171-2ª Lista de exercícios Eduardo Elias Ribeiro Junior 04 de outubro de 2016 Exercício 1 Baixe o conjunto de dados titanic.txt. Cada observação deste banco é relativa a
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA. Jayme Gomes dos Santos Junior Luciana Helena Kowalski
UNIVERSIDADE FEDERAL DO PARANÁ CURSO DE ESTATÍSTICA Jayme Gomes dos Santos Junior Luciana Helena Kowalski MODELAGEM DA EXPECTATIVA DE VIDA NOS MUNICÍPIOS DO PARANÁ A PARTIR DE COVARIÁVEIS DO CENSO 2010
Leia maisModelo Linear Generalizado Distribuição Normal
Valeska Andreozzi 1 Modelo Linear Generalizado Distribuição Normal O objetivo deste exercício é familiarizar o aluno com os modelos lineares generalizados (MLG). PROBLEMA 1: Pressão arterial A pressão
Leia maisMEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS
Universidade Federal do Paraná Departamento de Estatística MEDIÇÃO DA QUALIDADE DO VINHO BRANCO NORTE PORTUGUÊS CE225 - Modelos Lineares Generalizados Francielle Przibiciem de Mattos GRR20124686 Guilherme
Leia maisMORTALIDADE DE IDOSOS POR DOENÇAS CARDIOLÓGICAS NA CIDADE DE JOÃO PESSOA-PB
MORTALIDADE DE IDOSOS POR DOENÇAS CARDIOLÓGICAS NA CIDADE DE JOÃO PESSOA-PB Msc. Elídio Vanzella- Ensine Faculdades; Estácio. INTRODUÇÃO No ano de 1990 o governo brasileiro, pelo menos no campo das intenções,
Leia maisModelos Lineares Generalizados para Dados de Contagem Ananda Bordignon, Brendha Lima, Giovanna Lazzarin 28 de novembro de 2018
Modelos Lineares Generalizados para Dados de Contagem Ananda Bordignon, Brendha Lima, Giovanna Lazzarin 28 de novembro de 2018 1. Introdução O objetivo deste trabalho é apresentar uma análise estatística,
Leia maisDetecção Auxiliada por Computador
Detecção Auxiliada por Computador (computer-aided detection - CAD) Márcio Eloi Colombo Filho - 6402378 Jessica Caroline Alves Nunes Temporal 7547611 Tiago Pedro de Santana Junior - 7961516 Mamografia Único
Leia maisMAE Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4
MAE0217 - Estatística Descritiva - 1 o semestre de 2017 Professora: Márcia D Elia Branco Monitora PAE: Simone Harnik Gabarito - Lista 4 Exercício 1 Uma rede de supermercados decidiu dar um bônus aos clientes
Leia maisInteligência Artificial
Inteligência Artificial Aula 14 Aprendizado de Máquina Avaliação de s Preditivos (Classificação) Hold-out K-fold Leave-one-out Prof. Ricardo M. Marcacini ricardo.marcacini@ufms.br Curso: Sistemas de Informação
Leia maisModelo de regressão Beta
Modelo de regressão Beta Fernando Lucambio Pérez Departamento de Estatística Universidade Federal do Paraná Agosto de 2004 1 Consideremos uma situação em que a variável resposta contínua é restrita ao
Leia maisÁrvores de decisão e seus refinamentos na predição genômica da resistência à ferrugem alaranjada em café arábica
Árvores de decisão e seus refinamentos na predição genômica da resistência à ferrugem alaranjada em café arábica Ithalo Coelho de Sousa ithalo.coelho@gmail.com Programa de Pós-Graduação em Estatística
Leia maisRegressão linear simples
Regressão linear simples Universidade Estadual de Santa Cruz Ivan Bezerra Allaman Introdução Foi visto na aula anterior que o coeficiente de correlação de Pearson é utilizado para mensurar o grau de associação
Leia maisExemplos Regressão Dados de Contagem
Exemplos Regressão Dados de Contagem p. 1/26 Exemplos Regressão Dados de Contagem Gilberto A. Paula Departamento de Estatística IME-USP MAE5763 - Modelos Lineares Generalizados 2 o semestre de 2011 Exemplos
Leia maisData Mining. Felipe E. Barletta Mendes. 21 de maio de 2008
21 de maio de 2008 O foco principal deste material não é apresentar em minúcia todo o contexto de, muito menos o sobre o processo KDD em que a mineração de dados usualmente está inserida. O objetivo é
Leia maisQue informações epidemiológicas sobre Oncologia Pediátrica têm sido produzidas?
Que informações epidemiológicas sobre Oncologia Pediátrica têm sido produzidas? Karina Braga Ribeiro Diretora Adjunta Divisão de Epidemiologia/FOSP Professora Adjunta - FCMSCSP Câncer em crianças e adolescentes
Leia maisAno V Mai./2018. Prof. Dr. André Lucirton Costa, Adrieli L. Dias dos Santos e Paulo
O Boletim de Abril/2018 apresentou dados referentes ao o Capítulo XV Gravidez, parto e puerpério do CID 10 (Código Internacional de Doenças). Foram analisadas as internações decorrentes de gravidez, parto
Leia maisMetodologia Científica I Roumayne Andrade
Metodologia Científica I 2018.1 Roumayne Andrade 1- Qual das alternativas a seguir NÃO é um dos elementos geralmente utilizados para definir uma questão clínica específica que pode ser estudada por meio
Leia maisA fase inicial do câncer de próstata apresenta uma evolução silenciosa e não causa sintomas, mas alguns sinais merecem atenção:
Novembro Azul O movimento mundialmente conhecido como Novembro Azul ou Movember visa conscientizar os homens sobre a importância da prevenção do câncer de próstata e tem o bigode como símbolo adotado para
Leia maisRafael Izbicki 1 / 38
Mineração de Dados Aula 7: Classificação Rafael Izbicki 1 / 38 Revisão Um problema de classificação é um problema de predição em que Y é qualitativo. Em um problema de classificação, é comum se usar R(g)
Leia maisRegressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei
Regressão PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei Regressão Introdução Analisar a relação entre duas variáveis (x,y) através da equação (equação de regressão) e do gráfico
Leia maisANÁLISE DE SOBREVIDA DE PACIENTES COM CÂNCER Modelo de Riscos proporcionais de COX
ANÁLISE DE SOBREVIDA DE PACIENTES COM CÂNCER Modelo de Riscos proporcionais de COX Renato Azeredo Teixeira (UFMG / SES-MG) Prof a. Arminda Lucia Siqueira (UFMG) Ana Paula Azevedo Travassos (UFMG) Fonte
Leia maisAula 2 Uma breve revisão sobre modelos lineares
Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR LUAN FIORENTIN GRR
UNIVERSIDADE FEDERAL DO PARANÁ CURSO ESTATÍSTICA DENNIS LEÃO GRR - 20160239 LUAN FIORENTIN GRR - 20160219 MODELAGEM DE DADOS DE ÓBITOS POR AGRESSÕES NO ESTADO DE SÃO PAULO NO ANO DE 2016 CURITIBA Novembro
Leia maisESTATÍSTICA. Ana Paula Fernandes - FAMAT/UFU
ESTATÍSTICA Ana Paula Fernandes - FAMAT/UFU 1 REFERÊNCIAS BIBLIOGRÁFICAS 2 BUSSAB & MORETTIN Quadro! 3 QUANTIS EMPÍRICOS 4 QUANTIL DE ORDEM P OU P-QUANTIL Quantil de ordem p ou p-quantil, indicada por
Leia maisAltair da Silva Costa Júnior
1 O seu médico recomendou a cirurgia do pulmão porque é a melhor forma para tratar a sua doença. Provavelmente você deve ter realizado diversos exames para a decisão da cirurgia, em conjunto com seu médico.
Leia maisPrincípios de Bioestatística
Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística Princípios de Bioestatística Aula 6: Avaliação da Qualidade de Testes de Diagnóstico PARTE 1: Avaliando um
Leia maisModelos Lineares Generalizados
Modelos Lineares Generalizados Emilly Malveira de Lima Análise de Dados Categóricos Universidade Federal de Minas Gerais - UFMG 10 de Maio de 2018 Emilly Malveira (PGEST-UFMG) 10 de Maio de 2018 1 / 20
Leia maisModelos de regressão para dados correlacionados. Cibele Russo
Modelos de regressão para dados correlacionados Cibele Russo cibele@icmc.usp.br ICMC USP Mini-curso oferecido no Workshop on Probabilistic and Statistical Methods 28 a 30 de janeiro de 2013 Cibele Russo
Leia maisExemplos Equações de Estimação Generalizadas
Exemplos Equações de Estimação Generalizadas Bruno R. dos Santos e Gilberto A. Paula Departamento de Estatística Universidade de São Paulo, Brasil giapaula@ime.usp.br Modelos Lineares Generalizados dos
Leia maisEpidemiologia Analítica TESTES DIAGNÓSTICOS
Epidemiologia Analítica TESTES DIAGNÓSTICOS Introdução Busca do diagnóstico Conscientemente ou não usa-se um raciocínio probabilístico Uso de testes diagnósticos para reduzir ao máximo o grau de incerteza
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA
UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA José Evandeilton Lopes GRR20096740 CE083 - ESTATÍSTICA COMPUTACIONAL Análise descritiva dos dados de fecundação do Brasil no ano 1991 e das rendas
Leia maisExemplo Vida Útil de Ferramentas
Exemplo Vida Útil de Ferramentas Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2 o Semestre 2016 G. A. Paula (IME-USP) Vida útil de Ferramentas 2 o Semestre 2016 1 /
Leia maisMais Aplicações sobre cálculo de probabilidades
Mais Aplicações sobre cálculo de probabilidades Prof. Hemílio Fernandes Campos Coêlho Departamento de Estatística - Universidade Federal da Paraíba - UFPB Noções de Epidemiologia Em algumas aplicações
Leia maisAnálise Multivariada Aplicada à Contabilidade
Mestrado e Doutorado em Controladoria e Contabilidade Análise Multivariada Aplicada à Contabilidade Prof. Dr. Marcelo Botelho da Costa Moraes www.marcelobotelho.com mbotelho@usp.br Turma: 2º / 2016 1 Agenda
Leia maisSupport Vector Machines
Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Support Vector Machines Eduardo Vargas Ferreira Definição Support Vector Machines são baseados no conceito de planos de decisão
Leia maisprobabilidade e não certeza Concebido como um teste laboratorial, mas também se aplica à informação obtida na história, exame físico ou raio x, etc.
Avaliação de Testes Diagnósticos e de Rastreamento As aparências para a mente são de quatro tipos: as coisas ou são o que parecem ser; ou não são, nem parecem ser; ou são e não parecem ser; ou não são,
Leia maisImunologia Aplicada. Sorologia
Imunologia Aplicada Sorologia Importância da pesquisa de Anticorpos no diagnóstico individual 1. Elucidar processos patológicos 2. Diferenciar a fase da doença 3. Diagnosticar doença congênita 4. Selecionar
Leia maisModelo de regressão estável aplicado a econometria
Modelo de regressão estável aplicado a econometria financeira Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br 1 Objetivos
Leia maisCE071 - Análise de Regressão Linear
CE071 - Análise de Regressão Linear Cesar Augusto Taconeli 30 de maio, 2018 Cesar Augusto Taconeli CE071 - Análise de Regressão Linear 30 de maio, 2018 1 / 21 Aula 7 - Regressão linear com covariáveis
Leia maisSIMULADO - MATEMÁTICA VEM SER HEY, PROFESSOR!
SIMULADO - MATEMÁTICA VEM SER HEY, PROFESSOR! *Todas as questões de matemática desse material são da banca COMPERVE* Questão 1 - João estava sem dinheiro no bolso e sacou R$ 200,00 no caixa eletrônico,
Leia maisUniversidade de São Paulo Faculdade de Saúde Pública Departamento de Epidemiologia. Testes Diagnósticos ANA PAULA SAYURI SATO
Universidade de São Paulo Faculdade de Saúde Pública Departamento de Epidemiologia Testes Diagnósticos ANA PAULA SAYURI SATO Objetivos da aula Definir validade de testes de rastreamento (screening) e diagnóstico
Leia maisA Importância da Estatística na Pesquisa Científica e na Tomada de Decisão
A Importância da Estatística na Pesquisa Científica e na Tomada de Decisão Ricardo Alves de Olinda Universidade Estadual da Paraíba - UEPB Centro de Ciências e Tecnologia - CCT Departamento de Estatística
Leia maisi j i i Y X X X i j i i i
Mario de Andrade Lira Junior lira.pro.br\wordpress lira.pro.br\wordpress Diferença Regressão - equação ligando duas ou mais variáveis Correlação medida do grau de ligação entre duas variáveis Usos Regressão
Leia maisUNIVERSIDADE FEDERAL DO PARANÁ. André Luiz Grion GRR Bruno Henrique Abreu GRR Maria Tereza Neves de Oliveira GRR
UNIVERSIDADE FEDERAL DO PARANÁ André Luiz Grion GRR20159284 Bruno Henrique Abreu GRR20159983 Maria Tereza Neves de Oliveira GRR20159323 Predição de vitória de times mandantes no campeonato brasileiro 2017
Leia maisClassificação supervisionada baseada em árvore geradora mínima
Classificação supervisionada baseada em árvore geradora mínima Letícia Cavalari Pinheiro 1,3 Renato Martins Assunção 2 1 Introdução Classificação supervisionada é um dos problemas mais estudados na área
Leia maisFormação Continuada em Matemática Matemática 1º Ano 3º Bimestre/2012. Plano de Trabalho Trigonometria
Formação Continuada em Matemática Matemática 1º Ano 3º Bimestre/2012. Plano de Trabalho Trigonometria Tarefa 2 Cursista: Raquel dos Santos Ramos Tutor: Denílson Herinque Cortes Introdução O plano de trabalho
Leia maisMODELANDO A TAXA DE NEOPLASIA PULMONAR NO BRASIL VIA MODELOS LINEARES GENERALIZADOS
Revista da Estatística UFOP, Vol III, 2014 - ISSN 2237-8111 MODELANDO A TAXA DE NEOPLASIA PULMONAR NO BRASIL VIA MODELOS LINEARES GENERALIZADOS Thiago Rezende dos Santos 1,2, Roger William Câmara Silva
Leia maisRegressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC
Regressão Linear Fabrício Olivetti de França Universidade Federal do ABC Tópicos 1. Overfitting 2. Treino e Validação 3. Baseline dos modelos 1 Overfitting Overfit Em muitos casos, a amostra de dados coletada
Leia maisDiagnóstico Médico de Imagem Auxiliado por Computador
Diagnóstico Médico de Imagem Auxiliado por Computador Fundamentos de Sistemas Multimídia Flávio Luiz Seixas 2005 Agenda Agenda: Sistemas CAD Telemedicina Princípios da Tomografia Computadorizada Processamento
Leia maisEEL891 Aprendizado de Máquina Prof. Heraldo L. S. Almeida. Introdução
1 Introdução 1. Introdução 1.1. O que é Aprendizado de Máquina? 1.2. Por que Machine Learning é o Futuro? 1.3. Algumas Aplicações 1.4. Tipos de Aprendizado 1. Introdução 17 1. Introdução 1.1. O que é Aprendizado
Leia maisTEP suspeita: tratar ou não tratar? AngioTCMD negativa exclui o diagnóstico de TEP?
AngioTCMD negativa exclui o diagnóstico de TEP? Dalen JE. Chest 2002;122:1440-56 TEP suspeita: tratar ou não tratar? TEP presente Tratamento: -Reduz a mortalidade ( 1 a 3% ) -Risco de sangramento Sem tratamento:
Leia mais