Errata. Análise Categórica, Árvores de Decisão e Análise de Conteúdo

Documentos relacionados
Final exam June 25, 2007 Statistics II

Disciplina de Modelos Lineares Professora Ariane Ferreira

Capítulo 6 Estatística não-paramétrica

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Capítulo 6 Estatística não-paramétrica

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Multicolinariedade e Autocorrelação

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

Aula 8. Teste Binomial a uma proporção p

Noções sobre Regressão

FACULDADE DE ECONOMIA DO PORTO. Licenciatura em Economia E C O N O M E T R I A II

diferença não aleatória na distribuição dos fatores de risco entre os dois grupos

b χ 2 (a 1)(b 1), sob H 0,

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

= < 5. O segundo menor valor esperado estimado corresponde à célula (3,3), com Ê33 = 29 30

Estatística Não Paramétrica. Como construir testes de aderência

CONSULTADORIA INFORMÁTICA, LDA. Análise Bivariada

É dada uma tabela de contingências, sendo os factores de classificação as proveniências (a=3 níveis) e os terrenos (b=3 níveis).

Probabilidades e Estatística MEEC, LEIC-A, LEGM

Capítulo 8 - Testes de hipóteses 3

Testes não paramétricos são testes de hipóteses que não requerem pressupostos sobre a forma da distribuição subjacente aos dados.

variável dependente natureza dicotômica ou binária independentes, tanto podem ser categóricas ou não estimar a probabilidade associada à ocorrência

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Introdução à análise estatística com SPSS. Guião nº6: Medidas de associação

( ) = σ 2. Capítulo 8 - Testes de hipóteses. 8.1 Introdução

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

EXAME DE ESTATÍSTICA / ESTATÍSTICA I

Estatística p/ TCE-PR Teoria e exercícios comentados Prof. Jeronymo Marcondes. Resolução prova Estatística p/ TCE-PR, área atuarial.

Métodos Aproximados para a Resolução da

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

Estatística II Licenciatura em Gestão. Parte I

EXAME DE ESTATÍSTICA / ESTATÍSTICA I

Teste χ 2 de aderência

Estimação e Testes de Hipóteses

MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS

LIVRO DO MÊS SETEMBRO 2010

PRO 3200 Estatística. Prova P1 19/10/2015

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

Testes de Aderência, Homogeneidade e Independência

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

ICMS/PE 2014 Resolução da Prova de Estatística Professor Fábio Amorim. ICMS PE 2014: Resolução da prova de Estatística Prof.

Regressão. PRE-01 Probabilidade e Estatística Prof. Marcelo P. Corrêa IRN/Unifei

Aula 2 Uma breve revisão sobre modelos lineares

MORTALIDADE DE IDOSOS POR DOENÇAS CARDIOLÓGICAS NA CIDADE DE JOÃO PESSOA-PB

BIOESTATÍSTICA AULA 7. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

4 Metodologia. Wt = W 0 exp{(l/k)(1-e-kt)} (8)

Contabilometria. Aula 9 Regressão Linear Inferências e Grau de Ajustamento

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia. Estatística espacial. Padrão Pontual

Testes de Aderência, Homogeneidade e Independência

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

Medidas de Semelhança

Non-parametric tests Solutions

Testes de Aderência, Homogeneidade e Independência

Modelo de Regressão Múltipla

Análise Complexa e Equações Diferenciais 1 ō Semestre 2016/2017

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos

Modelos Bayesianos. Ernesto F. L. Amaral Magna M. Inácio

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Aula 16: Análise de Aderência e Associação

Avaliando Hipóteses. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Testes de Hipóteses Paramétricos

Estatística II Licenciatura em Gestão TESTE I

AULA 8 Experimentos multinomiais e tabelas de contingência

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

First exam October 23, 2006 Statistics II

Modelo de Variáveis discretas. Regressão com uma variável dependente Binária. Variáveis dependentes Binárias. Modelo de Probabilidade Linear

Resolução Simulado 16 de maio de 2014 SEMI

Testes de Hipóteses. : Existe efeito

Nome: N. o : f(u) du para todo o x (V) d) Se F (x) tiver pontos de descontinuidade, então X é discreta (F)

Seja (X,Y) uma v.a. bidimensional contínua ou discreta. Define-se valor esperado condicionado de X para um dado Y igual a y da seguinte forma:

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Correlação e Regressão Linear

Testes de Hipóteses Paramétricos

Prova Escrita de MATEMÁTICA A - 12o Ano a Fase

INSTITUTO SUPERIOR DE ECONOMIA E GESTÃO Estatística II - Licenciatura em Gestão Época de Recurso - Parte prática (14 valores) 24/01/2011.

APONTAMENTOS DE SPSS

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

RISCO. em epidemiologia e ciências da saúde

Primeira Parte. 0, caso contrário.

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

Estatística - Análise de Regressão Linear Simples. Professor José Alberto - (11) sosestatistica.com.br

Modelos Lineares Generalizados

RESOLUÇÃO DAS QUESTÕES DE ESTATÍSTICA

Anexo 1 Análise de correspondências simples

ANOVA FACTORIAL EXEMPLO 1. ANOVA TWO-WAY COM O SPSS. a capacidade de reconhecimento do odor materno

Intervalos de Confiança

DELINEAMENTO EM BLOCOS AO ACASO

Meta-análise: comparação de proporções para o caso de duas amostras independentes

Análise Multivariada Aplicada à Contabilidade

Grupo I. (a) A função de probabilidade marginal de X, P (X = x), é dada por

TÉCNICAS DE AMOSTRAGEM

Correlação e Regressão

Análise de Aderência e de Associação

Associação entre variáveis categóricas e IC95%

Teste de Hipótese. Capítulo 8 Triola, 10 a. Ed. (Capítulo 7 Triola, 9 a. Ed.) 1 Visão Geral. 2 Fundamentos do teste de hipótese

Resolução da Prova de Matemática Financeira e Estatística do ISS Teresina, aplicada em 28/08/2016.

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Transcrição:

Errata Análise Categórica, Árvores de Decisão e Análise de Conteúdo 13, Exemplo 1.6 15, Última figura Sabendo que o número de avarias de uma máquina é uma Sabendo que o número de avarias que uma máquina tem variável aleatória Y com distribuição de Poisson com por semana é uma variável aleatória Y com distribuição de média 0,2 avarias por dia, pretende-se calcular a Poisson com média 0,2 avarias, pretende-se calcular a probabilidade de num ano ocorrerem exactamente 76 probabilidade de num ano ocorrerem exactamente 76 avarias. Conhecendo n = 365, pelo teorema da aditividade avarias. Conhecendo n = 365 e λ = 73, a probabilidade de de Poisson vem λ = 0,2 x 365 = 73, pelo que a haver 76 avarias pode obter-se de forma expedita usando a probabilidade de haver 76 avarias por ano pode obter-se de Syntax do SPSS conforme aqui se mostra. forma expedita usando a Syntax do SPSS conforme aqui se mostra. 39, 2º α custo de α 0,0579 500 u.m = 28,95 u.m α custo de α = 0,0579 500 u.m = 28,95 u.m 39, 3º β custo de β 0,0916 200 u.m = 18,32 u.m β custo de β = 0,0916 200 u.m = 18,32 u.m 40,penúltima linha Retomando o exemplo anterior agora com n = 50, p ˆ = 0,64, e com as mesmas hipóteses simples a testar: Retomando o exemplo anterior agora com n = 50, e com as mesmas hipóteses simples a testar: 43, figura 1.9 73,10º p 0 =0,01 p 0 =0,1 Em grandes amostras, o intervalo de confiança para o logaritmo natural do odds rácio é: O intervalo de confiança para o logaritmo natural do odds rácio é: 73,12º Caso a amostra fosse de grande dimensão, o intervalo de confiança a 95% calcular--se-ia da seguinte forma: O intervalo de confiança a 95% calcula-se da seguinte forma:

94,10º 137, 11.ª linha figura 3.2 2º p < 0,001 p 0,001 p 0,01 p 0,01 β2 p (1-p) Centrando a variável explicativa X 2 à volta da média, ou seja, fazendo x2i x2 para cada observação i, então a média da nova variável é zero, pelo que β 1 representa o logit dessa média, vindo: = β2 p (1-p) Centrando a variável explicativa X 2 à volta da média, ou seja, fazendo x2i x2 = xc2 para cada observação i, então a média da nova variável é zero, pelo que β 2 representa o logit dessa média, vindo: Fórmula 3.5 162, 15.ªlinha 165, 11ª linha p β e 1 β2 e = p( x ) 1 + e c = β 1 + e ( x2 ) β1 2 2 p64,84ºf p65,84ºf = 0,5 0, 442 = 0,0058 p64,84ºf p65,84ºf = 0,5 0, 442 = 0,058 Este valor também se obtém multiplicando o odds inicial 69,84 F por ( 0,793) 5 = 0,314, vindo: Este valor também se obtém multiplicando o odds inicial de 69,84 F por ( 0,793) 5 = 0,314, vindo: 166, 8º 174, 6º 175, No caso concreto em que existe apenas uma variável explicativa, o teste da diferença compara o máximo de L 0 do log-likelihood function, quando β 2 = 0 (modelo inicial constituído apenas com β 1, com o máximo de L 1 do loglikelihood function, para β 1 e β 2 sem restrições (modelo com β 1 e β 2 ). A distância de Cook, por apresentar um valor muito diferente dos restantes para o voo 17, considera o caso 6 como influente. No caso concreto em que existe apenas uma variável explicativa, o teste da diferença compara o máximo de L 0 do log-likelihood function, quando β 2 = 0 (modelo inicial constituído apenas com β 1 ), co)m o máximo de L 1 do loglikelihood function, para β 1 e β 2 sem restrições (modelo com β 1 e β 2 ). A distância de Cook, por apresentar um valor muito diferente dos restantes para o voo 17, considera-o como influente.

Errata Análise Categórica, Árvores de Decisão e Análise de Conteúdo 216, 5.ª linha 254, 4º e 6º linhas (p < 0,01) (p 0,01) A tabela dos parâmetros estimados mostra para um nível de significância do analista de 0,05, que existe efeito interactivo entre o sexo e o continente de origem dos turistas seniores, pois sig = 0,011. A tabela dos parâmetros estimados mostra para um nível de significância do analista p 0,011, que existe efeito interactivo entre o sexo e o continente de origem dos turistas seniores. 269, 5º 287, 3º 306, 8º 315, último 316, De facto, sabe-se que a oportunidade de não ter 0,817 ferimentos em relação a ter é e = 0,442 vezes inferior nos que não usaram cinto em relação aos que usaram, qualquer que seja a combinação das categorias de Sexo*Localização. 2 Uma vez que χ = 4,654, com p = 0,031, rejeita-se a homogeneidade marginal para um nível de significância de 0,05, concluindo-se que os resultados após a terapia endovenosa detectam 23,3% de CA nos diabéticos, valor significativamente maior que os 15,7% detectados antes da terapia, sendo portanto preferível recorrer à terapia. Por vezes, nas tabelas de contingência quadradas, rejeita-se a relação de independência entre as variáveis devido ao elevado peso dos elementos da diagonal principal. Tal não acontece nos modelos de quase independência, onde apenas se comparam os elementos opostos à diagonal principal, eliminando as células que pertencem a essa diagonal. Analyse, Nonparametric Tests, Two Related Samples. De facto, sabe-se que a oportunidade de não ter ferimentos 0,817 em relação a ter é e = 0,442 vezes inferior nos que usaram cinto em relação aos que não usaram, qualquer que seja a combinação das categorias de Sexo*Localização. 2 Uma vez que χ = 4,654, com sig = 0,031, rejeita-se a homogeneidade marginal para um nível de significância p 0,031, concluindo-se que os resultados após a terapia endovenosa detectam 23,3% de CA nos diabéticos, valor significativamente maior que os 15,7% detectados antes da terapia, sendo portanto preferível recorrer à terapia. Por vezes, nas tabelas de contingência quadradas, rejeita-se a relação de independência entre as variáveis devido ao elevado peso dos elementos da diagonal principal. Tal não acontece nos modelos de quase simetria, onde apenas se comparam os elementos opostos à diagonal principal, eliminando as células que pertencem a essa diagonal. Analyse, Nonparametric Tests, Legacy Dialog, Two Related Samples. Em activa-se Estimates. 351, 1º Suspeitando a existência de uma ordem entre as categorias, Suspeitando-se da existência de uma ordem entre as categorias,

351, 3ª tabela 1 2 3 4 5 2 1 2 3 4 3 2 1 2 3 4 3 2 1 2 5 4 3 2 1 1 2 3 4 2 1 2 3 3 2 1 2 4 3 2 1 351, último 352, 1º Com base nesta tabela criam-se, previamente, as 4 dummies da distância, designadas por d1 a d4, seguindo os procedimentos dos casos anteriores. Seguidamente, no modelo Loglinear General, inserem-se nos factores as variáveis var1 e var2 e nas covariates introduzem-se as 4 dummies da distância. Com base nesta tabela criam-se, previamente, as 3 dummies da distância, designadas por d1 a d3, seguindo os procedimentos dos casos anteriores. Seguidamente, no modelo Loglinear General, inserem-se nos factores as variáveis var1 e var2 e nas covariates introduzem-se as 3 dummies da distância. 372, 2º 372, última fórmula 553 + 160 589 + 124 28,9% = 100 28,9% = 100 2464 2464 1320 = 356 + 312 + 375 + 297 1320 = 336 + 312 + 375 + 297 nó 4 nó 6 nó 7 nó 9 nó 4 nó 6 nó 7 nó 9 376, 7º linha 2.5.2 2.5.1 377, último O valor estimado do Mantel-Haenszel common odds ratio mostra com 95% de confiança, que os clientes do nó 9 têm uma oportunidade entre 4,9 e 8,4 vezes maior de contrair dois ou mais empréstimos bancários do que os clientes de outros nós. O valor estimado do Mantel-Haenszel common odds ratio mostra com 95% de confiança, que os clientes do nó 9 têm uma oportunidade entre 4,9 e 8,4 vezes maior de contrair dois ou mais empréstimos bancários do que os clientes de outros nós, qualquer que seja o seu nível de instrução. 490, 11ª linha Resta apenas calcular E (Y ) 2. Resta apenas calcular E (Y 2 ).

Página 311, Onde se lê Entra-se em Deverá ler-se Entra-se em