Estatística e Delineamento

Documentos relacionados
Capítulo II: Estimação Pontual: noções básicas de estimação; método dos momentos e método da máxima verosimilhança; propriedades.

Filho, não é um bicho: chama-se Estatística!

PROGRAMA/BIBLIOGRAFIA e NORMAS DE AVALIAÇÃO

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

Disciplina de Modelos Lineares Professora Ariane Ferreira

GUIA DE FUNCIONAMENTO DA UNIDADE CURRICULAR

Casos. Índice. Parte I. Caso 1 Vendas da empresa Platox. Caso 2 Importação de matéria-prima. Caso 3 Carteira de acções. Caso 4 Lançamento de produto

Curso(s): Licenciaturas em Engenharia (1º ciclo) Aulas Teóricas 30h. Ano Curricular Semestre: 2º ano 1º semestre Aulas Teórico-Práticas 45h

SME0812 Modelos Lineares 1 o semestre de Prof. Cibele Russo

ESCOLA SUPERIOR DE TECNOLOGIA E GESTÃO

UNIVERSIDADE ESTADUAL PAULISTA PLANO DE ENSINO DA DISCIPLINA

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular PROBABILIDADES E ESTATÍSTICA Ano Lectivo 2013/2014

Predição do preço médio anual do frango por intermédio de regressão linear

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular PROBABILIDADES E ESTATÍSTICA Ano Lectivo 2018/2019

RESOLUÇÃO Nº 01/2016

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

Introdução. Amostragem, amostra aleatória simples, tabela de números aleatórios, erros

Modelo de Regressão Múltipla

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ESTATÍSTICA INFERENCIAL Ano Lectivo 2010/2011

PROGRAMA DE DISCIPLINA MÉTODOS ESTATÍSTICOS EM EPIDEMIOLOGIA

UNIVERSIDADE ESTADUAL PAULISTA CAMPUS DE ILHA SOLTEIRA FACULDADE DE ENGENHARIA DE ILHA SOLTEIRA

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2)

Ministério da Educação UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Câmpus Curitiba PLANO DE ENSINO

PLANO DE CONTEÚDO MÍNIMO (PCM) - UNIDADE UNIVERSITÁRIA DE COMPUTAÇÃO. Professora Rosana da Paz Ferreira CCB1052 (2018.2)

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular PROBABILIDADES E ESTATÍSTICA Ano Lectivo 2012/2013

SME0819 Álgebra Matricial Aplicada à Estatística 1 o semestre de Prof. Cibele Russo

SERVIÇO PÚBLICO FEDERAL MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL RURAL DO SEMI-ÁRIDO PRO-REITORIA DE GRADUAÇÃO PROGRAMA GERAL DE DISCIPLINA

SME o semestre de Prof. Cibele Russo

Apontamentos de Introdução às Probabilidades e à Estatística

UNIVERSIDADE ESTADUAL PAULISTA CAMPUS DE BOTUCATU PROGRAMA DE PÓS-GRADUAÇÃO EM AGRONOMIA ENERGIA NA AGRICULTURA PLANO DE ENSINO

Programa Analítico de Disciplina EST106 Estatística I

Apontamentos de Introdução às Probabilidades e à Estatística

MODELOS MATEMÁTICOS E APLICAÇÕES 2015/2016 EXERCÍCIOS DE MODELOS LINEARES MISTOS PARTE I

UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO Centro de Ciências Exatas Departamento de Estatística

UNIVERSIDADE LUSÍADA DE LISBOA. Programa da Unidade Curricular ESTATÍSTICA DESCRITIVA Ano Lectivo 2014/2015

Disciplina de Modelos Lineares

SME0320 Estatística I 2 o semestre de 2014

Instituto de Estudos Sociais e Políticos - IESP-UERJ Lego II - análise de dados quantitativos

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE PELOTAS PRÓ-REITORIA DE GRADUAÇÃO

Universidade Federal do Pará Instituto de Tecnologia ESTATÍSTICA APLICADA. Campus de Belém Curso de Engenharia Mecânica

CONTEÚDO PROGRAMÁTICO

Súmario APRESENTAÇÃO DA COLEÇÃO...13

Estatística Computacional (Licenciatura em Matemática) Duração: 2h Exame 14/06/10 NOME:

QMRE = n (p+1) R 2. 1 R 2 (p,n (p+1)), sob H 0.

ISCTE-IUL Licenciatura em Economia Econometria 1 2º Ano, 2º Semestre 2010/2011

1. Capacidade de resolver problemas que envolvam variáveis aleatórias;

Faturamento de Restaurantes

O USO DE MODELOS DE REGRESSÃO LOGÍSTICA PARA AVALIAÇÃO DO PROBLEMA DE EVASÃO DE ALUNOS NO CURSO DE QUÍMICA INDUSTRIAL DA UNUCET-UEG

Universidade Federal do Pará Instituto de Tecnologia. Plano da Disciplina. Campus de Belém Curso de Engenharia Mecânica

Plano de aula. Noções de Probabilidade e Estatística (221171) Prof. a Dr. a Simone Daniela Sartorio. DTAiSeR-Ar

Exemplo Vida Útil de Ferramentas

Universidade Federal do Pará Instituto de Tecnologia ESTATÍSTICA APLICADA. Plano da Disciplina. Campus de Belém Curso de Engenharia Mecânica

Paulo Jorge Silveira Ferreira. Princípios de Econometria

Procedimento Complementar para Validação de Métodos Analíticos e Bioanalíticos usando Análise de Regressão Linear

Transcrição:

Estatística e Delineamento Jorge Cadima Secção de Matemática (DCEB) Instituto Superior de Agronomia (ULisboa) 2016-17 J. Cadima (ISA) Estatística e Delineamento 2016-17 1 / 474

1 Professores: Jorge Cadima Elsa Gonçalves Maria João Martins Maria José Silva 2 Webpage: Sistema Fénix 3 Software: http://www.r-project.org http://cran.r-project.org J. Cadima (ISA) Estatística e Delineamento 2016-17 2 / 474

Objectivos Introduzir alguns dos principais modelos estatísticos: Regressão Linear (Simples e Múltipla) Análises de Variância Introduzir ferramentas para estudar dados de contagens: Testes χ 2 baseados na estatística de Pearson Admite-se que houve frequência duma disciplina introdutória de Estatística no primeiro ciclo (semelhante à existente no ISA). Nas disciplinas introdutórias de Estatística aborda-se o estudo das observações duma variável. Nesta disciplina procura-se estudar variáveis explicativas dessas observações. J. Cadima (ISA) Estatística e Delineamento 2016-17 3 / 474

Enquadramento Na UC Estatística e Delineamento admite-se que são conhecidos conceitos como: principais indicadores descritivos (média, variância, covariância, etc.) e suas propriedades; conceitos básicos de probabilidades; variáveis aleatórias e sua caracterização; principais distribuições de probabilidades (Normal, χ 2, t-student, F, Binomial, Poisson); Conceitos de intervalos de confiança e testes de hipóteses. AVISO: Quem precisa de (re)ver estes conhecimentos deve utilizar também os materiais de apoio da UC Estatística dos primeiros ciclos do ISA (ou equivalentes), que estão disponíveis na página web dessa UC (seguir o apontador na página web de ED). J. Cadima (ISA) Estatística e Delineamento 2016-17 4 / 474

Aulas e horários de dúvidas Aulas teóricas (2 vezes 1h por semana) - Há dois blocos diferentes, ambos com aulas 3as. e 5as.-feiras. Aulas práticas (2 vezes 1h30 por semana) - Há oito turmas (inscrições via Fénix). As aulas práticas começam quarta-feira, dia 14 de Setembro. AVISOS: O material de apoio para as aulas é disponibilizado na página web da UC (ver secção lateral de nome Materiais de Apoio). Antes da primeira aula prática confirmar que tem conta (informática) de aluno (em caso de problema contactar CIISA) Para a primeira aula prática levar (i) Enunciados dos Exercícios Introdutórios; e (ii) uma pen para guardar a sessão de trabalho. AVISO: Existem horários de dúvidas 4 dias por semana (ver webpage). Todos os horários de dúvidas são para qualquer aluno da UC. J. Cadima (ISA) Estatística e Delineamento 2016-17 5 / 474

Avaliação de conhecimentos Por testes (dois testes: um a meio do semestre e outro na data da primeira chamada de exame); ou AVISOS: Por exame final. Aprovação por testes: classificação média igual ou superior a 9,5 valores no conjunto de dois testes, desde que em nenhum dos testes a classificação seja inferior a 8,0 valores. Aprovação em exame: classificação igual ou superior a 9,5 valores. Qualquer aluno inscrito na UC pode apresentar-se a avaliação de conhecimentos, desde que regularmente inscrito. Nas avaliações não são admitidas calculadoras gráficas, nem qualquer tipo de equipamento electrónico. Proposta data primeiro teste: Segunda-feira, 31 de Outubro, 18h. J. Cadima (ISA) Estatística e Delineamento 2016-17 6 / 474

Programa 1 Testes de hipóteses para dados de contagem (baseados na estatística χ 2 de Pearson). 2 Modelo Linear. 1 Regressão Linear Simples 2 Regressão Linear Múltipla 3 Análises de Variância (ANOVA) e variantes J. Cadima (ISA) Estatística e Delineamento 2016-17 7 / 474

1. Testes de Hipóteses para dados de contagem (estatística χ 2 de Pearson) Objectivo: Testar se dados de contagem são compatíveis com uma dada hipótese explicativa. Exemplo: Em viticultura há técnicas de enxertia chamadas enxertos prontos. O sucesso depende de se verificar, ou não, o pegamento (formação do calo de enxertia). Deseja-se comparar o comportamento de três porta-enxertos específicos (1103P, SO4 e R99) para a casta Castelão. Eis os resultados dum estudo: 1103P SO4 R99 não pegamento 8 12 32 pegamento 954 943 939 Estes resultados são compatíveis com a hipótese de os porta-enxertos serem equivalentes, em matéria de pegamento? Ou a diferença nos resultados observados pode ser considerada estatisticamente significativa, havendo porta-enxertos melhores do que outros? J. Cadima (ISA) Estatística e Delineamento 2016-17 8 / 474

Testes χ 2 para dados de contagem (cont.) Breve revisão da teoria de testes de hipóteses. Teste de ajustamento duma distribuição unidimensional (as contagens duma experiência são compatíveis com uma distribuição Binomial? Ou uma Poisson?). Probabilidades totalmente pré-especificadas Probabilidades estimadas Testes para tabelas de contingência (contagens em tabela de dupla entrada, como no exemplo acima). Aplicações à teoria genética (probabilidades conhecidas). Teste de homogeneidade Teste de independência J. Cadima (ISA) Estatística e Delineamento 2016-17 9 / 474

2.1. Modelo Linear: regressão linear simples Objectivo: Relacionar linearmente duas variáveis numéricas. Exemplo: Produção de azeitona e de azeite em Portugal, entre os anos 1995 e 2010 (Fonte:INE) Azeite (hl) 3e+05 4e+05 5e+05 6e+05 7e+05 1998 2003 2007 2001 2005 2002 1996 2008 1999 2004 1995 1997 2006 2009 2010 2000 200000 250000 300000 350000 400000 Azeitona (toneladas) J. Cadima (ISA) Estatística e Delineamento 2016-17 10 / 474

Modelo Linear: Regressão Linear Simples Contexto descritivo (o ajustamento da recta na amostra) Equação da recta ajustada (método dos mínimos quadrados); Propriedades da recta ajustada; Relações não-lineares e transformações linearizantes. Inferência (sobre a recta populacional, com base numa amostra) O modelo; Propriedades distribucionais dos estimadores do modelo; Intervalos de confiança para os parâmetros; Testes de hipóteses para os parâmetros; Análise dos resíduos para validação do modelo e identificação de observações especiais. J. Cadima (ISA) Estatística e Delineamento 2016-17 11 / 474

2.2. Modelo linear: Regressão Linear Múltipla Objectivo: Relacionar uma variável resposta numérica com dois ou mais preditores numéricos, através duma relação linear. Contexto descritivo Uma ferramenta: a notação matricial; A estimação dos parâmetros do (hiper)plano ajustado; Propriedades do (hiper)plano ajustado. A inferência O modelo; Propriedades distribucionais dos estimadores; Intervalos de confiança e testes de hipóteses para os parâmetros; Submodelos e selecção de submodelos; Análise dos resíduos. J. Cadima (ISA) Estatística e Delineamento 2016-17 12 / 474

2.3. Modelo Linear: Análise de Variância (ANOVA) Objectivo: Relacionar uma variável resposta numérica com um ou mais preditores categóricos (factores). Exemplo: Comparar a % de gordura no leite de 5 raças de vacas (Ayrshire, Canadian, Guernsey, Holstein-Fresian, Jersey). Eis os diagramas de extremos e quartis para 20 vacas de cada raça: Gordura no leite (%) 3.5 4.0 4.5 5.0 5.5 6.0 6.5 Ayrshire Canadian Guernsey Holstein Fresian Jersey Raça Há raças com leite mais gordo, ou as diferenças são obra do acaso? J. Cadima (ISA) Estatística e Delineamento 2016-17 13 / 474

Modelo Linear: ANOVAs (cont.) Introdução ao delineamento experimental Delineamento a um factor totalmente casualizado e o modelo correspondente (efeitos fixos) Delineamento factorial a dois factores. O modelo sem interacção e o modelo com interacção (efeitos fixos). Delineamento a dois factores hierarquizados e respectivo modelo (efeitos fixos) Extensão: O modelo a um factor, com efeitos aleatórios J. Cadima (ISA) Estatística e Delineamento 2016-17 14 / 474

Bibliografia 1 Referências Base: Kutner, M.H.; Nachtsheim, C.J.; Neter, J. e Li, W. (2005), Applied Linear Statistical Models, Irwin [BISA: U10-727 e CD-236] Slides das aulas teóricas (disponibilizados na página web da UC) 2 Outras referências: Draper, N.R. e Smith, H. (1998), Applied Regression Analysis, 3a. edição, John Wiley & Sons [BISA: U10-734] + [SI-78] ([BISA: U10-412] a primeira edição de 1981). Montgomery, D.C. e Peck, E.A. (1982), Introduction to Linear Regression Analysis, John Wiley & Sons [BISA: U10-329] Seber, G.A.F. (1977), Linear Regression Analysis, John Wiley & Sons [BISA: U10-416] J. Cadima (ISA) Estatística e Delineamento 2016-17 15 / 474

Bibliografia (continuação) 3 Referências de apoio à utilização do R Docentes da disciplina de Estatística (2008/09), Introdução à Aplicação R, www.isa.utl.pt/dm/estat/estat/aulasr.pdf Maindonald, J. e Brown, W.J. (2003), Data Analysis and Graphics using R, Cambridge University Press [BISA: U10-722] Torgo, L. (2006), Introdução à Programação em R, cran.r-project.org/doc/contrib/torgo-programmingintro.pdf Venables, W.N. e Ripley, B.D. (2002), Modern Applied Statistics with S (fourth edition), Springer-Verlag [BISA: U10-733] J. Cadima (ISA) Estatística e Delineamento 2016-17 16 / 474