Modelos para Regressão. Modelos lineares. Exemplo. Método de regressão linear

Documentos relacionados
Cap. 6. Definição e métodos de resolução do problema de valores de fronteira

Aprendizagem de Dados Simbólicos e/ou Numéricos. Francisco Carvalho

Redes Neurais e Sistemas Fuzzy

Rememorando. Situação-problema 5. Teorema do Limite Central. Estatística II. Aula II

FICHA de AVALIAÇÃO de MATEMÁTICA A 12.º Ano de escolaridade Versão.1

FICHA de AVALIAÇÃO de MATEMÁTICA A 12.º Ano Versão 4

Introdução ao Data Mining Instituto Nacional de Estatística de Fevereiro de 2009

FICHA de AVALIAÇÃO de MATEMÁTICA A 12.º Ano de escolaridade Versão.4

INSTITUTO SUPERIOR DE AGRONOMIA ESTATÍSTICA E DELINEAMENTO 9 de Janeiro, 2017 PRIMEIRO EXAME Uma resolução possível

Distribuição de uma proporção amostral

Análise de Regressão Linear Simples e

UNIVERSIDADE DE COIMBRA - FACULDADE DE CIÊNCIAS E TECNOLOGIA DEPARTAMENTO DE MATEMÁTICA ALGORITMO DO PONTO MÉDIO PARA

Redes Neurais. Redes Neurais Recorrentes A Rede de Hopfield. Prof. Paulo Martins Engel. Memória associativa recorrente

FICHA de AVALIAÇÃO de MATEMÁTICA A 12.º Ano de escolaridade Versão.3

out II - Algoritmo Back-Propagation II - Algoritmo BackPropagation II - Algoritmo Back-Propagation Modelo de Rede Neural com Multiplas Camadas

Outras Técnicas que Utilizam o Escore de Propensão

Valores e vectores próprios

Noções de Testes de Hipóteses

DISTRIBUIÇÃO DE PROBABILIDADES BINOMIAL. Para cada um dos lançamentos, há dois resultados distintos, ou probabilidades elementares:

RESISTÊNCIA DOS MATERIAIS 2 Marcel Merlin dos Santos

ONS - Rua da Quitanda, o. andar - Centro - CEP: Rio de Janeiro - RJ - Telefone : (21)

Programação Paralela e Distribuída 2010/11. Métricas de Desempenho. Ricardo Rocha DCC-FCUP

M odulo de Potencia c ao e D ızimas Peri odicas Nota c ao Cient ıfica e D ızimas Oitavo Ano

Apontamentos de Álgebra Linear

Por outras palavras, iremos desenvolver a operação inversa da derivação conhecida por primitivação.

1 LIMITES FUNDAMENTAIS NA TEORIA DA INFORMAÇÃO

Segunda aula de fenômenos de transporte para engenharia civil. Estática dos Fluidos capítulo 2 do livro do professor Franco Brunetti

1 3? Assinale esses pontos no gráfico.

MICROECONOMIA II ( ) João Correia da Silva

Invertendo a exponencial

Um Modelo Híbrido para Previsão de Produção de Petróleo

Estabilidade Dinâmica: Modos Laterais

ESCOAMENTO ANUAL 1 DISTRIBUIÇÃO ESTATÍSTICA

MATEMÁTICA COMENTÁRIO DA PROVA

APOSTILA DE MÉTODOS QUANTITATIVOS

Conjunto de Valores. A Função de Probabilidade (fp)

Análise da Aquisição de Equipamentos Médicos Utilizando Redes Neurais Artificiais

Gestão de Riscos e Investimentos

Exames Nacionais. Prova Escrita de Matemática A 2009 VERSÃO Ano de Escolaridade Prova 635/1.ª Fase. Grupo I

Análise de regressão linear simples. Diagrama de dispersão

Aluno (a): Data: / / Professor (a): ESTEFÂNIO FRANCO MACIEL Série: 2º Turma:

4 Cargas Dinâmicas 4.1 Introdução

Problemas com ABP Desbalanceamento progressivo

matematicaconcursos.blogspot.com

Cap. 7. Princípio dos trabalhos virtuais

Conjunto de Valores. A Função de Probabilidade (fp)

-- INSTRUÇÕES -- Elementos de Probabilidade e Estatística U.C de Junho de Duração da prova: 2 horas mais 30 minutos de tolerância.

VIGAS. Figura 1. Graus de liberdade de uma viga no plano

CÁLCULO I Ano Lectivo o Semestre

PROTOCOLO PARA ESTIMAR ERROS DE DISCRETIZAÇÃO EM CFD: VERSÃO 1.1. Carlos Henrique Marchi. Curitiba, UFPR, setembro de 2005.

SIMULADO. 05) Atribuindo-se todos os possíveis valores lógicos V ou F às proposições A e B, a proposição [( A) B] A terá três valores lógicos F.

Aprendizagem de Máquina

Passeio aleatório: jogo da roleta e apostas esportivas

5 Ferramentas de analise

Teste de hipóteses para médias e proporções amostrais

ALGA- 2005/ (i) det. 7 (ii) det. det (A) = a 11 a 22 a 33 a 44 a 55 a Calcule: (a) det

3. ANÁLISE DE DADOS EXPERIMENTAIS

INTRODUÇÃO À MATEMÁTICA FINANCEIRA

Teoria da Firma. Discriminação de preços tarifa em duas partes e concorrência monopolística. Roberto Guena de Oliveira USP.

AA-220 AERODINÂMICA NÃO ESTACIONÁRIA

4. O algoritmo LMS e variantes

3 Método de Modelagem e Procedimento de Cálculo

Angela Fontana Marques

Definição das variáveis principais consideradas no Programa Richardson 4.0

3 Propagação em ambientes abertos na faixa GHz

Seja (X,Y) uma v.a. bidimensional contínua ou discreta. Define-se valor esperado condicionado de X para um dado Y igual a y da seguinte forma:

Aula # 8 Vibrações em Sistemas Contínuos Modelo de Segunda Ordem

ISCTE Licenciatura de Finanças Investimentos Exame - Resolução 09/07/2001 Duração: 2.5h + 0.5h

Teste de hipóteses para médias e proporções amostrais

Estudo da influência dos índices de severidade na segurança de um Sistema Eléctrico de Energia

Fundamentos de Telecomunicações 2004/05

Estática dos Fluidos. Prof. Dr. Marco Donisete de Campos

Escola Secundária/3 da Sé-Lamego Ficha de Trabalho de Matemática Ano Lectivo 2003/04 Probabilidade condicionada; acontecimentos independentes 12.

Transformação dos dados. Analise de Componentes Principais - PCA

Microeconomia II. Licenciaturas em Administração e Gestão de Empresas e em Economia

Estruturas de Betão Armado II 17 Pré-Esforço Perdas

EXAME NACIONAL DO ENSINO SECUNDÁRIO

Exame de Matemática II - Curso de Arquitectura

Escoamentos Compressíveis. Aula 03 Escoamento unidimensional

RESOLUÇÃO - 1ª PROVA ICIN 2º/2012

Cap. 6. Definição e métodos de resolução do problema de valores de fronteira

1ª PROVA ICIN 1º/2015

Probabilidades e Estatística

Segunda aula de teoria de ME5330. Fevereiro de 2011

Probabilidades e Estatística

Secção 5. Equações lineares não homogéneas.

Função par e função ímpar

Neste pequeno artigo resolveremos o problema 2 da USAMO (USA Mathematical Olympiad) 2005: (x 3 + 1)(x 3 + y) = (x 3 + y)(1 + y) = z 9

Aula 4 e 5 de laboratório. Segundo semestre de 2012

Situação-problema 3. Situação-problema 3. Situação-problema 3. Situação-problema 3. Distribuição Amostral da Proporção.

Um Estudo Teórico para Generalização do Método de Coates a 3D e sua Aplicação em Otimização da Recuperação na Lavra por Câmaras e Pilares

EQUALIZAÇÃO DE FASE BASEADA NA INCLINAÇÃO DE UMA RETA-MODELO OBTIDA A PARTIR DO ATRASO DE FASE DO FILTRO A SER EQUALIZADO

Programação de um semáforo usando o método do grau de saturação

Redes Neurais. A Rede RBF. Redes RBF: Função de Base Radial. Prof. Paulo Martins Engel. Regressão não paramétrica. Redes RBF: Radial-Basis Functions

Ciência de Computadores Sistemas Inteligentes

Parâmetros do Hidrograma Unitário para bacias urbanas brasileiras

Aula Teórico-Prática Nº1

MADEIRA arquitetura e engenharia

Cadeias de Markov. Andrei Andreyevich Markov (*1856, Ryazan, Russia; 1922, São Petersburgo, Russia).

Identidades Termodinâmicas

Transcrição:

Modelos ara Regressão Pretende-se arender a redizer o valor de uma variável (atributo) numérica. Os atributos (ou variáveis) usados como entrada ara o algoritmo de arendizagem dizem-se reditores odendo ser numéricos ou nominais. Questões relevantes: Precisão da redição Imortância relativa / interdeendência das variáveis reditoras Comlexidade dos modelos obtidos Graça Gasar - DI/FCUL Modelos ara regressão - Modelos lineares Sea y a variável alvo, ŷ o seu valor aroximado (redito), e x as variáveis reditoras ŷ é uma combinação linear das variáveis reditoras: ) y = a + a = x ŷ deve redizer o valor médio de y ara cada vector (x,, x ) Os (+) coeficientes a são chamados coeficientes de regressão. Por conveniência da notação, considera-se uma variável extra x, cuo valor é semre y) = x = Com uma única variável reditora temos um modelo de regressão simles, reresentando uma recta de regressão. Com várias variáveis reditoras temos um modelo de regressão múltila, reresentando um hierlano de regressão. Graça Gasar - DI/FCUL Modelos ara regressão - 2 Exemlo cycle time main memory cache chanels erformance (ns) (Kb) (Kb) MYCT MMIN MMAX CACH CHMIN CHMAX class 25 256 6 256 6 28 99 29 8 32 32 8 32 253 29 8 32 32 8 32 253 29 8 32 32 8 32 253 29 8 6 32 8 6 32 26 8 32 64 8 32 29 23 32 64 28 32 64 238 4 3 2 23 4 52 35 4 6 24 6 2 8 65 8 7 5 4 6 65 8 7 35 64 64 4 5 Modelo linear roduzido a artir de conunto de 29 exelos de treino: Método de regressão linear Os valores actuais de y no conunto de treino tiicamente diferem de ŷ Estas diferenças e( são chamadas resíduos ou erros: ) y( = y( + e( = a x ( + e( = Queremos obter valores ara os arâmetros a que minimizem os resíduos: Método dos quadrados mínimos ( least squares ) minimizar n 2 n e( = y( a i = i = = x 2 ( class = -66.5 +.66 MYCT +.43 MMIN +.659 MMAX +.494 CACH -.72 CHMIN +.2 CHMAX Graça Gasar - DI/FCUL Modelos ara regressão - 3 Graça Gasar - DI/FCUL Modelos ara regressão - 4

Cálculo dos coeficientes de regressão A equação dos resíduos y( = a x ( + e(, = i < n ode ser exressa em termos matriciais: y = Xa + e onde y é uma matriz (vector) n de valores alvo, X uma matriz n (+) de valores das variáveis reditoras, a um vector (+) de coeficientes de regressão e e um vector n de resíduos Os valores dos coeficientes de regressão que minimizam a soma dos quadrados dos resíduos odem ser calculados or a = X T X X T y Graça Gasar - DI/FCUL Modelos ara regressão - 5 Algoritmo de Widrow-Hoff Nos anos 6 rocurou-se construir algoritmos iterativos simles caazes de arender modelos lineares O algoritmo de Widrow-Hoff (também conhecido como LMS least-mean-square ou Adaline) converge ara a solução imlementando uma estratégia simles de descida de gradiente, tendo uma regra de actualização dos esos análoga à do ercetrão Graça Gasar - DI/FCUL Modelos ara regressão - 6 Esboço do algoritmo Sea η uma constante ositiva equena chamada taxa de arendizagem Inicializar cada a com um valor equeno aleatório Até satisfazer condição de terminação: ara cada exemlo de treino <(x,,x ), y>: calcular y) = a x = ara cada coeficiente a, : ) a a + η(y y)x Árvores ara redição numérica Uma estrutura análoga a uma árvore de decisão ode ser usada ara roblemas de regressão, indicando nos nós folha um valor numérico que é a média dos valores do atributo alvo ara todas as instâncias de treino que alcançam esse nó folha. Estas árvores são chamadas árvores de regressão. É ossível combinar árvores de regressão com equações de regressão as folhas contêm exressões de regressão lineares em lugar de um único valor numérico. Estas árvores são chamadas árvores de modelos. Graça Gasar - DI/FCUL Modelos ara regressão - 7 Graça Gasar - DI/FCUL Modelos ara regressão - 8

Árvore de regressão: MMAX <= 4 : CACH <= 8.5 : MMAX <= 6 : class = 24.3 MMAX > 6 : class = 43. CACH > 8.5 : CHMIN <= 7 : class = 52. CHMIN > 7 : class = 4 MMAX > 4 : MMAX <= 225 : CACH <= 27 : class = 8.4 CACH > 27 : class = 28 MMAX > 225 : CHMIN <= : class = 235 CHMIN > : MMAX <= 48 : class = 355 MMAX > 48 : class = 97 Exemlos Árvore de modelos: MMAX <= 4 : CACH <= 8.5 : LM CACH > 8.5 : LM2 MMAX > 4 : MMAX <= 225 : LM3 MMAX > 225 : LM4 Modelos nas folhas: LM: class = 5.9 -.453MYCT +.327MMAX LM2: class = -.69 +.4MMAX +.59CACH +.57CHMIN LM3: class =.64 -.266MYCT +.485MMIN +.346MMAX +.627CACH +.43CHMIN +.27CHMAX LM4: class = -35 -.843MYCT +.83MMAX +.62CACH Construção de árvores ara redição Começa or se construir uma árvore de decisão, usando um critério diferente do ganho de informação ara escolha do melhor atributo num nó Critério de escolha de um atributo A: Escolher A que maximiza Ci reduçãodesviopadrão( C, A) = σ ( C) σ ( Ci ) C onde C é o conunto de exemlos que alcançaram o nó em causa, C i são os subconuntos que resultam da artição de C elos vários valores do atributo A, e σ é o desvio adrão (estimado) dos valores do atributo alvo A subdivisão dos nós termina quando σ(c) é uma equena fracção (or exemlo, menor que 5%) de σ(d), sendo D o conunto de treino comleto, ou quando o número de exemlos em C é muito equeno (or exemlo, 4) Construída a árvore, considera-se a hiótese de odar nós da árvore, de modo análogo à oda de árvores de decisão. i Graça Gasar - DI/FCUL Modelos ara regressão - 9 Graça Gasar - DI/FCUL Modelos ara regressão - Construção e oda de árvores de modelos Nas árvores de modelos, ara cada nó (folha ou não) é calculado um modelo de regressão linear, tendo em conta os exemlos que alcançaram esse nó e considerando aenas como variáveis reditoras os atributos que ainda odem ser testados na subárvore de que esse nó é raiz. Para cada modelo linear estima-se o erro da redição, ela média dos erros roduzidos ara o conunto de exemlos de treino C que alcançaram esse nó, multilicada or um factor ositivo corrector: C + C yi ŷi n i C Simlificação dos modelos lineares: Por causa do factor corrector, oderá tentar reduzir-se o erro estimado da redição, reduzindo o valor de, isto é, simlificando o modelo linear or eliminação de uma das variáveis reditoras São eliminados termos do modelo linear, um a um, enquanto o erro estimado diminuir. Aós a simlificação dos modelos associados aos nós, efectua-se o rocesso de oda da árvore de modelos. Regressão Linear em R O rattle tem ainda muitas limitações nas tarefas de regressão linear No R estão disoníveis as funções: lm regressão linear glm regressão linear generalizada Exemlo: > fire <- read.csv("forestfires.csv") > fire.model <-lm(area ~ RH + wind+ rain, data = fire) >deviance(fire.model) # soma dos quadrados dos resíduos >coef(fire.model) # matriz de coeficientes >fire.model2 <- udate(fire.model,. ~. + tem) Graça Gasar - DI/FCUL Modelos ara regressão - Graça Gasar - DI/FCUL Modelos ara regressão - 2

Problemas com muitas variáveis reditoras A selecção de variáveis é um roblema imortante quando se quer obter a melhor redição ossível. Algumas estratégias que odem ser usadas individualmente ou de forma combinada: Classificar as variáveis num equeno número de gruos segundo uma avaliação da sua imortância no domínio de alicação em causa. Construa o modelo rimeiro com o gruo mais imortante, em seguida adicione o róximo gruo de variáveis, verificando se o auste do modelo melhorou com a inclusão das variáveis no novo gruo. Use a análise de comonentes rinciais ara rocurar um equeno número de comonentes (combinações de variáveis) que exliquem grande arte da variância nos dados. Com sorte, um ou mais das comonentes rinciais odem ser variáveis úteis ou sugerir formas simles de combinar e reduzir as variáveis originais. Graça Gasar - DI/FCUL Modelos ara regressão - 3 Regressão Linear Generalizada Um modelo de regressão linear simles ode ser reresentado or: E [ y] = a + ax onde E[y] é o valor eserado ou valor médio de y. Os modelos de regressão linear generalizada ermitem uma transformação f() sobre o lado esquerdo da equação: f ( E[ y]) = a + a x f() é uma função chamada função link. Exemlos comuns de funções link: (todas funções monótonas) f(x) = x função identidade f(x) = /x f(x) = log(x) f(x) = log( x /(-x) ) função logit Graça Gasar - DI/FCUL Modelos ara regressão - 4 Regressão Linear Generalizada Na regressão linear generalizada os elementos de y odem ter uma distribuição de robabilidade diferente da normal. Distribuições comummente consideradas são: Binomial: y é reresenta o número, de um total n, que satisfaz uma certa condição Poisson: y reresenta uma contagem Quasi-binomial: difere da binomial or ter uma variância suerior ao valor médio. A variância teórica da binomial é substituída ela variância estimada a artir dos dados Quasi- oisson Graça Gasar - DI/FCUL Modelos ara regressão - 5 Regressão Linear Generalizada Estende a regressão linear ara ermitir variáveis resosta não normais e transformações da linearidade Há uma variável resosta y cua distribuição é determinada elo seu valor médio µ e ossivelmente or um factor de escala As variáveis estímulo/reditoras influenciam y através do reditor linear η = a x + a 2 x 2 + + a x O valor médio µ é uma função invertível do reditor linear µ = m(η) η= m - (µ)=f(µ) f() chama-se a função link Graça Gasar - DI/FCUL Modelos ara regressão - 6

Regressão Linear Generalizada Algumas famílias de funções de distribuição e funções link canónicas associadas Binomial - logit() Poisson log Gaussiana identidade Exemlo com binomial Uma certa doença rovoca cegueira rogressiva. Os dados seguintes indicam o número de doentes cegos, numa amostra de 5 essoas, ao longo de várias idades idade 2 35 45 55 7 essoas 5 5 5 5 5 cegos 6 7 26 37 44 Uso de glm com familia binomial > dados <- data.frame( idade= c(2,35,45,55,7), essoas = re(5,5), cegos= c(6,7,26,37,44)) Junção da matriz de 2 colunas (nº de sucessos, nº de insucessos) que constitui a variável resosta Y > dados$y <- cbind(dados$cegos, dados$essoas dados$cegos) > modelo <- glm(y ~ idade,family = binomial(link=logit), data = dados) > summary(modelo) > redict(modelo, data.frame(idade = c(6,8,9)), tye = "resonse") Qual a redição do número de doentes cegos aos 6, 8 e 9 anos? Graça Gasar - DI/FCUL Modelos ara regressão - 7 Graça Gasar - DI/FCUL Modelos ara regressão - 8 Regressão Linear localizada Uma generalização do modelo de regressão linear básico ode ser obtida considerando que Y é localmente linear em X, com uma deendência local distinta em várias regiões do esaço de dados. Modelo roduzido inclui: Os arâmetros de cada hierlano local As fronteiras de cada hierlano As descontinuidades daí resultantes odem ser roblemáticas (saltos súbitos do valor da variável resosta, ara equenas variações das variáveis reditoras) Slines Para evitar essas descontinuidades, ode-se imor continuidade das derivadas a vários níveis nos extremos dos segmentos (que deixarão de ser rectas) Esses segmentos curvos são chamados slines e o modelo global é chamado função sline Tiicamente cada segmento é um olinómio de equeno grau (quadrado ou cúbico). Graça Gasar - DI/FCUL Modelos ara regressão - 9 Graça Gasar - DI/FCUL Modelos ara regressão - 2

Regressão não linear em R Função nls Exemlo: Alicação de um método de regressão não linear ara redizer valores da variável alvo "Volume" do conunto de dados "tree" > startvalues<-c(b=., b=., b2=.) # escolha dos valores iniciais ara os # coeficientes da regressao nao linear > modelo <- nls(volume ~ b*girth^b*height^b2, start=startvalues) #construcao do modelo nao linear > summary(modelo) > B <- coef(modelo) # obtencao dos coeficientes em B Graça Gasar - DI/FCUL Modelos ara regressão - 2