Prof.: Eduardo Vargas Ferreira

Documentos relacionados
Profs.: Eduardo Vargas Ferreira Walmes Marques Zeviani

Espaços Vetoriais. () Espaços Vetoriais 1 / 17

Métodos de reamostragem

Capítulo 2. Ortogonalidade e Processo de Gram-Schmidt. Curso: Licenciatura em Matemática

Aprendizado de Máquina

FUNDAMENTOS DE SISTEMAS LINEARES PARTE 1

Nota: Turma: MA 327 Álgebra Linear. Terceira Prova. Boa Prova! Primeiro Semestre de T o t a l

Espaços Euclidianos. Espaços R n. O conjunto R n é definido como o conjunto de todas as n-uplas ordenadas de números reais:

Tópicos de Matemática Elementar

ÁLGEBRA LINEAR AULA 9 ESPAÇOS VETORIAIS EUCLIDIANOS

Resolução do 1 o Teste - A (6 de Novembro de 2004)

Parte 2 - Espaços Vetoriais

Aula 25 - Espaços Vetoriais

Álgebra Linear I - Aula 3. Roteiro

Álgebra Linear. Alan Anderson

Álgebra Linear e suas Aplicações Notas de Aula. Petronio Pulino = Q

Espaços Vectoriais. Espaços Vectoriais

Álgebra Linear e Geometria Anaĺıtica. Espaços Vetoriais Reais

Aprendizado de Máquina

MAT Resumo Teórico e Lista de

3 Espaços com Produto Interno

Álgebra Linear Contra-Ataca

Universidade Federal Fluminense - GAN

Álgebra Linear e Geometria Analítica

3 - Subespaços Vetoriais

Apontamentos III. Espaços euclidianos. Álgebra Linear aulas teóricas. Lina Oliveira Departamento de Matemática, Instituto Superior Técnico

Universidade Federal Fluminense - GAN

Álgebra Linear I - Aula 2. Roteiro

Álgebra Linear. Prof. Ronaldo Carlotto Batista. 20 de março de 2019

1 Espaços Vectoriais

Produto Interno. Prof. Márcio Nascimento.

2 Espaços Vetoriais. 2.1 Espaços Vetoriais Euclidianos

ESPAÇO VETORIAL REAL. b) Em relação à multiplicação: (ab) v = a(bv) (a + b) v = av + bv a (u + v ) = au + av 1u = u, para u, v V e a, b R

(x 1, y 1 ) (x 2, y 2 ) = (x 1 x 2, y 1 y 2 ); e α (x, y) = (x α, y α ), α R.

MAT Álgebra Linear para Engenharia II - Poli 2 ō semestre de ā Lista de Exercícios

Esp. Vet. I. Espaços Vetoriais. Espaço Vetorial. Combinações Lineares. Espaços Vetoriais. Espaço Vetorial Combinações Lineares. Esp. Vet.

Ângulo e ortogonalidade em espaços com produto interno

Álgebra Linear AL. Luiza Amalia Pinto Cantão. Depto. de Engenharia Ambiental Universidade Estadual Paulista UNESP

Lista de exercícios 14 Ortogonalidade

Espaços Vetoriais e Produto Interno

Parte I. Álgebra Linear. Sistemas Dinâmicos Lineares. Conteúdo de Revisão de Álgebra Linear. Vetores. Março de 2014

Unidade 5 - Subespaços vetoriais. A. Hefez e C. S. Fernandez Resumo elaborado por Paulo Sousa. 10 de agosto de 2013

Álgebra Linear Exercícios Resolvidos

Álgebra Linear Teoria de Matrizes

Espaços Vetoriais II

Matrizes Semelhantes e Matrizes Diagonalizáveis

Álgebra Linear I. Resumo e Exercícios P3

Instituto Superior Técnico Departamento de Matemática Última actualização: 18/Nov/2003 ÁLGEBRA LINEAR A

Álgebra Linear I - Aula 11. Roteiro. 1 Dependência e independência linear de vetores

1 Álgebra linear matricial

Gabarito P2. Álgebra Linear I ) Decida se cada afirmação a seguir é verdadeira ou falsa.

Autovetor e Autovalor de um Operador Linear

ÁLGEBRA LINEAR I - MAT0032

Questão 1: Seja V o conjunto de todos os pares ordenados de números reais. Denamos a adição e a multiplicação por escalar em V por

Gradiente descendente

ESPAÇOS VETORIAIS EUCLIDIANOS

Universidade Federal de Viçosa Centro de Ciências Exatas e Tecnológicas Departamento de Matemática

Dependência linear e bases

UFPB - CCEN - DEPARTAMENTO DE MATEMÁTICA ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA 1 a LISTA DE EXERCÍCIOS PERÍODO

Aprendizado de Máquina

Algebra Linear. 1. Espaços Vetoriais Lineares. 2. Coordenadas em Espaços Lineares. 3. Operadores Lineares. 4. Transformação de Similaridade

Produto Interno - Mauri C. Nascimento - Depto. de Matemática - FC UNESP Bauru

MA71B - Geometria Analítica e Álgebra Linear Profa. Dra. Diane Rizzotto Rossetto. LISTA 5 - Espaços Vetoriais

Algebra Linear S ergio Lu ıs Zani

Primeira Lista de Álgebra Linear

Lista de exercícios 6 Espaços Vetoriais

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33

Espaços vectoriais com produto interno. ALGA 2008/2009 Mest. Int. Eng. Electrotécnica e de Computadores Espaços vectoriais com produto interno 1 / 19

Notas de Aula Álgebra Linear II IFA Prof. Paulo Goldfeld Versão

Notações e revisão de álgebra linear

REVISÃO DE ÁLGEBRA LINEAR

5. Seja A uma matriz qualquer. Assinale a afirmativa

Aprendizado de Máquina (Machine Learning)

Aprendizado de Máquina

Q1. Seja V um espaço vetorial e considere as seguintes afirmações: um conjunto de geradores de um subespaço S 2 de V, então A 1 A 2

Aprendizado de Supervisionado

Primeira Lista de Exercícios

ÁLGEBRA LINEAR. Exame Final

Noções de Álgebra Linear

MAT2457 ÁLGEBRA LINEAR PARA ENGENHARIA I Gabarito da 2 a Prova - 1 o semestre de 2015

Notas de Aula - Espaços Vetoriais I

ÁLGEBRA LINEAR. Base e Dimensão de um Espaço Vetorial. Prof. Susie C. Keller

Álgebra Linear e suas Aplicações Notas de Aula. Petronio Pulino = Q

Álgebra Linear I - Aula 10. Roteiro

Álgebra Linear. Professor Alessandro Monteiro. 1º Sábado - Matrizes - 11/03/2017

Pontos extremos, vértices e soluções básicas viáveis

Geometria Analítica. Prof Marcelo Maraschin de Souza

ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA. Maria da Graça Marcos Marisa João Guerra Pereira de Oliveira Alcinda Maria de Sousa Barreiras

MA23 - Geometria Anaĺıtica

1 Vetores no Plano e no Espaço

Álgebra Linear e Geometria Analítica. 7ª aula

Notas de Aula Álgebra Linear. Elton José Figueiredo de Carvalho Escola de Ciências e Tecnologia Universidade Federal do Rio Grande do Norte

Álgebra Linear. Sérgio L. Zani

Lista de exercícios para entregar

6. Verifique detalhadamente que os seguintes conjuntos são espaços vetoriais(com a soma e produto por escalar usuais):

Introduzir os conceitos de base e dimensão de um espaço vetorial. distinguir entre espaços vetoriais de dimensão fnita e infinita;

Álgebra Linear e Geometria Anaĺıtica. Vetores, Retas e Planos

(d) Cada vetor de R 2 pode ser escrito de forma única como combinação linear dos vetores

Transcrição:

Universidade Federal do Paraná Laboratório de Estatística e Geoinformação - LEG Introdução Prof.: Eduardo Vargas Ferreira

O que é Machine Learning? Estatística Data Mining 2

O que é Machine Learning? Estatística Machine Learning Data Mining 2

O que é Machine Learning? Estatística Machine Learning Data Mining Métodos 2

O que é Machine Learning? Estatística Machine Learning Data Mining Métodos problemas 2

O que é Machine Learning? Estatística Machine Learning Data Mining Métodos aplicados a problemas 2

Definição Área de estudo que dá aos computadores a habilidade de aprender sem serem explicitamente programados (Arthur Samuel, 1959). 3

Definição Um programa de computador é dito aprender a partir de uma experiência E com respeito a alguma classe de tarefas T e medida de desempenho P, se seu desempenho em tarefas T, medido por P, melhora com a experiência E (Tom Mitchell, 1998). Exemplo Suponha que seu Gmail observe/registre quais e-mails você marca ou não como spam. E, baseado nisso, aprende como melhor filtrar mensagens de spam de sua caixa de e-mails. Tarefa T: Classificar e-mails como spam ou não. Experiência E: observação de quais e-mails você marca como spam. Desempenho/performance P: número (ou proporção) de e-mails corretamente classificados como spam/não spam. 4

Definição 5

Tipos de aprendizagem Machine Learning é a ciência de descobrir estruturas e fazer predições em conjunto de dados; O aprendizado é efetuado a partir de raciocínio sobre exemplos fornecidos por um processo externo ao sistema de aprendizado; Ele pode ser divido em: Aprendizado supervisionado; Aprendizado não-supervisionado. 6

Tipos de aprendizagem Machine Learning é a ciência de descobrir estruturas e fazer predições em conjunto de dados; O aprendizado é efetuado a partir de raciocínio sobre exemplos fornecidos por um processo externo ao sistema de aprendizado; Ele pode ser divido em: Aprendizado supervisionado; Aprendizado não-supervisionado. 6

Tipos de aprendizagem Machine Learning é a ciência de descobrir estruturas e fazer predições em conjunto de dados; O aprendizado é efetuado a partir de raciocínio sobre exemplos fornecidos por um processo externo ao sistema de aprendizado; Ele pode ser divido em: Aprendizado supervisionado; Aprendizado não-supervisionado. 6

Tipos de aprendizagem Machine Learning é a ciência de descobrir estruturas e fazer predições em conjunto de dados; O aprendizado é efetuado a partir de raciocínio sobre exemplos fornecidos por um processo externo ao sistema de aprendizado; Ele pode ser divido em: Aprendizado supervisionado; Aprendizado não-supervisionado. 6

Aprendizado supervisionado Aprendizado supervisionado: é fornecido ao algoritmo de aprendizado, ou indutor, um conjunto de exemplos de treinamento para os quais o rótulo da classe associada é conhecido; Dadas as medições (x 1, y 1),..., (x n, y n), aprender um modelo para prever y baseado em x; Ou seja, o objetivo é construir um classificador que possa determinar corretamente a classe de novos exemplos ainda não rotulados; Para rótulos de classe discretos, esse problema é conhecido como classificação e para valores contínuos como regressão. 7

Aprendizado supervisionado Aprendizado supervisionado: é fornecido ao algoritmo de aprendizado, ou indutor, um conjunto de exemplos de treinamento para os quais o rótulo da classe associada é conhecido; Dadas as medições (x 1, y 1),..., (x n, y n), aprender um modelo para prever y baseado em x; Ou seja, o objetivo é construir um classificador que possa determinar corretamente a classe de novos exemplos ainda não rotulados; Para rótulos de classe discretos, esse problema é conhecido como classificação e para valores contínuos como regressão. 7

Aprendizado supervisionado Aprendizado supervisionado: é fornecido ao algoritmo de aprendizado, ou indutor, um conjunto de exemplos de treinamento para os quais o rótulo da classe associada é conhecido; Dadas as medições (x 1, y 1),..., (x n, y n), aprender um modelo para prever y baseado em x; Ou seja, o objetivo é construir um classificador que possa determinar corretamente a classe de novos exemplos ainda não rotulados; Para rótulos de classe discretos, esse problema é conhecido como classificação e para valores contínuos como regressão. 7

Aprendizado supervisionado Aprendizado supervisionado: é fornecido ao algoritmo de aprendizado, ou indutor, um conjunto de exemplos de treinamento para os quais o rótulo da classe associada é conhecido; Dadas as medições (x 1, y 1),..., (x n, y n), aprender um modelo para prever y baseado em x; Ou seja, o objetivo é construir um classificador que possa determinar corretamente a classe de novos exemplos ainda não rotulados; Para rótulos de classe discretos, esse problema é conhecido como classificação e para valores contínuos como regressão. 7

Exemplo de aprendizado supervisionado Detecção de Spams x i : e-mail; y i : spam/não spam; Objetivo: prever y j com base em x j. 8

Exemplo de aprendizado supervisionado Predição de Alzheimer x i : imagem da ressonância magnética; y i : Paciente com/sem Alzheimer; Objetivo: prever y j com base em x j. 9

Exemplo de aprendizado supervisionado Leitura de pensamentos x i : imagem da ressonância magnética; y i : Pensamento ; Objetivo: prever y j com base em x j. 10

Aprendizado não-supervisionado Aprendizado não-supervisionado: o indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira. Data Step 1 Iteration 1, Step 2a Dadas as medições x 1,..., x n, descobrir alguma estrutura baseada na similaridade; Iteration 1, Step 2b Iteration 2, Step 2a Final Results Após a determinação dos agrupamentos, normalmente, é necessária uma análise para determinar o que cada agrupamento significa no contexto do problema. 11

Aprendizado não-supervisionado Aprendizado não-supervisionado: o indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira. Data Step 1 Iteration 1, Step 2a Dadas as medições x 1,..., x n, descobrir alguma estrutura baseada na similaridade; Iteration 1, Step 2b Iteration 2, Step 2a Final Results Após a determinação dos agrupamentos, normalmente, é necessária uma análise para determinar o que cada agrupamento significa no contexto do problema. 11

Aprendizado não-supervisionado Aprendizado não-supervisionado: o indutor analisa os exemplos fornecidos e tenta determinar se alguns deles podem ser agrupados de alguma maneira. Data Step 1 Iteration 1, Step 2a Dadas as medições x 1,..., x n, descobrir alguma estrutura baseada na similaridade; Iteration 1, Step 2b Iteration 2, Step 2a Final Results Após a determinação dos agrupamentos, normalmente, é necessária uma análise para determinar o que cada agrupamento significa no contexto do problema. 11

Exemplo de aprendizado não-supervisionado Busca por imagens semelhantes x i : imagens na internet; Objetivo: Busca por estrutura semelhante. 12

Exemplo de aprendizado não-supervisionado Recomendação de amizades x i : existe um link entre dois usuários; 13

Como avaliar a precisão dos modelos? Suponha que estamos interessados em estudar a relação entre X e Y A verdadeira relação está representada pela curva em preto; Podemos definir varias funções h(x), mas qual fornece a melhor predição? Resposta: a que apresentar menos custo (ou risco). 14

Como avaliar a precisão dos modelos? Suponha que estamos interessados em estudar a relação entre X e Y A verdadeira relação está representada pela curva em preto; Podemos definir varias funções h(x), mas qual fornece a melhor predição? Resposta: a que apresentar menos custo (ou risco). 14

Como avaliar a precisão dos modelos? Suponha que estamos interessados em estudar a relação entre X e Y A verdadeira relação está representada pela curva em preto; Podemos definir varias funções h(x), mas qual fornece a melhor predição? Resposta: a que apresentar menos custo (ou risco). 14

Função custo Descreve o quão bom a superfície de resposta h(x) ajustou-se aos dados; Valores pequenos da função custo corresponde à melhores ajustes; Notação: J(y i, h(x)); No gráfico da direita, a linha cinza representa os dados de treinamento e a vermelha de teste (veremos isso mais adiante). 15

Função custo Descreve o quão bom a superfície de resposta h(x) ajustou-se aos dados; Valores pequenos da função custo corresponde à melhores ajustes; Notação: J(y i, h(x)); No gráfico da direita, a linha cinza representa os dados de treinamento e a vermelha de teste (veremos isso mais adiante). 15

Função custo Descreve o quão bom a superfície de resposta h(x) ajustou-se aos dados; Valores pequenos da função custo corresponde à melhores ajustes; Notação: J(y i, h(x)); No gráfico da direita, a linha cinza representa os dados de treinamento e a vermelha de teste (veremos isso mais adiante). 15

Função custo Descreve o quão bom a superfície de resposta h(x) ajustou-se aos dados; Valores pequenos da função custo corresponde à melhores ajustes; Notação: J(y i, h(x)); No gráfico da direita, a linha cinza representa os dados de treinamento e a vermelha de teste (veremos isso mais adiante). 15

Função custo Descreve o quão bom a superfície de resposta h(x) ajustou-se aos dados; Valores pequenos da função custo corresponde à melhores ajustes; Notação: J(y i, h(x)); Y 2 4 6 8 10 12 Mean Squared Error 0.0 0.5 1.0 1.5 2.0 2.5 0 20 40 60 80 100 X 2 5 10 20 Flexibility No gráfico da direita, a linha cinza representa os dados de treinamento e a vermelha de teste (veremos isso mais adiante). 15

Tipos de função custo Soma de quadrado dos desvios (SQD) Definido como Note que J(y i, h(x)) = 1 n n [y i h(x i )] 2 i=1 ( ) f (y x) e y h(x) 2 σ. Assim, se quisermos minimizar o log da verossimilhança (equivalente a maximizar o log da verossimilhança), temos (desprezando as constantes) { ( n )} ( min{ (log-verossimilhança)} min log e yi ) h(x i ) 2 σ min { 1 n i=1 } n [y i h(x i )] 2. i=1 16

Tipos de função custo Soma de quadrado dos desvios (SQD) Definido como Note que J(y i, h(x)) = 1 n n [y i h(x i )] 2 i=1 ( ) f (y x) e y h(x) 2 σ. Assim, se quisermos minimizar o log da verossimilhança (equivalente a maximizar o log da verossimilhança), temos (desprezando as constantes) { ( n )} ( min{ (log-verossimilhança)} min log e yi ) h(x i ) 2 σ min { 1 n i=1 } n [y i h(x i )] 2. i=1 16

Tipos de função custo Soma de quadrado dos desvios (SQD) Definido como Note que J(y i, h(x)) = 1 n n [y i h(x i )] 2 i=1 ( ) f (y x) e y h(x) 2 σ. Assim, se quisermos minimizar o log da verossimilhança (equivalente a maximizar o log da verossimilhança), temos (desprezando as constantes) { ( n )} ( min{ (log-verossimilhança)} min log e yi ) h(x i ) 2 σ min { 1 n i=1 } n [y i h(x i )] 2. i=1 16

Tipos de função custo Soma de quadrado dos desvios (SQD) Definido como Note que J(y i, h(x)) = 1 n n [y i h(x i )] 2 i=1 ( ) f (y x) e y h(x) 2 σ. Assim, se quisermos minimizar o log da verossimilhança (equivalente a maximizar o log da verossimilhança), temos (desprezando as constantes) { ( n )} ( min{ (log-verossimilhança)} min log e yi ) h(x i ) 2 σ min { 1 n i=1 } n [y i h(x i )] 2. i=1 16

Tipos de função custo Soma dos desvios absolutos (SDA) Definido como Temos J(y i, h(x)) = 1 n n y i h(x i ) i=1 f (y x) e y h(x) (Distribuição Laplace). Mais robusta na presença de outliers. 17

Tipos de função custo Soma dos desvios absolutos (SDA) Definido como Temos J(y i, h(x)) = 1 n n y i h(x i ) i=1 f (y x) e y h(x) (Distribuição Laplace). Mais robusta na presença de outliers. 17

Tipos de função custo Huber-M cost Definido como J(y i, h(x)) = 1 n n i=1 { 1 [y 2 i h(x i )] 2, para y h(x i ) δ, δ y i h(x i ) 1 2 δ2, caso contrário. Abaixo, a curva azul representa a SQD e verde a função Huber. Ela combina as qualidades da SQD e SQA. O parâmetro δ é obtido automaticamente para um específico percentil dos erros absolutos. 18

Treinamento vs Teste Fase de treino: Fase de teste (ou aplicação do modelo): 19

Treinamento vs Teste Fase de treino: Entra com os dados e os verdadeiros níveis; Fase de teste (ou aplicação do modelo): 19

Treinamento vs Teste Fase de treino: Entra com os dados e os verdadeiros níveis; Obtém um classificador. Fase de teste (ou aplicação do modelo): 19

Treinamento vs Teste Fase de treino: Entra com os dados e os verdadeiros níveis; Obtém um classificador. Fase de teste (ou aplicação do modelo): Entra com os dados; 19

Treinamento vs Teste Fase de treino: Entra com os dados e os verdadeiros níveis; Obtém um classificador. Fase de teste (ou aplicação do modelo): Entra com os dados; Obtém seu nível (de acordo com o classificador ). 19

Exemplo 20

Predição versus Inferência Em inferência em geral assume-se que o modelo é correto. Isso ocorre pois o principal objetivo está na interpretação dos parâmetros. P. ex., quais parâmetros são significantes? Qual o efeito do aumento da dose do remédio no medicamento? etc. Já em predição, nosso objetivo maior é simplesmente criar h(x) que tenha bom poder preditivo. Não estamos assumindo que a verdadeira regressão é linear!! Podemos continuar interpretando os resultados, mas este, em geral, não é o foco das análises. 21

Predição versus Inferência Em inferência em geral assume-se que o modelo é correto. Isso ocorre pois o principal objetivo está na interpretação dos parâmetros. P. ex., quais parâmetros são significantes? Qual o efeito do aumento da dose do remédio no medicamento? etc. Já em predição, nosso objetivo maior é simplesmente criar h(x) que tenha bom poder preditivo. Não estamos assumindo que a verdadeira regressão é linear!! Podemos continuar interpretando os resultados, mas este, em geral, não é o foco das análises. 21

Predição versus Inferência Em inferência em geral assume-se que o modelo é correto. Isso ocorre pois o principal objetivo está na interpretação dos parâmetros. P. ex., quais parâmetros são significantes? Qual o efeito do aumento da dose do remédio no medicamento? etc. Já em predição, nosso objetivo maior é simplesmente criar h(x) que tenha bom poder preditivo. Não estamos assumindo que a verdadeira regressão é linear!! Podemos continuar interpretando os resultados, mas este, em geral, não é o foco das análises. 21

Predição versus Inferência Em inferência em geral assume-se que o modelo é correto. Isso ocorre pois o principal objetivo está na interpretação dos parâmetros. P. ex., quais parâmetros são significantes? Qual o efeito do aumento da dose do remédio no medicamento? etc. Já em predição, nosso objetivo maior é simplesmente criar h(x) que tenha bom poder preditivo. Não estamos assumindo que a verdadeira regressão é linear!! Podemos continuar interpretando os resultados, mas este, em geral, não é o foco das análises. 21

Predição versus Inferência Em inferência em geral assume-se que o modelo é correto. Isso ocorre pois o principal objetivo está na interpretação dos parâmetros. P. ex., quais parâmetros são significantes? Qual o efeito do aumento da dose do remédio no medicamento? etc. Já em predição, nosso objetivo maior é simplesmente criar h(x) que tenha bom poder preditivo. Não estamos assumindo que a verdadeira regressão é linear!! Podemos continuar interpretando os resultados, mas este, em geral, não é o foco das análises. 21

Predição versus Inferência Em inferência em geral assume-se que o modelo é correto. Isso ocorre pois o principal objetivo está na interpretação dos parâmetros. P. ex., quais parâmetros são significantes? Qual o efeito do aumento da dose do remédio no medicamento? etc. Já em predição, nosso objetivo maior é simplesmente criar h(x) que tenha bom poder preditivo. Não estamos assumindo que a verdadeira regressão é linear!! Podemos continuar interpretando os resultados, mas este, em geral, não é o foco das análises. 21

Predição versus Inferência Em inferência em geral assume-se que o modelo é correto. Isso ocorre pois o principal objetivo está na interpretação dos parâmetros. P. ex., quais parâmetros são significantes? Qual o efeito do aumento da dose do remédio no medicamento? etc. Já em predição, nosso objetivo maior é simplesmente criar h(x) que tenha bom poder preditivo. Não estamos assumindo que a verdadeira regressão é linear!! Podemos continuar interpretando os resultados, mas este, em geral, não é o foco das análises. 21

Predição versus Inferência Interpretability Low High Subset Selection Lasso Least Squares Generalized Additive Models Trees Bagging, Boosting Support Vector Machines Low High Flexibility 22

As duas culturas Duas culturas no uso de modelos estatísticos: Data Modeling Culture: Domina a comunidade estatística. Testar suposições é fundamental. Foco em inferência; Algorithmic Modeling Culture: Domina a comunidade de machine learning. O modelo é utilizado apenas para criar bons algoritmos preditivos. 23

As duas culturas L. Breiman: Statistical modeling: The two cultures. Statistical Science, 16(3):199-231, 2001 (disponível no material complementar). Duas culturas no uso de modelos estatísticos: Data Modeling Culture: Domina a comunidade estatística. Testar suposições é fundamental. Foco em inferência; Algorithmic Modeling Culture: Domina a comunidade de machine learning. O modelo é utilizado apenas para criar bons algoritmos preditivos. 23

Breve revisão de Álgebra Linear 24

Espaço e subespaço vetorial Um Espaço Vetorial consiste do seguinte: 1 Um conjunto não vazio V de objetos, denominados vetores; 2 Um corpo F (R ou C) de escalares. 3 Uma operação de adição de vetores, que associa a cada par de elementos u, v V um elemento u + v V, isto é, V é fechado com relação à operação de adição (relembre as 4 propriedades). 4 Uma operação de multiplicação por escalar, que associa a cada elemento u V e cada escalar α F um elemento αu V, isto é, V é fechado com relação à operação de multiplicação por escalar. 25

Espaço e subespaço vetorial Exemplo: O conjunto R n = {u = (x 1,..., x n)/x i R}, conjunto de todas as n-uplas reais, com a operação de adição de elementos definida por: u + v = (x 1,..., x n) + (y 1,..., y n) = (x 1 + y 1,..., x n + y n) e a operação de multiplicação por escalar definida por: é um espaço vetorial real. λu = (λx 1,..., λx n) Um subespaço vetorial de V é um subconjunto U de V que é ele mesmo um espaço vetorial sobre o corpo F com as operações de adição de vetores e multiplicação por escalar definidas em V. Exemplo: O subconjunto S do R 3 definido da forma: S = {w R 3 /w = a(1, 1, 1) + b(2, 1, 1); a, b R}, é um subespaço vetorial de R 3. 26

Dependência e Independência Linear Sejam V um espaço vetorial sobre o corpo F e v 1,..., v n V. Dizemos que o conjunto S = {v 1,..., v n} V é Linearmente Independente (LI) sse toda combinação linear nula α 1v 1 +... + α nv n = 0 V ; α i F implicar que α 1 = α 2 =... = α n = 0. Exemplo: O conjunto S = {1, x, x 2 } é linearmente independente no espaço vetorial P 3(R). 27

Dependência e Independência Linear Sejam V um espaço vetorial sobre o corpo F e v 1,..., v n V. Dizemos que o conjunto S = {v 1,..., v n} V é Linearmente Dependente (LD) sse é possível uma combinação linear nula α 1v 1 +... + α nv n = 0 V ; α i F sem que os escalares α 1, α 2,..., α n sejam todos nulos. Exemplo: O conjunto S = {1, x, x 2, 2 3x + 2x 2 } é linearmente dependente no espaço vetorial P 3(R). Por simplicidade, vamos denotar p 1(x) = 1, p 2(x) = x, p 3(x) = x 2 e p 4(x) = 2 3x + 2x 2. Podemos verificar facilmente que p 4(x) = 2p 1(x) 3p 2(x) + 2p 3(x). 28

Base e Dimensão Seja V um espaço vetorial sobre o corpo F. Uma base de V é um conjunto linearmente independente de elementos de V que gera V. Exemplo: Considere o espaço vetorial real R 3. O conjunto β = {(1, 0, 0), (0, 1, 0), (0, 0, 1)} é linearmente independente em R 3 e gera o espaço R 3. Logo, β é uma base para R 3, denominada base canônica. Exemplo: Considere o espaço vetorial real R 2. O conjunto Γ = {(1, 1), ( 1, 1)} é linearmente independente em R 2 e gera o espaço R 2. Logo, Γ é uma base para R 2. A dimensão de V é definida como sendo o número de elementos de uma base de V. 29

Produto interno Em geometria Euclidiana as propriedades que nos possibilitam expressar o comprimento de vetor e o ângulo entre dois vetores são denominadas de propriedades métricas; No estudo do R n, definimos comprimento de vetores e ângulo entre vetores através do produto escalar x y = n x i y i para x, y R n. i=1 Denotamos o produto interno entre dois elementos u e v de um espaço vetorial da seguinte forma: u, v ; Utilizando as propriedades de simetria, distributividade e homogeneidade tem-se u, v + w = u, v + u, w para todos u, v, w V ; u, λv = λ u, v para todos u, v V e λ R. 30

Norma em espaços de dimensão finita Seja V um espaço vetorial sobre o corpo F; Uma norma, ou comprimento, em V é uma aplicação ; Para cada elemento u V associa um número real u, que possui as seguintes propriedades: Positividade: u > 0, para u 0 v, com u = 0 u = 0 v ; Homogeneidade: λu = λ u para todo u V, λ F; Desigualdade triangular: u + v u + v, u, v V. Exemplos de normas l p : u 1 = n i=1 u i ; ( n ) 1/2 u 2 = ui 2 ; i=1 u = max{u i ; 1 i n}. 31

Definição de ângulo e ortogonalidade Seja V um espaço vetorial real munido do produto interno, ; O ângulo entre dois elementos não nulos u, v V é definido como o valor θ [0, π] que satisfaz a equação cos(θ) = u, v u 2 v 2. Assim, dizemos que os elementos u, v V são ortogonais se, e somente se, u, v = 0, e denotamos por u v. (Teorema de Pitágoras): Sejam V um espaço vetorial real munido do produto interno, e 2 a norma proveniente do produto interno; Então, os elementos u, v V são ortogonais se, e somente se, u + v 2 2 = u 2 2 + v 2 2. 32