Exame de Aprendizagem Automática

Documentos relacionados
Exame de Aprendizagem Automática

1 o Teste de Aprendizagem Automática

2 o Teste de Aprendizagem Automática

1 o Teste de Aprendizagem Automática

Rede RBF (Radial Basis Function)

Teoria do aprendizado

SUPPORT VECTOR MACHINE - SVM

2. Redes Neurais Artificiais

Classificadores Lineares

índice 2. Vetores e Tipos Primitivos PARTE 1- O Sistema R 1. Introdução ao Sistema R

Thiago Zavaschi Orientador: Alessandro Koerich Programa de Pós-Graduação em Informática (PPGIa) Pontifícia Universidade

Eduardo Vargas Ferreira

Aprendizagem de Máquina

Inteligência Artificial

à Análise de Padrões

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Aprendizado de Máquina (Machine Learning)

Curso de Data Mining

scikit-learn: Aprendizado de máquina 101 com Python

Aprendizado Bayesiano

Aprendizagem de Máquina

Aprendizado de Máquinas. Classificadores Lineares

Escola Secundária com 3º ciclo D. Dinis 12º Ano de Matemática A Tema II Introdução ao Cálculo Diferencial II. TPC nº 9 (entregar em )

Uma Introdução a SVM Support Vector Machines. Obs: Baseada nos slides de Martin Law

Mineração de Dados em Biologia Molecular

Combinação de Classificadores (seleção)

Reconhecimento de Padrões. Reconhecimento de Padrões

Redes Neurais Artificiais

ESCOLA SECUNDÁRIA COM 3º CICLO D. DINIS COIMBRA 12º ANO DE ESCOLARIDADE MATEMÁTICA A FICHA DE AVALIAÇÃO 12º B1 Grupo I

2. Redes Neurais Artificiais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Boas Maneiras em Aprendizado de Máquinas

Máquinas de suporte vetorial e sua aplicação na detecção de spam

Rafael Izbicki 1 / 38

INF 1771 Inteligência Artificial

Máquinas de Vetores de Suporte

( x) = +. Qual dos seguintes. x = (B) o contradomínio é ],2] f é uma função par

Aula 1: k-nearest Neighbors

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais

Reconhecimento de Padrões/Objetos

Boas Maneiras Aprendizado Não Supervisionado Regressão

INF 1771 Inteligência Artificial

Support Vector Machines

3 Técnicas de agrupamento

Aprendizado de Máquina (Machine Learning)

Múltiplos Classificadores

Classificação Linear. André Tavares da Silva.

Adriana da Costa F. Chaves. Máquina de Vetor Suporte (SVM) para Classificação Binária 2

Optimização. Carlos Balsa. Departamento de Matemática Escola Superior de Tecnologia e Gestão de Bragança

3 Extração de Regras Simbólicas a partir de Máquinas de Vetores Suporte 3.1 Introdução

Laboratório Como usar algoritmos de aprendizado de máquina de regressão em Weka

θ depende de um parâmetro desconhecido θ.

Tema 0: Módulo Inicial Nº de Aulas Previstas (90 m): 18

Aprendizado de Máquina. Combinando Classificadores

WEKA: Prática Carregando a base de dados no Weka

T6.1 Reconhecimento de Padrões

Aprendizado de Máquina (Machine Learning)

Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC

Créditos. SCC0173 Mineração de Dados Biológicos. Aula de Hoje. Desempenho de Classificação. Classificação IV: Avaliação de Classificadores

Métodos Numéricos em Equações Diferenciais Aula 02 - Método de Euler

SEMINÁRIO DOS ARTIGOS:

Método dos gradientes (ou método de máxima descida)

ANÁLISE DE ALGORITMOS (INF 1721)

Descoberta de Conhecimento em Bancos de Dados - KDD

Sistemas de Apoio à Decisão. Guia de Exercícios

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

PROVAS Ciência da Computação. 2 a Prova: 13/02/2014 (Quinta) Reavaliação: 20/02/2014 (Quinta)

( ) Aula de Hoje. Introdução a Sistemas Inteligentes. Modelo RBF (revisão) Modelo RBF (revisão)

Métodos para Classificação: - Naïve Bayes.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Exercícios de exames e provas oficiais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE FEDERAL DO ABC. 1 Existência e unicidade de zeros; Métodos da bissecção e falsa posição

ANÁLISE DE BIG DATA E INTELIGÊNCIA ARTIFICIAL PARA A ÁREA MÉDICA

Mineração de Dados - II

Instituto Politécnico de Tomar Escola Superior de Tecnologia de Tomar Área Interdepartamental de Matemática

Mistura de modelos. Marcelo K. Albertini. 31 de Julho de 2014

Ajuste de Curvas. Diogo Pinheiro Fernandes Pedrosa. Universidade Federal do Rio Grande do Norte Centro de Tecnologia.

Conceitos de Aprendizagem de Máquina e Experimentos. Visão Computacional

Curso CCS e CCT Componente de Formação Geral Data / / Nome Nº GRUPO I

INF 1771 Inteligência Artificial

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

PROCESSO SELETIVO N 42/2019 PROVA 2 - CONHECIMENTOS ESPECÍFICOS

Laboratório Classificação com o WEKA Explorer

Métodos de Análise de Dados (AO-802)

2284-ELE/5, 3316-IE/3

Máquinas de Vetores de Suporte - Support Vector Machines (SVM) Germano Vasconcelos

Aprendizagem de Máquina

CC-226 Aula 07 - Estimação de Parâmetros

Aplicação de redes neurais artificiais na classificação de imagens obtidas por sensoriamento remoto

Técnicas computacionais em probabilidade e estatística II

Matemática A - 10 o Ano Ficha de Trabalho

Redes Neurais (Inteligência Artificial)

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Introdução

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Comparação de métodos de fingerprints para o rastreio virtual de inibidores da 5α-redutase

Transcrição:

Exame de Aprendizagem Automática 2 páginas com 11 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 5 de Janeiro de 2016 Nota: O exame está cotado para 40 valores. Os 20 valores das perguntas de 1 a 6 correspondem ao primeiro teste; os restantes ao segundo teste. A nota da componente teórico-prática será a média destas duas partes, usando para cada uma a melhor nota entre o exame e o teste correspondente. Pergunta 1 [4 valores] Suponha que quer seleccionar o melhor grau do polinómio a usar num problema de regressão. Usa um terço dos dado disponíveis para treinar os vários polinómios, um terço para validação, de forma a seleccionar o grau do polinómio com menor erro de validação, e um terço para teste do polinómio escolhido no final. Explique porque é que necessita deste conjunto final de teste, se já tinha calculado o erro de validação para cada polinómio. Pergunta 2 [3 valores] Numa regressão polinomial, a linha é colocada de forma a minimizar o erro quadrático entre os valores conhecidos e os valores previstos. Na regressão logística, que apesar do nome é um classificador, onde é que se quer colocar o hiperplano que separa as duas classes? Pergunta 3 [3 valores] A figura à direita mostra as curvas ROC (Receiver Operating Characteristic) para dois classificadores. Ambos foram treinados com o mesmo conjunto de treino, e ambas as curvas foram calculadas com o mesmo conjunto de teste. O eixo vertical mostra a fracção de verdadeiros positivos, o horizontal a fracção de falsos positivos. Indique, justificando, qual dos dois classificadores (A ou B) é o melhor. Pergunta 4 [2 valores] Descreva como se treina um classificador K-Nearest Neighbours. Pergunta 5 [4 valores] A figura à direita mostra esta Support Vector Machine: ( ) 1 N N N min α α n α m y n y m x T m x n α n 2 n=1 m=1 n=1 Foram impostas as seguintes restrições durante a minimização: 0 α n 10, n = 1,..., N N α n y n = 0 n=1 Indique, justificando, qual o valor ou valores possíveis de α para cada um dos pontos A, B e C indicados na figura. Se quiser indicar um intervalo, pode usar a notação [a, b] para um intervalo de valores entre a e b incluindo a e b, ]a, b[ para um intervalo de valores entre a e b excluindo a e b, ou ]a, b], [a, b[ para excluir apenas um dos extremos. Pergunta 6 [4 valores] O classificador Naïve Bayes Classifier assume que todos os atributos são condicionalmente independentes dada a classe. Por outro lado, o classificador de Bayes completo (Bayes Classifier) não assume que os atributos sejam independentes. Sabendo que muitas vezes os atributos não são independentes, mesmo dada a classe, porque é que quase sempre se prefere usar o classificador Naïve Bayes?

2 Segunda Parte Pergunta 7 [3 valores] A inequação abaixo estima o limite superior para o erro verdadeiro E da hipótese ĥ que minimiza o erro de treino Ê. Este limite é função de δ, do tamanho do conjunto de treino m e da dimensão Vapnik-Chervonenkis da classe de hipóteses, V C(H), e limita o erro verdadeiro com probabilidade 1 δ. ( ) E(ĥ) Ê(ĥ) + O V C(H) m ln m V C(H) + 1 m ln 1 δ Recorrendo a esta inequação, explique porque é que aumentar o número de atributos (features) num problema de classificação com um classificador linear aumenta o risco de sobreajustamento (overfitting). Pergunta 8 [2 valores] Explique um método para visualizar conjuntos de dados com mais de 3 atributos. Assuma que todos os atributos são numéricos e de valores contínuos. Pergunta 9 [2 valores] Explique um método para reduzir o número de atributos de um conjunto de dados. Pergunta 10 [10 valores] Indique, justificando a resposta, o algoritmo de clustering e os parâmetros mais relevantes que utilizaria nos seguintes casos: 10.a) Tem um conjunto com 200 pontos que quer reduzir a 20 pontos representativos da distribuição do conjunto inicial. 10.b) Tem um conjunto com 200 pontos e razões para crer que cada um dos pontos foi gerado por um de três processos aleatórios diferentes, cada um com a sua distribuição de probabilidades com pontos médios e variâncias diferentes. 10.c) Tem um conjunto com 200 pontos, quer atribuir todos os pontos a algum cluster, mas não faz ideia de quantos clusters deverá criar. 10.d) Tem um conjunto com 200 pontos que quer agrupar, não sabe quantos clusters devem ser gerados, mas não quer que os pontos isolados sejam atribuídos a algum cluster. 10.e) Tem um conjunto com 200 pontos que quer agrupar em 12 clusters, mas quer perceber também as relações entre esses clusters para saber quais se agrupam em grupos maiores, numa árvore com todos os 12 clusters. Pergunta 11 [3 valores] Considere o problema de treinar redes neuronais artificiais profundas (com várias camadas escondidas). 11.a) Explique a razão de ser mais difícil treinar redes neuronais artificiais profundas do que treinar redes com apenas uma camada oculta. 11.b) Explique uma forma de se ultrapassar essa dificuldade.

1) 2) 3) 4) 5)

6) Segunda Parte 7) 8) 9)

10 a) 10 b) 10 c) 10 d) 10 e) 11 a) 11 b)