Exame de Aprendizagem Automática

Documentos relacionados
Exame de Aprendizagem Automática

1 o Teste de Aprendizagem Automática

1 o Teste de Aprendizagem Automática

Rede RBF (Radial Basis Function)

Teoria do aprendizado

SUPPORT VECTOR MACHINE - SVM

2. Redes Neurais Artificiais

Classificadores Lineares

Thiago Zavaschi Orientador: Alessandro Koerich Programa de Pós-Graduação em Informática (PPGIa) Pontifícia Universidade

Inteligência Artificial

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Aprendizado de Máquina (Machine Learning)

Curso de Data Mining

scikit-learn: Aprendizado de máquina 101 com Python

Aprendizado Bayesiano

Aprendizagem de Máquina

Aprendizado de Máquinas. Classificadores Lineares

Escola Secundária com 3º ciclo D. Dinis 12º Ano de Matemática A Tema II Introdução ao Cálculo Diferencial II. TPC nº 9 (entregar em )

Uma Introdução a SVM Support Vector Machines. Obs: Baseada nos slides de Martin Law

Mineração de Dados em Biologia Molecular

Reconhecimento de Padrões. Reconhecimento de Padrões

Redes Neurais Artificiais

ESCOLA SECUNDÁRIA COM 3º CICLO D. DINIS COIMBRA 12º ANO DE ESCOLARIDADE MATEMÁTICA A FICHA DE AVALIAÇÃO 12º B1 Grupo I

2. Redes Neurais Artificiais

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

Máquinas de suporte vetorial e sua aplicação na detecção de spam

INF 1771 Inteligência Artificial

( x) = +. Qual dos seguintes. x = (B) o contradomínio é ],2] f é uma função par

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais

INF 1771 Inteligência Artificial

3 Técnicas de agrupamento

Aprendizado de Máquina (Machine Learning)

Classificação Linear. André Tavares da Silva.

Adriana da Costa F. Chaves. Máquina de Vetor Suporte (SVM) para Classificação Binária 2

Laboratório Como usar algoritmos de aprendizado de máquina de regressão em Weka

θ depende de um parâmetro desconhecido θ.

Tema 0: Módulo Inicial Nº de Aulas Previstas (90 m): 18

Aprendizado de Máquina. Combinando Classificadores

WEKA: Prática Carregando a base de dados no Weka

Regressão Linear. Fabrício Olivetti de França. Universidade Federal do ABC

SEMINÁRIO DOS ARTIGOS:

Método dos gradientes (ou método de máxima descida)

ANÁLISE DE ALGORITMOS (INF 1721)

Descoberta de Conhecimento em Bancos de Dados - KDD

Sistemas de Apoio à Decisão. Guia de Exercícios

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

PROVAS Ciência da Computação. 2 a Prova: 13/02/2014 (Quinta) Reavaliação: 20/02/2014 (Quinta)

Métodos para Classificação: - Naïve Bayes.

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Exercícios de exames e provas oficiais

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

UNIVERSIDADE FEDERAL DO ABC. 1 Existência e unicidade de zeros; Métodos da bissecção e falsa posição

Mineração de Dados - II

Instituto Politécnico de Tomar Escola Superior de Tecnologia de Tomar Área Interdepartamental de Matemática

Ajuste de Curvas. Diogo Pinheiro Fernandes Pedrosa. Universidade Federal do Rio Grande do Norte Centro de Tecnologia.

PROCESSO SELETIVO N 42/2019 PROVA 2 - CONHECIMENTOS ESPECÍFICOS

Laboratório Classificação com o WEKA Explorer

Técnicas computacionais em probabilidade e estatística II

Matemática A - 10 o Ano Ficha de Trabalho

Redes Neurais (Inteligência Artificial)

Classificação: 1R e Naïve Bayes. Eduardo Raul Hruschka

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Comparação de métodos de fingerprints para o rastreio virtual de inibidores da 5α-redutase

Transcrição:

Exame de Aprendizagem Automática 2 páginas com 11 perguntas e 3 folhas de resposta. Duração: 2 horas e 30 minutos DI, FCT/UNL, 5 de Janeiro de 2016 Nota: O exame está cotado para 40 valores. Os 20 valores das perguntas de 1 a 6 correspondem ao primeiro teste; os restantes ao segundo teste. A nota da componente teórico-prática será a média destas duas partes, usando para cada uma a melhor nota entre o exame e o teste correspondente. Pergunta 1 [4 valores] Suponha que quer seleccionar o melhor grau do polinómio a usar num problema de regressão. Usa um terço dos dado disponíveis para treinar os vários polinómios, um terço para validação, de forma a seleccionar o grau do polinómio com menor erro de validação, e um terço para teste do polinómio escolhido no final. Explique porque é que necessita deste conjunto final de teste, se já tinha calculado o erro de validação para cada polinómio. Pergunta 2 [3 valores] Numa regressão polinomial, a linha é colocada de forma a minimizar o erro quadrático entre os valores conhecidos e os valores previstos. Na regressão logística, que apesar do nome é um classificador, onde é que se quer colocar o hiperplano que separa as duas classes? Pergunta 3 [3 valores] A figura à direita mostra as curvas ROC (Receiver Operating Characteristic) para dois classificadores. Ambos foram treinados com o mesmo conjunto de treino, e ambas as curvas foram calculadas com o mesmo conjunto de teste. O eixo vertical mostra a fracção de verdadeiros positivos, o horizontal a fracção de falsos positivos. Indique, justificando, qual dos dois classificadores (A ou B) é o melhor. Pergunta 4 [2 valores] Descreva como se treina um classificador K-Nearest Neighbours. Pergunta 5 [4 valores] A figura à direita mostra esta Support Vector Machine: ( ) 1 N N N min α α n α m y n y m x T m x n α n 2 n=1 m=1 n=1 Foram impostas as seguintes restrições durante a minimização: 0 α n 10, n = 1,..., N N α n y n = 0 n=1 Indique, justificando, qual o valor ou valores possíveis de α para cada um dos pontos A, B e C indicados na figura. Se quiser indicar um intervalo, pode usar a notação [a, b] para um intervalo de valores entre a e b incluindo a e b, ]a, b[ para um intervalo de valores entre a e b excluindo a e b, ou ]a, b], [a, b[ para excluir apenas um dos extremos. Pergunta 6 [4 valores] O classificador Naïve Bayes Classifier assume que todos os atributos são condicionalmente independentes dada a classe. Por outro lado, o classificador de Bayes completo (Bayes Classifier) não assume que os atributos sejam independentes. Sabendo que muitas vezes os atributos não são independentes, mesmo dada a classe, porque é que quase sempre se prefere usar o classificador Naïve Bayes?

2 Segunda Parte Pergunta 7 [3 valores] A inequação abaixo estima o limite superior para o erro verdadeiro E da hipótese ĥ que minimiza o erro de treino Ê. Este limite é função de δ, do tamanho do conjunto de treino m e da dimensão Vapnik-Chervonenkis da classe de hipóteses, V C(H), e limita o erro verdadeiro com probabilidade 1 δ. ( ) E(ĥ) Ê(ĥ) + O V C(H) m ln m V C(H) + 1 m ln 1 δ Recorrendo a esta inequação, explique porque é que aumentar o número de atributos (features) num problema de classificação com um classificador linear aumenta o risco de sobreajustamento (overfitting). Pergunta 8 [2 valores] Explique um método para visualizar conjuntos de dados com mais de 3 atributos. Assuma que todos os atributos são numéricos e de valores contínuos. Pergunta 9 [2 valores] Explique um método para reduzir o número de atributos de um conjunto de dados. Pergunta 10 [10 valores] Indique, justificando a resposta, o algoritmo de clustering e os parâmetros mais relevantes que utilizaria nos seguintes casos: 10.a) Tem um conjunto com 200 pontos que quer reduzir a 20 pontos representativos da distribuição do conjunto inicial. 10.b) Tem um conjunto com 200 pontos e razões para crer que cada um dos pontos foi gerado por um de três processos aleatórios diferentes, cada um com a sua distribuição de probabilidades com pontos médios e variâncias diferentes. 10.c) Tem um conjunto com 200 pontos, quer atribuir todos os pontos a algum cluster, mas não faz ideia de quantos clusters deverá criar. 10.d) Tem um conjunto com 200 pontos que quer agrupar, não sabe quantos clusters devem ser gerados, mas não quer que os pontos isolados sejam atribuídos a algum cluster. 10.e) Tem um conjunto com 200 pontos que quer agrupar em 12 clusters, mas quer perceber também as relações entre esses clusters para saber quais se agrupam em grupos maiores, numa árvore com todos os 12 clusters. Pergunta 11 [3 valores] Considere o problema de treinar redes neuronais artificiais profundas (com várias camadas escondidas). 11.a) Explique a razão de ser mais difícil treinar redes neuronais artificiais profundas do que treinar redes com apenas uma camada oculta. 11.b) Explique uma forma de se ultrapassar essa dificuldade.

1) 2) 3) 4) 5)

6) Segunda Parte 7) 8) 9)

10 a) 10 b) 10 c) 10 d) 10 e) 11 a) 11 b)