Número: Nome:

Documentos relacionados
Número: Nome:

INSTITUTO SUPERIOR TÉCNICO Sistemas de Apoio à Decisão

Número: Nome:

Número: Nome:

Número: Nome:

INSTITUTO SUPERIOR TÉCNICO Sistemas de Apoio à Decisão

INSTITUTO SUPERIOR TÉCNICO Sistemas de Apoio à Decisão

Número: Nome:

INSTITUTO SUPERIOR TÉCNICO Sistemas de Apoio à Decisão

Redes de Funções de Base Radial Radial Basis Functions (RBFs)

Sistemas de Apoio à Decisão. Guia de Exercícios

Álgebra Linear. 8 a Lista: a) Use o processo de ortogonalização de Gram Schmidt para construir uma base ortonormada para W.

Agrupamento de dados. Critério 1: grupos são concentrações de dados k-means Critério 2: grupos são conjuntos de elementos próximos entre si espectral

Exame de Recurso de Base de Dados Universidade do Algarve 03/Fev/2005, (duração: 2 horas)

Bases de Dados. Exame de 2 a Época. Identifique todas as folhas. Responda a cada grupo nas páginas respectivas do grupo. Exame sem consulta.

2 o Teste de Aprendizagem Automática

TESTE FINAL DE ÁLGEBRA LINEAR 18 de Janeiro de 2017 Instituto Superior Técnico - Engenharia Aeroespacial

1º Exame de INTRODUÇÃO À PROGRAMAÇÃO Licenciatura em Engenharia Mecânica 30 de Junho de º Semestre

Exame de Aprendizagem Automática

a) In Microsoft SQl Server 2005 you make a new query, and execute it.

Separe em grupos de folhas diferentes as resoluções dos grupos I e II das resoluções dos grupos III e IV GRUPO I (50 PONTOS)

SQL. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Ambiente de Data Warehouse Para Imagens Médicas Baseado Em Similaridade

INSTITUTO SUPERIOR TÉCNICO LEFT LEBL LQ LEAM LEMAT Ano Lectivo: 2006/2007 Semestre: 2 o

de Bases de Dados Exame 1

SQL. Processamento Analítico de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri Prof. Dr. Ricardo Rodrigues Ciferri

Exame de Aprendizagem Automática

Probabilidades e Estatística TODOS OS CURSOS

Algoritmos de Aprendizado

INSTITUTO SUPERIOR TÉCNICO Mestrado Integrado em Engenharia Física Tecnológica Ano Lectivo: 2007/2008 Semestre: 1 o

Aula 11 SBD SQL Parte 3. Profa. Elaine Faria UFU

Modelagem Multidimensional

Setor de Tecnologia - TC Engenharia Ambiental Avaliação 1. Matemática Aplicada II

Reconhecimento de Padrões. Reconhecimento de Padrões

Época de Recurso Sem consulta

1º Teste Sem consulta

Sistemas de Gestão de Bases de Dados e-fólio C. Resolução e Critérios de Correção

2 o TESTE DE ÁLGEBRA LINEAR LEIC-Taguspark, LERC, LEGI, LEE 22 de Novembro de 2008 (9:00) Teste 201

Teste de Base de Dados. Enunciado

Exame de 1ª Época Introdução à Programação IGE e ETI 2003/02/25-1º semestre de 2002/2003 ISCTE

Bases de Dados. Exame de 1 a Época. Identifique todas as folhas. Responda a cada grupo nas páginas respectivas do grupo. Exame sem consulta.

ficha 1 matrizes e sistemas de equações lineares

Álgebra Linear 1 o Teste

Perg 1 3 Val C Perg 2 2 Val B Perg 3 2 Val D Perg 4 3 Val A

P4 de Álgebra Linear I

Aulas práticas de Álgebra Linear

Modelagem Multidimensional - Nível Lógico -

ficha 4 valores próprios e vectores próprios

exercícios de análise numérica II

Matemática- 2008/ Se possível, dê exemplos de: (no caso de não ser possível explique porquê)

2 o TESTE DE ÁLGEBRA LINEAR LEIC-Taguspark, LERC, LEGI, LEE 22 de Novembro de 2008 (9:00) Teste 201

1º Exame de Base de Dados (2015/2016);

Uma breve introdução a probabilidade

Bases de Dados BDDAD. Linguagem SQL. Comando SELECT Divisão Algébrica. Nelson Freire (ISEP LEI-BDDAD 2015/16) 1/9

10 a Lista de Exercícios

Bancos de Dados IV. OLAP e Cubos de Dados. Rogério Costa

ÁLGEBRA LINEAR A FICHA 6. Por definição do determinante de uma matriz 3 3, tem-se det A = 7.

1. Seja G = (V, A) um grafo orientado em que o conjunto dos vértices é dado por V = {a, b, c, d, e} e a lista de arestas por

1 a LISTA DE EXERCÍCIOS Sistemas de Equações Lineares e Matrizes Álgebra Linear - 1 o Semestre /2018 Engenharia Aeroespacial

Reconhecimento de Caracteres Com Redes Neuronais. Trabalhos 1 e 2. APRENDIZAGEM COMPUTACIONAL 2007/2008 2º Semestre Francisco Moço

1º Teste Sem consulta

Setor de Tecnologia - TC Engenharia Ambiental Prova 1. Matemática Aplicada I

Prof. Daniela Barreiro Claro

Correção do 1º Exame de INTRODUÇÃO À PROGRAMAÇÃO Licenciatura em Engenharia Mecânica 30 de Junho de 2006, 2º Semestre

índice 2. Vetores e Tipos Primitivos PARTE 1- O Sistema R 1. Introdução ao Sistema R

Limpeza e transformação de dados

Redes Neurais Artificiais

Álgebra Linear I - Lista 12. Matrizes semelhantes. Diagonalização. Respostas

PROGRAMA ÁLGEBRA LINEAR, MEEC (AL-10) Aula teórica 32

Anderson Chaves Carniel Profa. Dra. Cristina Dutra de Aguiar Ciferri

Álgebra Linear e Aplicações - Lista para Primeira Prova

Exame de Base de Dados Época Normal - 15 de Janeiro de 2013

Bases de Dados 2013/2014. Sistemas de Apoio à Decisão: Armazéns de Dados e Prospecção de Dados. Helena Galhardas. Sumário

UNIVERSIDADE DO ALGARVE ESCOLA SUPERIOR DE TECNOLOGIA LICENCIATURA EM ENGENHARIA CIVIL/TOPOGRÁFICA ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA

Probabilidades e Estatística LEAN, LEGM, LEIC-A, LEIC-T, MA, MEMec

RESOLUÇÃO. Computação e Programação (2009/2010-1º Semestre) 1º Teste (11/11/2009) Nome. Número. Leia com atenção os pontos que se seguem:

INSTITUTO SUPERIOR TÉCNICO Mestrado em Engenharia Electrotécnica e de Computadores Ano Lectivo: 2007/2008 Semestre: 2 o

1 o Teste de Aprendizagem Automática

Época de Recurso Sem consulta

BASES DE DADOS I LTSI/2. Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2010/2011

Caderno de Exercícios de Sistemas de Apoio à Decisão. Cláudia Antunes Helena Galhardas Arlindo L. Oliveira

LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100%

Há vários algoritmos para processar junções nested-loop join block nested-loop join indexed nested-loop join merge-join hash-join

ficha 2 determinantes

Regra de Hebb Perceptron Delta Rule (Least Mean Square) Multi-Layer Perceptrons (Back Propagation) Hopfield Competitive Learning Radial Basis Function

Mapas Auto-Organizáveis de Kohonen (SOM) SOM é uma rede neural artificial (Kohonen (1995))

AGA Análise de Dados em Astronomia I 7. Modelagem dos Dados com Máxima Verossimilhança: Modelos Lineares

PROVA ESCRITA DE CONHECIMENTOS PARTE ESPECIFICA (REF G9)

scikit-learn: Aprendizado de máquina 101 com Python

Exercícios de matemática - revisão

Lista de exercícios 5 Determinantes

Algoritmos de Aprendizado. Formas de Aprendizado. Aprendizado Batch x Incremental. Aprendizado Batch x Incremental

Sistemas de Gestão de Bases de Dados e-fólio C. Resolução e Critérios de Correção

Aulas práticas de Álgebra Linear

1. Considere a seguinte matriz dos vértices dum triângulo D = 0 2 3

MAT ÁLGEBRA LINEAR PARA ENGENHARIA II 1 a Lista de Exercícios - 2 o semestre de 2006

Weka. Universidade de Waikato - Nova Zelândia. Coleção de algoritmos de aprendizado de máquina para resolução de problemas de Data Mining

EXERCÍCIOS DE ELEMENTOS DE MATEMÁTICA II (BQ, CTA, EFQ, Q) 2002/2003. Funções reais de várias variáveis

FACULDADE DE CIÊNCIAS ECONÓMICAS E EMPRESARIAIS. Matemática I 1 a Frequência: 27 de Outubro de 2009

Transcrição:

Número: Nome: -------------------------------------------------------------------------------------------------------------- INSTITUTO SUPERIOR TÉCNICO Sistemas de Apoio à Decisão Exame: 2 6 Julho 2009 --------------------------------------------------------------------------------------------------------------. (6 pts) Algumas perguntas fáceis para começar ) (2 pts) Indique quais das hipóteses estão correctas para cada uma das seguintes questões (podem existir mais do que uma correcta e todas devem ser assinaladas nesse caso): a. (0,5 pts) Num esquema de dados multidimensional, os elementos essenciais são:. só as tabelas de factos. 2. tabelas de factos e surrogate keys. 3. tabelas de factos e de dimensões. 4. só as hierarquias. Solução: 3 b. (0,5 pts) As interrogações de dados OLAP típicas envolvem:. a soma e média como funções de agregação. 2. os valores mínimo e máximo como funções de junção. 3. a soma e média como funções de junção. 4. os valores mínimo e máximo como funções de agregação. Solução: e 4 c. (0,5 pts) O operador CUBE:. retorna uma vista dos dados segundo três dimensões. 2. retorna todos os agrupamentos possíveis das dimensões. 3. permite descer numa hierarquia. 4. permite subir e descer numa hierarquia. Solução: 2 c. (0,5 pts) Um processo ETL suporta:. a extracção de dados da DW e carregamento na área de retenção.

Número: Nome: 2 2. a extracção de dados dos sistemas operacionais e carregamento na DW. 3. a extracção de dados da área de retenção e carregamento nos sistemas operacionais. 4. a extracção de dados da DW e carregamento nos sistemas fonte. Solução: 2 2) (4 pts) Assinale as seguintes frases como verdadeiras (V) ou falsas (F). Cada resposta correcta corresponde a uma cotação de + valor. Resposta errada -0,5. Se não responder, a cotação é 0. (a) Os algoritmos Fp-growth e Apriori conduzem a regras de associação diferentes False, the rules are the same (b) Se x e y são independentes então P(y x)=p(x y) False, P(y x)=p(y), P(x y)=p(x). (c) Dada uma entrada de dimensão 4, uma rede neuronal com uma função de activação linear é mais potente que uma rede RBF. False, uma rede neuronal com uma função de activação linear can only separate linear problems. (d) Dada uma entrada de dimensão 4, uma rede neuronal com uma função de activação linear é mais potente que que vector support machines False, uma rede neuronal com uma função de activação linear can only separate linear problems.

Número: Nome: 3 2. (3 pts) DW, OLAP e ETL Considere o seguinte modelo em estrela de uma DW: Aluno(alunoId, nome) Data(dataID, dia, mes, semestre, ano) Disciplina(disciplinaId, nome, departamento) Assiduidade(alunoId, dataid, disciplinaid, presenca), em que as chaves primárias estão sublinhadas e as estrangeiras estão em itálico. (a) (v) Escreva uma interrogação SQL que devolva o número total de faltas por aluno (identificado pelo seu número e nome) e por semestre (dentro do ano lectivo). Solução: Select A.alunoId, A.nome, d.ano, d.semestre, count(*) From Aluno a, Data d, Assiduidade as Where a.alunoid = as.alunoid And d.dataid = as.dataid Where presença = 0 Group by a.alunoid, a.nome, d.ano, d.semestre (b) (v) Suponha que o valor pedido na alínea anterior é muito requisitado, o que levaria à interrogação da alínea (a) ser frequentemente executada. Proponha uma alteração ao modelo de dados de modo a ter essa informação pré-calculada. Criaria uma nova tabela de factos com informação agregada sobre o número de faltas. Ficaria com: FaltasPorAlunoPorSemestre(alunoId, semestreid, faltas) Aluno(alunoId, nome) Semestre(semestreId, semestre, ano)

Número: Nome: 4 (c) ( v) Indique quais as hierarquias existentes neste modelo. Qual o número de tuplos retornado pelo operador CUBE? Hierarquias: 2 Data: dia<mes<semestre<ano Disciplina: nome < departamento Número de tuplos = número de cuboids = π i= n (Li + ) = (+).(4+).(2+) = 2*5*3 = 30 3. (4 pts) 3. (4 pts) PCA

Número: Nome: 5 Suponha que tem a seguinte: x i = 9, 5 9, 0 8, 0 8 (a) (2 pts) Qual é a matriz da transformação K-L? First we have to determine the covariance matrix (See homework 3) c ij = n k= (k ( x ) i m i ) x (k) j m j n ( ) We divide n- for sapmle, n for population (be agreement we divide by n-, i tis as well o.k. to divide by n) C = c c 2 c 2 c 22 First we have to compute the eiganvalues The system has to become linear depentable (singular) λi C = 0 The determinant has to become zero we know c 2 =c 2, m = (+5+0+0)./4=4, m 2 = (9+9+8+8)./4=8.5 c =( (-4)^2+(5-4)^2+(0-4)^2+(0-4)^2 )./3=20.67 c 2 =c 2 = ( (-4)*(9-8.5)+(5-4)*(9-8.5)+(0-4)*(8-8.5)+(0-4)*(8-8.5) )./3=-0.67 c 22 = ( (9-8.5)^2+(9-8.5)^2+(8-8.5)^2+(8-8.5)^2 )./3=0.33 20.67 0.67 C = 0.67 0.33

Número: Nome: 6 0 = λ 0 20.67 0.67 0 λ 0.67 0.33 λ 20.67 0.67 0 = 0.67 λ 0.33 λ 2 2λ + 6.37 = 0 λ =0.3 λ 2 =20.69 For λ =0.3, let be u = then we have to determine u 2 20.36 0.67 0.67 0.02 u = 0 2 20.36 = 0.67 u 0.67 0.02 2 (Approximate results due to rounding errors, rounding errors were not punished) u =[u,u 2 ]=[,30.5238] (exact result) Normalization u =[u,u 2 ]=[ 0.0327342, 0.999464] For λ 2 =20.69, let be u = then we have to determine u 2 0.02 0.67 0.67 20.35 u = 0 2 0.028345 0.67 = u 0.67-20.028 2 (exact..) u =[u,u 2 ]=[, 0.032757] (exact result) Normalization

Número: Nome: 7 u =[u,u 2 ]=[ 0.999446, 0.032757] K-L transformation is defined be the matrix 0.0327 0.99 0.999 0.0327 (b) (2 pts) Qual dos vectores próprios (eigenvectors) é mais significante? O critério de Kaiser é aplicável? λ =0.3 <, means this dimension can be reduced u

Número: Nome: 8 4. (2 pts) Bayes 90% das mulheres que realmente sofrem de cancro da mama irão ter um resultado positivo na mamografia (quer isto dizer que o teste indica que a mulher sofre de cancro). % das mulheres que na realidade não sofrem de cancro da mama irão ter um resultado positivo na mamografia (querendo dizer que elas foram erradamente diagnosticadas com o cancro). 5% das mulheres com mais de 55 anos que são examinadas sofrem de cancro da mama. (2 pts) No caso de uma mulher que tem um teste positivo na mamografia, repetir o teste numa segunda mamografia, que também dá um resultado positivo, use o pressuposto Naïve de Bayes para calcular a probabilidade que a mulher sofre de cancro da mama dados os resultados dos 2 testes. P(c)=0.05, P( c)=0.95, P(m c) = 0.90, P( m c) = 0. P(m c) = 0., P( m c) = 0.89. P(c m)=αp(m c) P(m2 c)p(c)=α 0.0405 P( c m)=αp(m c)p(m2 c)p( c)=α0.0495 Normalization: P(c m)= 0.77892

Número: Nome: 9 5. (2 pts) Dado o conjunto de dados x j = 0 9, 9, 2 9, 7 5 5 com 4 pontos, k=2 e os centroids iniciais c = 2 8,c 2 = 7 5 4. Quais são os valores dos centroids c,c 2 depois do algoritmo de clustering k-mean ter convergido, usando a função de distância Euclideana? d(c,x ) < d(c 2,x ) d(c,x 2 ) < d(c 2,x 2 ) d(c,x 3 ) < d(c 2,x 3 ) d(c,x 4 ) > d(c 2,x 4 ) c = 9 3,c 2 = 7 5 5. d(c,x ) < d(c 2,x ) d(c,x 2 ) < d(c 2,x 2 ) d(c,x 3 ) < d(c 2,x 3 ) d(c,x 4 ) > d(c 2,x 4 ) Converged.

Número: Nome: 0 6. (3 pts) Neuronal Network (a) (2 pts) Derive uma regra de treino de gradiente descendente (gradient descent training rule) para uma única unidade com saída o, em que: n o = 5 w i σ(x i ) i= 0 o= 5*w 0 σ(x 0 )+5*w σ (x )+ 5*w 3 σ (x 3 )+ +5*w n σ (x n ) σ(x) = + e ( 3x) E = (t d o d ) (t d 5w i σ(x i )) w i d D w i E = (t d o d )( 5σ(x i )) w d D (b) ( pts) Dados n=2, os pesos w={w 0 =0.,w =0. }. Faça um gradiente descendente estocástico com η= para para o vector de entrada x={2,0}={x 0 =2,x =0} e alvo (target) t={}, determine Δw o= 5*w 0 σ(x 0 )+5*w σ (x ) o= 5*0.*(./(+exp(-3*2)))+ 5*0.*(./(+exp(-3*0))=0.74876 Δw i = η(t o)5σ(x i ) Δw = (-0.72629)*5*(./(+exp(-3*2))=.3652 Δw 2 = (-0.72629)*5*(./(+exp(0)))=0.68427