de Métodos Estatísticos em Data Mining

Tamanho: px
Começar a partir da página:

Download "de Métodos Estatísticos em Data Mining"

Transcrição

1 Departamento de Matemática Unidade de Ensino de Probabilidades e Estatística Exercícios de Métodos Estatísticos em Data Mining Mestrado em Matemática e Aplicações Edição de Setembro de 2011

2 Classificação 1. Considere o seguinte conjunto de dados: Estes dados podem ser organizados nas seguintes tabelas: Comprou computador Idade Sim Não Jovem 2 3 Meia-Idade 4 0 Terceira-Idade 3 2 Comprou computador Avaliação-Crédito Sim Não Normal 6 2 Excelente 3 3 Comprou computador Rendimento Sim Não Baixo 3 1 Médio 4 2 Alto 2 2 Comprou computador Estudante Sim Não Sim 6 1 Não 3 4 (a) Pretende-se classificar um cliente, como comprador ou não de um computador, que possui as seguintes características: (Idade=jovem,Rendimento=médio,Estudante=sim,Avaliação-crédito=normal). (b) Repita o exercício anterior mas supondo que se tem: 7 consumidores com baixo rendimento, 0 com rendimento médio e 2 com rendimento alto. 2. Considere o conjunto de dados iris, disponíveis em 1

3 Id Avaliação-Crédito Idade Comprador-computador Rendimento Estudante 1 excelente 38 sim médio não 2 excelente 26 sim médio sim 3 normal 35 não médio não 4 excelente 49 não alto não Tabela 1: Dados relativos a alguns consumidores. (a) Usando a biblioteca do R klar e a função NaiveBayes aplique a regra näive Bayes a este conjunto de dados considerando: i. Que há equiprobabilidade de uma flor pertencer a cada uma das variedades. ii. Que a probabilidade de uma flor ser da variedade Setosa é duas vezes superior a ser de outra variedade. iii. Usando o comando plot.naivebayes compare as estimativas das probabilidades marginais das variáveis explicativas/preditoras dada a variedade (classe), para as opções anteriores. 3. KNN (k-vizinho mais próximo) simplesmente conta os k pontos mais próximos de cada uma das classes e decide por maioria de votos. É um algoritmo simples e eficiente onde é apenas necessário calcular a distância de um novo objecto aos vizinhos mais próximos. (a) Com o auxílio da função do R knn() da biblioteca class aplique o método 1- vizinho mais próximo à última coluna do seguinte conjunto de dados de treino de um sonar: camado/datam/sonar treino.csv. Use os valores por defeito desta função. Calcule ainda o erro de má classificação. (b) Repita o procedimento anterior para os dados de teste: ( camado/datam/sonar teste.csv). (c) Repetir as alíneas anteriores mas usando agora a biblioteca do R knnflex. (d) Usando a biblioteca do R knnflex efectue a classificação considerando outros valores de k. Construa um gráfico representando os erros de má classificação vs os valores de k e com base na sua visualização escolher um valor de k. 4. Com base nos dados da Tabela 2 e após a discretização da variável Altura, em 3 intervalos: (a) construa uma árvore de decisão com dois níveis usando como critério de partição o ganho de informação, baseado na entropia como medida de impureza. Recorde que a entropia associada a uma partição em m grupos dos objectos do nó t é dada por: m Entropia(t) = p(i t) log 2 p(i t), 2 i=1

4 ID Género Altura Tamanho Classe 101 F 1.48 m Medium C0 102 F 1.50 m Small C0 103 F 1.52 m Small C0 104 M 1.60 m Small C0 105 F 1.65 m Medium C0 106 F 1.68 m Large C1 107 M 1.72 m Medium C1 108 F 1.72 m Medium C1 109 M 1.75 m Large C1 110 M 1.80 m Large C1 Tabela 2: Medidas de vários clientes de uma loja de vestuário. onde p(i t) representa a probabilidade de um objecto do nó t pertencer ao grupo i. (b) Use a árvore obtida na alínea anterior para classificar o conjunto de dados em questão e determine a matriz de confusão. Comente os resultados obtidos. 5. Admita que X Y = 1 N (µ 1, σ 2 1) e X Y = 2 N (µ 2, σ 2 2), com σ 1 > σ 2 e µ 1 > µ 2. Calcule o conjunto de valores de x que devem ser atribuídos a {Y = 1}. Considere o caso em que σ 1 = 4 e σ 2 = Considere um subconjunto dos dados (coracao.txt) sobre o Factor de Risco Coronário obtidos num estudo de Rousseauw et al., O objectivo do estudo foi determinar a intensidade da isquemia, o qual é um factor de risco de doença cardíaca. Os dados representam observações em homens brancos entre 15 e os 64 anos, e a variável resposta é a presença ou ausência de enfarto do miocárdio (chd) no momento do inquérito. Os dados encontram-se em: camado/datam. Na Tabela 3 seguinte encontra-se um breve resumo das variáveis: Variáveis SBP tabaco LDL adiposidade famhist typea alcool idade chd Descrição Pressão arterial sistólica Tabaco acumulado (kg) lipoproteína de baixa densidade colesterol história familiar de doença cardíaca (1-presente; 0-ausente) Um tipo de comportamento obesidade consumo actual de álcool doença cardíaca coronária (1- presente;0- ausente) Tabela 3: Variáveis associadas aos dados coracao.txt. 3

5 (a) Construa a matriz de gráficos de dispersão para cada variável com os histogramas na diagonal. Comente. (b) Verifique se é significativo o impacto do tabagismo na presença ou não de doença coronária. Use a função glm do R para fazer uma regressão logística tendo como chd a variável resposta e apenas tabaco como variável explicativa. (c) Considere agora um modelo onde se adiciona outra variável explicativa, a saber famhist. i. Estime os parâmetros do modelo (este modelo por conter mais de uma variável explicativa é denominado modelo de regressão logística múltipla). ii. Tem-se agora dois modelos, um com uma variável explicativa e um com duas, que tentam explicar a mesma coisa (presença ou ausência de doença coronária). A questão a colocar será: o modelo com as variáveis tabaco e famhist é melhor do que o modelo com apenas a variável tabaco? Será que não se ganha nada, adicionando a variável famhist? Usando o critério de informação de Akaike (AIC) compare os dois modelos. (d) Com a ajuda da função stepaic da biblioteca do R MASS encontre o melhor modelo para a variável chd. (e) Considerando o modelo encontrado na alínea anterior escreva uma regra de classificação discriminante logística para este problema, quando as probabilidades à priori são estimadas pelas frequências relativas na amostra original. Construa uma matriz de confusão usando a amostra de treino. Qual é a taxa de erro de má classificação? (f) Utilize agora o software WEKA para analisar este problema. 7. Suponha que uma variável aleatória X unidimensional tem distribuição Normal com variância igual a 4. Admita que E [X Y = 1] = 10, E [X Y = 2] = 14 e que são iguais as probabilidades a priori para os acontecimentos e que c(2 1) = c(1 2). Neste contexto, Seja A 1 = {Y = 1}, A 2 = {Y = 2}, X é atribuído a {Y=1} se X c, X é atribuído a {Y=2} se X > c. B 1 = {X é atribuído a Y = 1} B 2 = {X é atribuído a Y = 2}. Construa uma tabela para mostrar os seguintes resultados: P [B 1 A 2 ], P [B 2 A 1 ], P [A 1 e B 2 ], P [A 2 e B 1 ], P [ má classificação ] e custo esperado, para c = 10,..., 14. Para que valor de c é que o custo esperado é mínimo? Qual é o custo esperado mínimo? 4

6 8. Um investigador pretende determinar um procedimento para discriminar entre duas categorias {Y = 1} e {Y = 2}, caracterizadas à custa do vector aleatório X, de dimensão p. O investigador consegue estimar as funções densidade de probabilidade f 1 (x) e f 2 (x), onde f i (x) representa a função densidade de probabilidade do vector aleatório X Y = i, i = 1, 2. Seja c(2 1) = 50 (custo de atribuir entidades a {Y = 2} dado que pertencem a {Y = 1}) e c(1 2) = 100. Admita ainda que a probabilidade do indivíduo pertencer à categoria {Y = 2} é (a priori) (a) Deduza a regra de classificação que minimiza o custo esperado de má classificação, ECM, para atribuir uma entidade a uma de duas categorias. (b) Se as observações de um novo indivíduo, x 0, forem tais que f 1 (x 0 ) = 0.3 e f 2 (x 0 ) = 0.5, faça a atribuição do indivíduo a uma das duas categorias. 9. Admita que X Y = i N p (µ i, Σ), i = 1, 2, onde Σ é definida positiva. (a) Mostre que a regra que minimiza a probabilidade total de má classificação é: atribuir x a {Y = 1} se α t { x 1 2 (µ 1 + µ 2 ) } > 0 com α = Σ 1 (µ 1 µ 2 ). (b) Sabendo que d(x) Y = i N( ( 1)i 1 2, 2 ), i = 1, 2, obtenha a probabilidade 2 total de má classificação (TPM ), onde d(x) = α { t X 1 (µ µ 2 ) }. (c) Construa a regra Naive de Bayes, admitindo que X j Y = i N(µ i, σ 2 i ), j = 1,..., p. Enuncie as hipóteses que admitiu como válidas para construir esta regra. (d) Calcule a probabilidade total de má classificação associada à regra deduzida em (9c). Compare com o resultado obtido em (9b). Comente os resultados obtidos. 10. Admita que se define uma regra de classificação que permite classificar um novo objecto numa de duas categorias distintas. Mostre que a precisão da regra de classificação é função da sensibilidade e especificidade. 11. Admita que dispõem de duas regras de classificação: M1 e M2. Para validar cada um das regras, construiu-se o seguinte procedimento: (i) dividiu-se a amostra em dez subconjuntos disjuntos; (ii) estimou-se os parâmetros associados a cada uma das regras com nove destes dez subconjuntos e classificam-se as observações do subconjunto que não foi usado para estimar. No final, estima-se a taxa de erro associada a cada uma das regras. Admita que se repetiu este procedimento 10 vezes, registando-se as seguintes taxas de erros (em percentagem): M1: M2:

7 Teste ao nível de significância de 1% se um método é melhor do que o outro. Enuncie as hipóteses que admitiu como verdadeiras para responder a esta questão e critique o seu próprio procedimento. 6

8 Análise de agrupamentos 1. Construa um exemplo de uma dissemelhança que não seja uma métrica. 2. Mostre que o quadrado da distância Euclidiana não é uma métrica. Dê um contra exemplo. 3. Construa uma semelhança a partir do coeficiente de correlação. 4. Se s ij é uma semelhança, tal que 0 < s ij 1, mostre que d ij = 1 s ij e d ij = log s ij são dissemelhanças. 5. Considere dois objectos nos quais foram medidas p características. Mostre que a distância Euclidiana entre os dois objectos se pode obter a partir da distância de cada um deles ao seu centróide. Escreva a relação entre os quadrados dessas três distâncias. 6. (Branco, J.A., 2004). Duas variáveis binárias X 1 e X 2, foram observadas em n indivíduos, tendo-se registado o número de concordâncias e discordâncias obtidas: X 1 \X a b 0 c d onde a + b + c + d = n.um coeficiente de semelhança habitualmente sugerido neste caso é o coeficiente de correlação entre X 1 e X 2, r X1 X 2. Mostre que: r X1 X 2 = ad bc [(a + b)(c + d)(a + c)(b + d)] 1/2. 7. (Branco, J.A., 2004). Considere as seguintes espécies animais: e considere os seguintes atributos: come outros animais, come vegetais, Tigre, Cão, Golfinho, Baleia, Lebre, Homem, 1

9 desloca-se sobre quatro patas, é animal doméstico, é animal selvagem. Construa as matrizes de semelhanças com base no coeficiente de Jaccard e no coeficiente de concordância simples. 8. Mostre que a distância d k(ij) (entre clusters) usada pelos métodos da ligação simples, ligação completa e ligação média satisfaz a relação: onde d k(ij) = α i d ki + α j d kj + γ d ki d kj Ligação simples α i = α j = 1, γ = Ligação completa α i = α j = γ = 1 2 Ligação média α i = n i n i +n j, α j = 1 α i, γ = 0 9. A riqueza de vocabulário de um texto pode ser descrito, quantitativamente, contando o número de palavras usadas uma única vez, duas vezes e assim sucessivamente. Baseado neste critério um linguista propôs as seguintes distâncias entre diversos capítulos do Antigo Testamento: Capítulos Faça a análise de clusters usando os vários métodos hierárquicos que estudou. Desenhe os respectivos dendrogramas e compare os resultados. 10. A matriz A = resultou da medição de seis objectos relativamente a duas das suas características. (a) Obtenha e compare os dendrogramas da análise da matriz A, servindo-se da distância Euclidiana, para os métodos da ligação simples, ligação completa, ligação média, Ward, mediana e centróide. (b) Represente as duas variáveis graficamente e observe as posições relativas dos pontos representando os seis objectos para tentar explicar os resultados dos diferentes métodos. 2

10 (c) Opte por um número de clusters que lhe pareça adequado. Para cada um dos métodos de formação de clusters construa o gráfico de bandeira (baseado no average silhouette). Comente os resultados obtidos. 11. Suponha que se pretende agrupar os seguintes oito objectos: em 3 clusters. Escolha como centroíde da partição inicial os três primeiros objectos. Use o método das k-médias e obtenha: (a) Os centroídes dos clusters depois da primeira iteração do algoritmo. (b) A partição final em 3 clusters. 12. Considere um subconjunto dos dados (Europa.txt) sobre Factos e Números Essenciais sobre a Europa e os Europeus publicado pela Comissão Europeia (2007). Os dados encontram-se em: camado/datam. Na Tabela 4 encontra-se um breve resumo das variáveis: Variáveis Descrição País Sigla do país PIB em PPC Produto Interno Bruto em Padrão de Poder de Compra Internet Percentagem de agregados familiares com acesso à Internet(2006) Desemprego Taxa de desemprego (2006) Energia renováveis Percentagem de electricidade produzida a partir de fontes de energia renováveis na UE 27 (2005) Populaç~ao População em milhões Tabela 4: Variáveis associadas aos dados Europa.txt. (a) Usando o software R (por exemplo, usando a função hclust) proceda a uma análise de clusters usando o método Ward e um outro procedimento aglomerativo hierárquico à sua escolha. Compare os resultados. (b) Proceda a uma análise semelhante à anterior mas usando o método das k- médias. Construa uma pequena função no R de forma a tentar encontar o melhor valor para k. (c) Utilize vários métodos de clustering presentes no WEKA para analisar este problema. Compare esses resultados com os que obteve nas alíneas anteriores. 3

11 13. Admita que suspeita que a população em estudo pode ser bem modelada por uma mistura de duas sub-populações com distribuição Poisson, i.e. X Y = j P oisson(λ j ), j = 1, 2. (a) Defina o que são os dados completos e os incompletos associados a este problema. (b) Use o algoritmo EM, para propor estimadores para os parâmetros da distribuição que caracteriza X. Defina o passo E e M do algoritmo. 4

12 Redução da dimensionalidade 1. Dados sobre acções, x 1 e receitas, x 2, sobre 10 grandes empresas industriais dos E.U.A. conduziram aos seguintes resultados amostrais x = [ ], S = [ (a) Determine as componentes principais amostrais e as suas variâncias. (b) Calcule a proporção de variância explicada pela primeira componente principal amostral. (c) Calcule o coeficiente de correlação, rŷ1,x k, k = 1, 2. Que interpretação, se alguma, pode atribuir à primeira componente principal? 2. A matriz de covariâncias de duas variáveis aleatórias, X 1 e X 2, é: C 1 = [ que tem os seguintes valores próprios: λ 1 = e λ 2 = e vectores próprios normalizados: γ 1 = (0.015, 0.999) t, γ 2 = (0.999, 0.015) t. (a) Escreva a expressão das componentes principais. (b) Considere as variáveis estandardizadas e obtenha as componentes principais correspondentes. (c) Compare os dois conjuntos de componentes principais analisando a contribuição de cada variável para a variação de cada componente principal. (d) Comente os efeitos de estandardização e, em face de uma situação prática, diga qual o tipo de variáveis em análise em que deve basear a análise em componentes principais. 3. Sejam X 1 e X 2 duas variáveis aleatórias tais que X 1 Bernoulli(p) e X 2 = 1 X 1. Determine as componentes principais do sistema e indique qual a percentagem de variação explicada por cada uma delas. Comente os resultados obtidos. ] ]. 1

13 4. Considere o vector X = (X 1, X 2 ) t com matriz de correlação C = [ 1 ρ ρ 1 (a) Obtenha as componentes principais a partir da matriz C. (b) Considere agora um outro vector X 1 = (X 1, X 2, X 3 ) t (acrescentou-se a X a componente X 3 ), com a matriz de correlação: C 1 = ] 1 ρ 0 ρ Obtenha, também, as componentes principais. (c) Compare e comente os resultados obtidos em (a) e (b). O que pode concluir? 5. Considere as variáveis aleatórias X 1, X 2 e X 3 com matriz de covariância: 1 1/2 1/2 1/2 1/2 1/2 1/2 1/2 1 (a) Obtenha as componentes principais do sistema. (b) Considere agora o novo sistema 2X 1, X 2 e X 3 em que a primeira variável mudou de escala. Mostre que as componentes principais não são invariantes com a mudança de escala (obtendo as novas componentes principais). (c) Suponha que todas as variáveis sofrem uma mudança de escala igual. O que se passa com as novas componentes principais? (d) Qual o interesse prático, no contexto da análise em componentes principais, da mudança de escala? 6. Considere o conjunto dos dados (car04.txt) sobre 388 modelos de carros de 2004 descritos com 18 variáveis. Os dados encontram-se em: camado/datam e as variáveis encontram-se resumidas na Tabela 5. (a) No R existem várias funções para efectuar PCA, foquemo-nos em duas delas, princomp e prcomp, que diferem na forma como efectuam o cálculo das componentes principais. i. Considere os dados sem qualquer transformação e com base na segunda função determine as componentes principais amostrais e as suas variâncias. ii. Acha a abordagem anterior apropriada para a determinação das componentes principais amostrais? Em caso negativo como procederia? iii. Considere agora os dados padronizados e repita a alínea 6(a)i. Comente os resultados obtidos. 2.

14 Variáveis Variável Sports SUV Wagon Minivan Pickup AWD RWD Retail Dealer Engine Cylinders Horsepower CityMPG HighwayMPG Weight Wheelbase Length Width Descrição Significado Indicador binário: se é (1) ou não (0) um carro desportivo Indicador binário: se é (1) ou não (0) um carro desportivo utilitário Indicador binário: se é (1) ou não (0) uma carrinha Indicador binário: se é (1) ou não (0) um monovolume Indicador binário: se é (1) ou não (0) um todo o terreno Indicador se possui tracção a todas as rodas Indicador se possui tracção traseira Preço de retalho sugerido (US$) Preço ao revendedor (US$) Cilindrada (litros/rotação) Número de cilindros do motor Potência do motor Consumo por milha em cidade Consumo por milha em auto-estrada Peso (quilogramas) Distância entre eixos (mm) Comprimento (polegadas) Largura (polegadas) Tabela 5: Variáveis associadas aos dados car04.txt. (b) Com base nos resultados obtidos em 6(a)iii: i. Quantas componentes consideraria se o objectivo da aplicação da PCA fosse a redução da dimensionalidade? ii. Com base nos loadings ou pesos das duas primeiras componentes principais amostrais que interpretação poderá fazer. iii. Repita a alínea anterior mas agora com base nos coeficientes de correlação entre cada componente principal e cada variável. (c) Efectue um gráfico adequado que permita confirmar/verificar essa interpretação. 7. Os dados a considerar neste problema são relativos a medidas de expressão génica a partir de células retiradas de 64 tumores diferentes (de 64 pacientes diferentes) (nci.txt). Em cada caso, um dispositivo chamado um microarray (chip de genes) possui a medida da expressão de cada um dos 6830 diferentes genes, essencialmente, considera-se o logaritmo da concentração química do produto do gene. Assim, cada registo no conjunto de dados é um vector de comprimento As células provêm, na maior parte, de tipos de cancro conhecidos, então existem classes. As classes são, BREAST, CNS (sistema nervoso central), COLON, LEUKEMIA, MELANOMA, NSCLC (certas células do cancro do pulmão), OVARIAN, PROSTATE, RENAL, K562A, K562B, MCF7A, MCF7D (estes quatro são culturas de tumor em laboratório) e UNKNOWN. Os dados encontram-se em: camado/datam. (a) Proceda a uma análise de clusters usando a função do R k-means com k = 14. Compare o resultado do agrupamento com as classes conhecidas. 3

15 (b) Produza um dendrograma usando o método de Ward (use cex=0.5 para fazer o gráfico). Que classe de células parece ser melhor agrupada? (c) Determine as variâncias associadas às componentes principais amostrais para este conjunto de dados. (d) Porque é que há apenas 64 componentes e não 6830? (e) Construa o gráfico da fracção da variância total que é retida pelas primeiras q componentes contra q. (f) Quantas componentes principais se devem reter de forma a manter metade da variância? E noventa por cento? (g) Que confiança teria nos resultados da visualização das primeiras duas componentes principais? (h) Efectue o gráfico das projecções das observações de cada célula nas duas componentes principais. (i) Efectue agora uma análise de clusters usando o método k-médias com k = 14 nas projecções das células das duas primeiras componentes. (j) O método k-médias encontrou uma correspondência para o tipo de células que à partida pensava que existia? E para aquelas que parecia ser difícil de identificar? (k) Calcule a taxa de erro de má classificação usando todos os genes para um classificador à sua escolha. (l) Calcule as taxas de erro de má classificação usando as primeiras duas, dez e vinte componentes principais, para o classificador que escolheu na alínea anterior. 8. Prove que qualquer combinação linear normalizada das componentes de X tem variância inferior a λ 1 (variância da primeira componente principal, i.e. V ar ( a t X ) λ 1 a : a t a = Suponha que 1, 2,..., 5 são regiões dum país limitadas e dispostas como a Figura 1 indica. Seja δ ij a dissemelhança entre as regiões i e j. Defina-se δ ij como o número mínimo de fronteiras (linhas) que é necessário atravessar para passar de i para j, com i, j = 1,..., 5. Mostre que δ ij satisfaz a propriedade triangular. Construa a matriz de dissemelhanças. Construa a matriz B e, fazendo uso desta matriz, mostre que δ ij não é uma distância Euclidiana. 10. Dada a matriz de dissemelhanças =

16 Figura 1: Representação das cinco regiões dum país. obtenha uma configuração em duas dimensões, centrada na origem, tal que a matriz de distâncias correspondente é precisamente. 11. Considere o conjunto dos dados (car04.txt) sobre 388 modelos de carros de 2004 descritos com 18 variáveis. Recordar que os dados se encontram em: camado/datam. (a) Para estes dados compare as seguintes abordagens e comente os resultados obtidos: i. Multidimensional Scaling clássico. ii. Sammon mapping. iii. Kruskal isotonic regression multidimensional scaling. (b) Obtenha as componentes principais amostrais e projecte as observações nas duas primeiras componentes. Compare com o gráfico obtido em 11(a)i. (c) Considere os dados eurodist que se encontram no R. Represente os dados em dimensão-1 e em dimensão-2, aplicando multidimensional scaling clássico, Sammon mapping e Kruskal isotonic regression multidimensional scaling. 5

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por

INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática. (1) Data Mining Conceitos apresentados por INTELIGÊNCIA ARTIFICIAL Data Mining (DM): um pouco de prática (1) Data Mining Conceitos apresentados por 1 2 (2) ANÁLISE DE AGRUPAMENTOS Conceitos apresentados por. 3 LEMBRE-SE que PROBLEMA em IA Uma busca

Leia mais

Pré processamento de dados II. Mineração de Dados 2012

Pré processamento de dados II. Mineração de Dados 2012 Pré processamento de dados II Mineração de Dados 2012 Luís Rato Universidade de Évora, 2012 Mineração de dados / Data Mining 1 Redução de dimensionalidade Objetivo: Evitar excesso de dimensionalidade Reduzir

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Revisão de Probabilidade e Estatística Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Conceitos Básicos Estamos

Leia mais

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados Prof. Celso Kaestner Poker Hand Data Set Aluno: Joyce Schaidt Versão:

Leia mais

UNIVERSIDADE FEDERAL DO PIAUÍ (UFPI) ENG. DE PRODUÇÃO PROBABILIDADE E ESTATÍSTICA 2

UNIVERSIDADE FEDERAL DO PIAUÍ (UFPI) ENG. DE PRODUÇÃO PROBABILIDADE E ESTATÍSTICA 2 UNIVERSIDADE FEDERAL DO PIAUÍ (UFPI) ENG. DE PRODUÇÃO PROBABILIDADE E ESTATÍSTICA 2 LISTA N O 2 Prof.: William Morán Sem. I - 2011 1) Considere a seguinte função distribuição conjunta: 1 2 Y 0 0,7 0,0

Leia mais

Universidade da Beira Interior - Departamento de Matemática ESTATÍSTICA APLICADA À PSICOLOGIA I

Universidade da Beira Interior - Departamento de Matemática ESTATÍSTICA APLICADA À PSICOLOGIA I Ano lectivo: 2008/2009 Universidade da Beira Interior - Departamento de Matemática ESTATÍSTICA APLICADA À PSICOLOGIA I Ficha de exercícios 1 Validação de Pré-Requisitos: Estatística Descritiva Curso: Psicologia

Leia mais

Reconhecimento de Padrões

Reconhecimento de Padrões Engenharia Informática (ramos de Gestão e Industrial) Departamento de Sistemas e Informação Reconhecimento de Padrões Projecto Final 2004/2005 Realizado por: Prof. João Ascenso. Departamento de Sistemas

Leia mais

Elementos de Estatística (EST001-B)

Elementos de Estatística (EST001-B) Exercícios de Revisão nº 1 Análise de Dados Exercício 1: A pressão mínima de injeção (psi) em amostras de moldagem por injeção de milho de alta amilose foi determinada para oito amostras diferentes (pressões

Leia mais

(b) Qual a probabilidade de ter sido transmitido um zero, sabendo que foi recebido um (1.0) zero?

(b) Qual a probabilidade de ter sido transmitido um zero, sabendo que foi recebido um (1.0) zero? Grupo I 5.0 valores 1. Um sistema de comunicação binária transmite zeros e uns com probabilidade 0.5 em qualquer dos casos. Devido ao ruído existente no canal de comunicação há erros na recepção: transmitido

Leia mais

Probabilidade. Distribuição Normal

Probabilidade. Distribuição Normal Probabilidade Distribuição Normal Distribuição Normal Uma variável aleatória contínua tem uma distribuição normal se sua distribuição é: simétrica apresenta (num gráfico) forma de um sino Função Densidade

Leia mais

Investimentos e Mercados Financeiros

Investimentos e Mercados Financeiros MESTRADO EM CONTABILIDADE, FISCALIDADE E FINANÇAS EMPRESARIAIS 1º SEMESTRE 2007/2008 Investimentos e Mercados Financeiros Caderno de Exercícios nº3 Escolha da Carteira Óptima Raquel M. Gaspar 1 Teoria

Leia mais

Cláudio Tadeu Cristino 1. Julho, 2014

Cláudio Tadeu Cristino 1. Julho, 2014 Inferência Estatística Estimação Cláudio Tadeu Cristino 1 1 Universidade Federal de Pernambuco, Recife, Brasil Mestrado em Nutrição, Atividade Física e Plasticidade Fenotípica Julho, 2014 C.T.Cristino

Leia mais

4 a LISTA DE EXERCÍCIOS Valores Próprios e Vectores Próprios Álgebra Linear - 1 o Semestre - 2013/2014 LEE, LEGI, LEIC-TP, LETI

4 a LISTA DE EXERCÍCIOS Valores Próprios e Vectores Próprios Álgebra Linear - 1 o Semestre - 2013/2014 LEE, LEGI, LEIC-TP, LETI 4 a LISTA DE EXERCÍCIOS Valores Próprios e Vectores Próprios Álgebra Linear - 1 o Semestre - 2013/2014 LEE, LEGI, LEIC-TP, LETI Problema 1 Considere a matriz A = 1 0 0 0 2 1 2 0 3 Diga quais dos seguintes

Leia mais

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões Classificação de imagens Autor: Gil Gonçalves Disciplinas: Detecção Remota/Detecção Remota Aplicada Cursos: MEG/MTIG Ano Lectivo: 11/12 Sumário Classificação da imagem (ou reconhecimento de padrões): objectivos

Leia mais

Departamento de Matemática - UEL - 2010. Ulysses Sodré. http://www.mat.uel.br/matessencial/ Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

Departamento de Matemática - UEL - 2010. Ulysses Sodré. http://www.mat.uel.br/matessencial/ Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010. Matemática Essencial Extremos de funções reais Departamento de Matemática - UEL - 2010 Conteúdo Ulysses Sodré http://www.mat.uel.br/matessencial/ Arquivo: minimaxi.tex - Londrina-PR, 29 de Junho de 2010.

Leia mais

Factor Analysis (FACAN) Abrir o arquivo ven_car.sav. Clique Extraction. Utilizar as 10 variáveis a partir de Vehicle Type.

Factor Analysis (FACAN) Abrir o arquivo ven_car.sav. Clique Extraction. Utilizar as 10 variáveis a partir de Vehicle Type. Prof. Lorí Viali, Dr. viali@pucrs.br; viali@mat.ufrgs.br; http://www.pucrs.br/famat/viali; http://www.mat.ufrgs.br/~viali/ Factor Analysis (FACAN) Abrir o arquivo ven_car.sav Utilizar as 10 variáveis a

Leia mais

Tarefa Orientada 18 Tabelas dinâmicas

Tarefa Orientada 18 Tabelas dinâmicas Tarefa Orientada 18 Tabelas dinâmicas Análise de dados através de tabelas dinâmicas. Conceitos teóricos As Tabelas Dinâmicas são tabelas interactivas que resumem elevadas quantidades de dados, usando estrutura

Leia mais

Múltiplos Estágios processo com três estágios Inquérito de Satisfação Fase II

Múltiplos Estágios processo com três estágios Inquérito de Satisfação Fase II O seguinte exercício contempla um processo com três estágios. Baseia-se no Inquérito de Satisfação Fase II, sendo, por isso, essencial compreender primeiro o problema antes de começar o tutorial. 1 1.

Leia mais

EXERCÍCIOS EXERCÍCIOS. Definições Básicas. Definições Básicas. Definições Básicas. Introdução à Estatística. Dados: valores de variáveis observadas.

EXERCÍCIOS EXERCÍCIOS. Definições Básicas. Definições Básicas. Definições Básicas. Introdução à Estatística. Dados: valores de variáveis observadas. Definições Básicas Introdução à Estatística ESTATÍSTICA: estudo dos métodos para coletar, organizar, apresentar e analisar dados. População: conjunto constituído por todos os indivíduos que apresentem

Leia mais

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA 4 a LISTA DE EXERCÍCIOS GBQ12 Professor: Ednaldo Carvalho Guimarães AMOSTRAGEM

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA 4 a LISTA DE EXERCÍCIOS GBQ12 Professor: Ednaldo Carvalho Guimarães AMOSTRAGEM 1 UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA 4 a LISTA DE EXERCÍCIOS GBQ12 Professor: Ednaldo Carvalho Guimarães AMOSTRAGEM 1) Um pesquisador está interessado em saber o tempo médio que

Leia mais

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE Mariane Alves Gomes da Silva Eliana Zandonade 1. INTRODUÇÃO Um aspecto fundamental de um levantamento

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação

Leia mais

A calculadora se vamos utilizar na proposta de resolução deste exame nacional é a fx-cg20

A calculadora se vamos utilizar na proposta de resolução deste exame nacional é a fx-cg20 A calculadora se vamos utilizar na proposta de resolução deste exame nacional é a fx-cg20 2. Na actualidade, há uma crescente preocupação com a preservação da natureza, nomeadamente, quanto à necessidade

Leia mais

Prova de Aferição de Matemática

Prova de Aferição de Matemática PROVA DE AFERIÇÃO DO ENSINO BÁSICO A PREENCHER PELO ALUNO Nome A PREENCHER PELO AGRUPAMENTO Número convencional do Aluno Número convencional do Aluno A PREENCHER PELA U.A. Número convencional do Agrupamento

Leia mais

UTILIZANDO O SOFTWARE WEKA

UTILIZANDO O SOFTWARE WEKA UTILIZANDO O SOFTWARE WEKA O que é 2 Weka: software livre para mineração de dados Desenvolvido por um grupo de pesquisadores Universidade de Waikato, Nova Zelândia Também é um pássaro típico da Nova Zelândia

Leia mais

CRM e Prospecção de Dados

CRM e Prospecção de Dados CRM e Prospecção de Dados Marília Antunes aula de 9 Março 09 2 Dados e medição 2.1 Introdução O objectivo a que nos propomos é o de descobrir relações existentes no mundo real a partir de dados que o descrevem.

Leia mais

A Preparação dos Dados

A Preparação dos Dados A Preparação dos Dados Escolhas Básicas Objetos, casos, instâncias Objetos do mundo real: carros, arvores, etc Ponto de vista da mineração: um objeto é descrito por uma coleção de características sobre

Leia mais

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr

Análise de Regressão. Tópicos Avançados em Avaliação de Desempenho. Cleber Moura Edson Samuel Jr Análise de Regressão Tópicos Avançados em Avaliação de Desempenho Cleber Moura Edson Samuel Jr Agenda Introdução Passos para Realização da Análise Modelos para Análise de Regressão Regressão Linear Simples

Leia mais

CAPÍTULO 9 Exercícios Resolvidos

CAPÍTULO 9 Exercícios Resolvidos CAPÍTULO 9 Exercícios Resolvidos R9.1) Diâmetro de esferas de rolamento Os dados a seguir correspondem ao diâmetro, em mm, de 30 esferas de rolamento produzidas por uma máquina. 137 154 159 155 167 159

Leia mais

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. 1 1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. Modelo de Resultados Potenciais e Aleatorização (Cap. 2 e 3

Leia mais

Análise de Regressão Linear Simples e Múltipla

Análise de Regressão Linear Simples e Múltipla Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Carla Henriques (DepMAT ESTV) Análise de Regres. Linear Simples e Múltipla

Leia mais

Probabilidades e Estatística

Probabilidades e Estatística Departamento de Matemática - IST(TP) Secção de Estatística e Aplicações Probabilidades e Estatística 1 o Exame/1 o Teste/2 o Teste 2 o Semestre/1 a Época 2008/09 Duração: 3 horas/1 hora e 30 minutos 16/01/09

Leia mais

ESCOLA SECUNDÁRIA/3 da RAINHA SANTA ISABEL 402643 ESTREMOZ PLANIFICAÇÃO ANUAL DA DISCIPLINA DE MATEMÁTICA APLICADA ÀS CIÊNCIAS SOCIAIS (MACS) 10º ANO

ESCOLA SECUNDÁRIA/3 da RAINHA SANTA ISABEL 402643 ESTREMOZ PLANIFICAÇÃO ANUAL DA DISCIPLINA DE MATEMÁTICA APLICADA ÀS CIÊNCIAS SOCIAIS (MACS) 10º ANO ESCOLA SECUNDÁRIA/3 da RAINHA SANTA ISABEL 402643 ESTREMOZ PLANIFICAÇÃO ANUAL DA DISCIPLINA DE MATEMÁTICA APLICADA ÀS CIÊNCIAS SOCIAIS (MACS) 10º ANO ANO LETIVO DE 2015/2016 PROFESSORES: Inácio Véstia

Leia mais

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ

Resoluções comentadas das questões de Estatística da prova para. ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Resoluções comentadas das questões de Estatística da prova para ANALISTA DE GERENCIAMENTO DE PROJETOS E METAS da PREFEITURA/RJ Realizada pela Fundação João Goulart em 06/10/2013 41. A idade média de todos

Leia mais

Avaliando o que foi Aprendido

Avaliando o que foi Aprendido Avaliando o que foi Aprendido Treinamento, teste, validação Predição da performance: Limites de confiança Holdout, cross-validation, bootstrap Comparando algoritmos: o teste-t Predecindo probabilidades:função

Leia mais

Inferência Estatística-Macs11ºano

Inferência Estatística-Macs11ºano INFERÊNCIA ESTATÍSTICA Inferência Estatística-Macs11ºano Estatística Descritiva: conjunto de métodos para sintetizar e representar de forma compreensível a informação contida num conjunto de dados. Usam-se,

Leia mais

Epidemiologia. Profa. Heloisa Nascimento

Epidemiologia. Profa. Heloisa Nascimento Epidemiologia Profa. Heloisa Nascimento Medidas de efeito e medidas de associação -Um dos objetivos da pesquisa epidemiológica é o reconhecimento de uma relação causal entre uma particular exposição (fator

Leia mais

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo

UNIVERSIDADE DE SÃO PAULO. Faculdade de Arquitetura e Urbanismo UNIVERSIDADE DE SÃO PAULO Faculdade de Arquitetura e Urbanismo DISTRIBUIÇÃO AMOSTRAL ESTIMAÇÃO AUT 516 Estatística Aplicada a Arquitetura e Urbanismo 2 DISTRIBUIÇÃO AMOSTRAL Na aula anterior analisamos

Leia mais

MESTRADO EM PESQUISA DE MERCADOS 2006 2007

MESTRADO EM PESQUISA DE MERCADOS 2006 2007 MESTRADO EM PESQUISA DE MERCADOS 2006 2007 PROGRAMA DAS DISCIPLINAS 1 1º trimestre PESQUISA DE MERCADOS Objectivos Pretende-se que os alunos: (a) adquiram os conceitos e semântica próprios do tema, (b)

Leia mais

ActivALEA. active e actualize a sua literacia

ActivALEA. active e actualize a sua literacia ActivALEA active e actualize a sua literacia N.º 25 HIISTOGRAMA Por: Maria Eugénia Graça Martins Departamento de Estatística e Investigação Operacional da FCUL memartins@fc.ul.pt Emília Oliveira Escola

Leia mais

QUALITATIVA VARIÁVEL QUANTITATIVA

QUALITATIVA VARIÁVEL QUANTITATIVA NOMINAL ORDINAL QUALITATIVA VARIÁVEL QUANTITATIVA DISCRETA CONTÍNUA - Variável qualitativa nominal = valores que expressam atributos, sem nenhum tipo de ordem. Ex: cor dos olhos, sexo, estado civil, presença

Leia mais

Hamming. Kohonen. LVQ. Counterpropagation. ART1. Retropropagação

Hamming. Kohonen. LVQ. Counterpropagation. ART1. Retropropagação Hamming. Kohonen. LVQ. Counterpropagation. ART1. Retropropagação 1. Um comerciante tem um armazém onde guarda diversas variedades de fruta e de legumes. Muitas vezes, a fruta e os legumes chegam ao armazém

Leia mais

O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio de um gráfico, denominado diagrama de dispersão.

O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio de um gráfico, denominado diagrama de dispersão. ESTATÍSTICA INDUTIVA 1. CORRELAÇÃO LINEAR 1.1 Diagrama de dispersão O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio de um gráfico, denominado diagrama de dispersão.

Leia mais

3. Características amostrais. Medidas de localização e dispersão

3. Características amostrais. Medidas de localização e dispersão Estatística Descritiva com Excel Complementos. 77 3. Características amostrais. Medidas de localização e dispersão 3.1- Introdução No módulo de Estatística foram apresentadas as medidas ou estatísticas

Leia mais

UNIVERSIDADE FEDERAL DA PARAÍBA TABELAS E GRÁFICOS Departamento de Estatística Luiz Medeiros Tabela de dados multidimensionais Até agora vimos como organizar, resumir e descrever informações referentes

Leia mais

Universidade da Beira Interior Departamento de Matemática

Universidade da Beira Interior Departamento de Matemática Universidade da Beira Interior Departamento de Matemática ESTATÍSTICA Ano lectivo: 2007/2008 Curso: Ciências do Desporto Ficha de exercícios nº1: Análise Exploratória de dados: Redução e Representação

Leia mais

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A.

IMES Catanduva. Probabilidades e Estatística. no Excel. Matemática. Bertolo, L.A. IMES Catanduva Probabilidades e Estatística Estatística no Excel Matemática Bertolo, L.A. Aplicada Versão BETA Maio 2010 Bertolo Estatística Aplicada no Excel Capítulo 3 Dados Bivariados São pares de valores

Leia mais

Não é permitido o uso de corrector. Em caso de engano, deve riscar, de forma inequívoca, aquilo que pretende que não seja classificado.

Não é permitido o uso de corrector. Em caso de engano, deve riscar, de forma inequívoca, aquilo que pretende que não seja classificado. Teste Intermédio de Matemática B 2010 Teste Intermédio Matemática B Duração do Teste: 90 minutos 13.04.2010 10.º Ano de Escolaridade Decreto-Lei n.º 74/2004, de 26 de Março Utilize apenas caneta ou esferográfica

Leia mais

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR

Prof. Júlio Cesar Nievola Data Mining PPGIa PUCPR Uma exploração preliminar dos dados para compreender melhor suas características. Motivações-chave da exploração de dados incluem Ajudar na seleção da técnica correta para pré-processamento ou análise

Leia mais

Introdução à Análise Química QUI 094 ERRO E TRATAMENTO DE DADOS ANALÍTICOS

Introdução à Análise Química QUI 094 ERRO E TRATAMENTO DE DADOS ANALÍTICOS Introdução a Analise Química - II sem/2012 Profa Ma Auxiliadora - 1 Introdução à Análise Química QUI 094 1 semestre 2012 Profa. Maria Auxiliadora Costa Matos ERRO E TRATAMENTO DE DADOS ANALÍTICOS Introdução

Leia mais

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. 1 1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3. Modelo de Resultados Potenciais e Aleatorização (Cap. 2 e 3

Leia mais

7Testes de hipótese. Prof. Dr. Paulo Picchetti M.Sc. Erick Y. Mizuno. H 0 : 2,5 peças / hora

7Testes de hipótese. Prof. Dr. Paulo Picchetti M.Sc. Erick Y. Mizuno. H 0 : 2,5 peças / hora 7Testes de hipótese Prof. Dr. Paulo Picchetti M.Sc. Erick Y. Mizuno COMENTÁRIOS INICIAIS Uma hipótese estatística é uma afirmativa a respeito de um parâmetro de uma distribuição de probabilidade. Por exemplo,

Leia mais

7.4 As nuvens de perfis

7.4 As nuvens de perfis 7.4 As nuvens de perfis Cada perfil de linha, ou seja, cada linha da matriz de perfis de linha, P L, define um ponto no espaço a b dimensões, R b. A nuvem de a pontos em R b assim resultante pode ser designada

Leia mais

CADEX. Consultoria em Logística Interna. Layout de armazém. Objectivos. Popularidade. Semelhança. Tamanho. Características

CADEX. Consultoria em Logística Interna. Layout de armazém. Objectivos. Popularidade. Semelhança. Tamanho. Características CADEX Consultoria em Logística Interna Layout de armazém fonte: Wikipédia O layout de armazém é a forma como as áreas de armazenagem de um armazém estão organizadas, de forma a utilizar todo o espaço existente

Leia mais

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis

INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis INE 7001 - Procedimentos de Análise Bidimensional de variáveis QUANTITATIVAS utilizando o Microsoft Excel. Professor Marcelo Menezes Reis O objetivo deste texto é apresentar os principais procedimentos

Leia mais

INVESTIGAÇÃO OPERACIONAL. Programação Linear. Exercícios

INVESTIGAÇÃO OPERACIONAL. Programação Linear. Exercícios INVESTIGAÇÃO OPERACIONAL Programação Linear Exercícios Cap. I Modelo de PL - Formalização António Carlos Morais da Silva Professor de I.O. i Recomendações 1. É possível aprender a matéria fazendo apenas

Leia mais

PRINCÍPIOS DE INFORMÁTICA PRÁTICA 08 1. OBJETIVO 2. BASE TEÓRICA. 2.1 Criando Mapas no Excel. 2.2 Utilizando o Mapa

PRINCÍPIOS DE INFORMÁTICA PRÁTICA 08 1. OBJETIVO 2. BASE TEÓRICA. 2.1 Criando Mapas no Excel. 2.2 Utilizando o Mapa PRINCÍPIOS DE INFORMÁTICA PRÁTICA 08 1. OBJETIVO Aprender a utilizar mapas, colocar filtros em tabelas e a criar tabelas e gráficos dinâmicos no MS-Excel. Esse roteiro foi escrito inicialmente para o Excel

Leia mais

Exercícios Teóricos Resolvidos

Exercícios Teóricos Resolvidos Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Matemática Exercícios Teóricos Resolvidos O propósito deste texto é tentar mostrar aos alunos várias maneiras de raciocinar

Leia mais

ficha 3 espaços lineares

ficha 3 espaços lineares Exercícios de Álgebra Linear ficha 3 espaços lineares Exercícios coligidos por Jorge Almeida e Lina Oliveira Departamento de Matemática, Instituto Superior Técnico 2 o semestre 2011/12 3 Notação Sendo

Leia mais

CURSO ON-LINE PROFESSOR GUILHERME NEVES

CURSO ON-LINE PROFESSOR GUILHERME NEVES Olá pessoal! Neste ponto resolverei a prova de Matemática Financeira e Estatística para APOFP/SEFAZ-SP/FCC/2010 realizada no último final de semana. A prova foi enviada por um aluno e o tipo é 005. Os

Leia mais

Canguru Matemático sem Fronteiras 2014

Canguru Matemático sem Fronteiras 2014 http://www.mat.uc.pt/canguru/ Destinatários: alunos do 9. o ano de escolaridade Nome: Turma: Duração: 1h 30min Não podes usar calculadora. Em cada questão deves assinalar a resposta correta. As questões

Leia mais

UNIVERSIDADE DOS AÇORES Mestrado em Gestão (MBA)

UNIVERSIDADE DOS AÇORES Mestrado em Gestão (MBA) UNIVERSIDADE DOS AÇORES Mestrado em Gestão (MBA) Métodos Estatísticos 1º ano -1º Trimestre 2009/2010 Ficha de trabalho nº 1 Exercícios usando o SPSS PARTE 1 - Estatística Descritiva 1. As notas de 32 alunos

Leia mais

Estatística Aplicada Lista de Exercícios 7

Estatística Aplicada Lista de Exercícios 7 AULA 7 CORRELAÇÃO E REGRESSÃO Prof. Lupércio F. Bessegato 1. Ache os valores de a e b para a equação de regressão Y = a + bx, usando o conjunto de dados apresentados a seguir, sem fazer cálculos (sugestão:

Leia mais

Preparação para a Prova Final de Matemática 2.º Ciclo do Ensino Básico Olá, Matemática! 6.º Ano

Preparação para a Prova Final de Matemática 2.º Ciclo do Ensino Básico Olá, Matemática! 6.º Ano Organização e tratamento de dados Representação e interpretação de dados Formulação de questões Natureza dos dados Tabelas de frequências absolutas e relativas Gráficos de barras, circulares, de linha

Leia mais

Lista 2 - Modelos determinísticos

Lista 2 - Modelos determinísticos EA044 - Planejamento e Análise de Sistemas de Produção Lista 2 - Modelos determinísticos Exercício 1 A Companhia Ferroviária do Brasil (CFB) está planejando a alocação de vagões a 5 regiões do país para

Leia mais

Análise de Variância com dois ou mais factores - planeamento factorial

Análise de Variância com dois ou mais factores - planeamento factorial Análise de Variância com dois ou mais factores - planeamento factorial Em muitas experiências interessa estudar o efeito de mais do que um factor sobre uma variável de interesse. Quando uma experiência

Leia mais

ESTATÍSTICA APLICADA À GESTÃO Ficha de exercícios 1 Estatística Descritiva 2014/2015

ESTATÍSTICA APLICADA À GESTÃO Ficha de exercícios 1 Estatística Descritiva 2014/2015 Universidade da Beira Interior - Departamento de Matemática ESTATÍSTICA APLICADA À GESTÃO Ficha de exercícios 1 Estatística Descritiva 2014/2015 1. Numa revista foi publicada uma lista com as 100 empresas

Leia mais

Roda de Samba. Série Matemática na Escola

Roda de Samba. Série Matemática na Escola Roda de Samba Série Matemática na Escola Objetivos 1. Apresentar uma aplicação de funções quadráticas; 2. Analisar pontos de máximo de uma parábola;. Avaliar o comportamento da parábola com variações em

Leia mais

yuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnm qwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxc

yuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnm qwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxc qwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwe rtyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyui opasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopasdfghjklçzxcvbnmqwertyuiopas

Leia mais

Lista de Exercícios #1. in Noções de Probabilidade e Estatística (Marcos N. Magalhães et al, 4ª. edição), Capítulo 1, seção 1.4, páginas 26-33.

Lista de Exercícios #1. in Noções de Probabilidade e Estatística (Marcos N. Magalhães et al, 4ª. edição), Capítulo 1, seção 1.4, páginas 26-33. Universidade de São Paulo IME (Insituto de Matemática e Estatística) MAE 121 Profº. Wagner Borges São Paulo, 19 de março de 2002 Fernando Henrique Ferraz Pereira da Rosa Bach. Estatística Lista de Exercícios

Leia mais

Tipos de variáveis aleatórias

Tipos de variáveis aleatórias Tipos de variáveis aleatórias Variáveis aleatórias discretas se assumem um conjunto finito ou infinito numerável de valores. Exemplos: número de pintas que sai no lançamento de um dado; registo, a intervalos

Leia mais

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br

MINERAÇÃO DE DADOS APLICADA. Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br MINERAÇÃO DE DADOS APLICADA Pedro Henrique Bragioni Las Casas pedro.lascasas@dcc.ufmg.br Processo Weka uma Ferramenta Livre para Data Mining O que é Weka? Weka é um Software livre do tipo open source para

Leia mais

Análise de componentes principais (PCA)

Análise de componentes principais (PCA) Análise de componentes principais (PCA) Redução de dados Sumarizar os dados que contém muitas variáveis (p) por um conjunto menor de (k) variáveis compostas derivadas a partir do conjunto original. p k

Leia mais

Introdução à genética quantitativa usando os recursos do R

Introdução à genética quantitativa usando os recursos do R Introdução à genética quantitativa usando os recursos do R Marisa R. Cantarino 1 Julia M. P. Soler (orientadora) 2 1 Introdução Um dos principais desafios da pesquisa genética atualmente é estabelecer

Leia mais

Matemática 1. 20. Abaixo temos um extrato bancário simplificado do mês de novembro.

Matemática 1. 20. Abaixo temos um extrato bancário simplificado do mês de novembro. Matemática 1 17. Uma revista semanal de larga circulação apresentou matéria contendo o seguinte texto: O governo destinou 400.000 reais para a vacinação de 25 milhões de cabeças de gado, ou seja, um centavo

Leia mais

Conceitos e fórmulas

Conceitos e fórmulas 1 Conceitos e fórmulas 1).- Triângulo: definição e elementos principais Definição - Denominamos triângulo (ou trilátero) a toda figura do plano euclidiano formada por três segmentos AB, BC e CA, tais que

Leia mais

Trabalhos Práticos. Programação II Curso: Engª Electrotécnica - Electrónica e Computadores

Trabalhos Práticos. Programação II Curso: Engª Electrotécnica - Electrónica e Computadores Trabalhos Práticos Programação II Curso: Engª Electrotécnica - Electrónica e Computadores 1. Objectivos 2. Calendarização 3. Normas 3.1 Relatório 3.2 Avaliação 4. Propostas Na disciplina de Programação

Leia mais

Investigação Operacional

Investigação Operacional Licenciatura em Engenharia de Comunicações Licenciatura em Engenharia Electrónica Industrial e Computadores Investigação Operacional Exercícios de Métodos para Programação Linear Grupo de Optimização e

Leia mais

EE210 Sistemas de Comunicação II 2ª Avaliação (PV2) 22/04/2015 15h30min Profs. Dayan A. Guimarães e Rausley A. A. de Souza. Aluno(a): Matrícula.

EE210 Sistemas de Comunicação II 2ª Avaliação (PV2) 22/04/2015 15h30min Profs. Dayan A. Guimarães e Rausley A. A. de Souza. Aluno(a): Matrícula. EE1 Sistemas de Comunicação II ª Avaliação (PV) /4/15 15h3min Profs. Dayan A. Guimarães e Rausley A. A. de Souza Nota : Nota P: Aluno(a): Matrícula. Prova sem consulta, com duração de 1h5min. A interpretação

Leia mais

Distribuição de Freqüências

Distribuição de Freqüências Distribuição de Freqüências Por constituir-se o tipo de tabela importante para a Estatística Descritiva, faremos um estudo completo da distribuição de freqüências. Uma distribuição de freqüências condensa

Leia mais

ECONOMETRIA EXERCÍCIOS DO CAPÍTULO 2

ECONOMETRIA EXERCÍCIOS DO CAPÍTULO 2 ECONOMETRIA EXERCÍCIOS DO CAPÍTULO 2 1. Exercício C7.8 de W (4th edition), apenas as alíneas i) a iv). 2. Exercício 7.7 de W. 3. Exercício C8.7 de W, com excepção da questão sobre WLS em ii). 4. Exercício

Leia mais

Teorema do Limite Central e Intervalo de Confiança

Teorema do Limite Central e Intervalo de Confiança Probabilidade e Estatística Teorema do Limite Central e Intervalo de Confiança Teorema do Limite Central Teorema do Limite Central Um variável aleatória pode ter uma distribuição qualquer (normal, uniforme,...),

Leia mais

TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS

TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS TRATAMENTO MULTIVARIADO DE DADOS POR ANÁLISE DE CORRESPONDÊNCIA E ANÁLISE DE AGRUPAMENTOS Luciene Bianca Alves ITA Instituto Tecnológico de Aeronáutica Praça Marechal Eduardo Gomes, 50 Vila das Acácias

Leia mais

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES 3.1 - IDENTIFICADORES Os objetos que usamos no nosso algoritmo são uma representação simbólica de um valor de dado. Assim, quando executamos a seguinte instrução:

Leia mais

EXERCÍCIOS. 2. Faça um algoritmo que receba dois números e ao final mostre a soma, subtração, multiplicação e a divisão dos números lidos.

EXERCÍCIOS. 2. Faça um algoritmo que receba dois números e ao final mostre a soma, subtração, multiplicação e a divisão dos números lidos. EXERCÍCIOS 1. Faça um algoritmo que receba dois números e exiba o resultado da sua soma. 2. Faça um algoritmo que receba dois números e ao final mostre a soma, subtração, multiplicação e a divisão dos

Leia mais

AULAS 14, 15 E 16 Análise de Regressão Múltipla: Problemas Adicionais

AULAS 14, 15 E 16 Análise de Regressão Múltipla: Problemas Adicionais 1 AULAS 14, 15 E 16 Análise de Regressão Múltipla: Problemas Adicionais Ernesto F. L. Amaral 20 e 22 de abril e 04 de maio de 2010 Métodos Quantitativos de Avaliação de Políticas Públicas (DCP 030D) Fonte:

Leia mais

Licenciatura em Engenharia Electrotécnica e de Computadores 1998/99. Erros

Licenciatura em Engenharia Electrotécnica e de Computadores 1998/99. Erros Licenciatura em Engenharia Electrotécnica e de Computadores Análise Numérica 1998/99 Erros Objectivos: Arredondar um número para n dígitos significativos. Determinar os erros máximos absoluto e relativo

Leia mais

Distribuição de freqüência

Distribuição de freqüência Curso: Logística e Transportes Disciplina: Estatística Profa. Eliane Cabariti Distribuição de freqüência Dados brutos e rol Como já estudamos, o conjunto de dados numéricos obtidos após a crítica dos valores

Leia mais

Escola Básica e Secundária de Alfandega da Fé

Escola Básica e Secundária de Alfandega da Fé Escola Básica e Secundária de Alfandega da Fé Prova de Avaliação MACS - 11.º B Em todas as respostas, indique todos os cálculos e todas as justificações necessárias. Atenção: quando, para um resultado,

Leia mais

Teste de hipóteses com duas amostras. Estatística Aplicada Larson Farber

Teste de hipóteses com duas amostras. Estatística Aplicada Larson Farber 8 Teste de hipóteses com duas amostras Estatística Aplicada Larson Farber Seção 8.1 Testando a diferença entre duas médias (amostras grandes e independentes) Visão geral Para testar o efeito benéfico de

Leia mais

AULAS 13, 14 E 15 Correlação e Regressão

AULAS 13, 14 E 15 Correlação e Regressão 1 AULAS 13, 14 E 15 Correlação e Regressão Ernesto F. L. Amaral 23, 28 e 30 de setembro de 2010 Metodologia de Pesquisa (DCP 854B) Fonte: Triola, Mario F. 2008. Introdução à estatística. 10 ª ed. Rio de

Leia mais

CURSO ON-LINE PROFESSOR: VÍTOR MENEZES

CURSO ON-LINE PROFESSOR: VÍTOR MENEZES Caríssimos. Recebi muitos e-mails pedindo ajuda com eventuais recursos para as provas do BACEN. Em raciocínio lógico, eu não vi possibilidade de recursos, apesar de achar que algumas questões tiveram o

Leia mais

Estatística Aplicada ao Serviço Social Módulo 1:

Estatística Aplicada ao Serviço Social Módulo 1: Estatística Aplicada ao Serviço Social Módulo 1: Introdução à Estatística Importância da Estatística Fases do Método Estatístico Variáveis estatísticas. Formas Iniciais de Tratamento dos Dados Séries Estatísticas.

Leia mais

LISTA DE EXERCÍCIOS: 3ª Unidade. Registros e Arquivos

LISTA DE EXERCÍCIOS: 3ª Unidade. Registros e Arquivos LISTA DE EXERCÍCIOS: 3ª Unidade Registros e Arquivos 1) Faça um programa que leia os dados de 10 funcionários de uma empresa usando um registro do tipo funcionário, e após a sua leitura, imprima na tela.

Leia mais

Matemática SSA 2 REVISÃO GERAL 1

Matemática SSA 2 REVISÃO GERAL 1 1. REVISÃO 01 Matemática SSA REVISÃO GERAL 1. Um recipiente com a forma de um cone circular reto de eixo vertical recebe água na razão constante de 1 cm s. A altura do cone mede cm, e o raio de sua base

Leia mais

Tópico 11. Aula Teórica/Prática: O Método dos Mínimos Quadrados e Linearização de Funções

Tópico 11. Aula Teórica/Prática: O Método dos Mínimos Quadrados e Linearização de Funções Tópico 11. Aula Teórica/Prática: O Método dos Mínimos Quadrados e Linearização de Funções 1. INTRODUÇÃO Ao se obter uma sucessão de pontos experimentais que representados em um gráfico apresentam comportamento

Leia mais

Questões de Exames Passados. 1. Considere o polígono integral das distribuições a seguir e responda as perguntas abaixo. F(x) C D

Questões de Exames Passados. 1. Considere o polígono integral das distribuições a seguir e responda as perguntas abaixo. F(x) C D Faculdade de Economia, Universidade Nova de Lisboa Tratamento de Dados André C. Silva Questões de Exames Passados 1. Considere o polígono integral das distribuições a seguir e responda as perguntas abaixo.

Leia mais

O que é a estatística?

O que é a estatística? Elementos de Estatística Prof. Dr. Clécio da Silva Ferreira Departamento de Estatística - UFJF O que é a estatística? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os

Leia mais

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder Comentário Geral: Prova muito difícil, muito fora dos padrões das provas do TCE administração e Economia, praticamente só caiu teoria. Existem três questões (4, 45 e 47) que devem ser anuladas, por tratarem

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Aula anterior Organização e Recuperação de Informação(GSI521) Modelo vetorial- Definição Para o modelo vetorial, o

Leia mais