Aprendizado de Máquina (Machine Learning)

Documentos relacionados
INF 1771 Inteligência Artificial

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Aprendizagem de Máquinas

Inteligência Artificial

Introdução a Sistemas Inteligentes

Introdução ao Data Mining (Mineração de Dados)

Inteligência Artificial

Reconhecimento de Padrões

Aprendizado indutivo. Marcelo K. Albertini. 17 de Abril de 2014

Máquinas de suporte vetorial e sua aplicação na detecção de spam

Redes Neurais e Sistemas Fuzzy

Visão Computacional. Prof. Leandro Augusto Frata Fernandes TCC Introdução à Ciência da Computação (2012.

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial

MINISTÉRIO DA EDUCAÇÃO SECRETARIA DE EDUCAÇÃO PROFISSIONAL E TECNOLÓGICA INSTITUTO FEDERAL DO NORTE DE MINAS GERAIS CAMPUS MONTES CLAROS 1 PERÍODO

Classificação de Padrões. Abordagem prática com Redes Neurais Artificiais

índice 2. Vetores e Tipos Primitivos PARTE 1- O Sistema R 1. Introdução ao Sistema R

Introdução à Ciência da Computação

scikit-learn: Aprendizado de máquina 101 com Python

Apresentação da Disciplina

INTELIGÊNCIA COMPUTACIONAL

Prof. Júlio Cesar Nievola PPGIa PUCPR APRENDIZAGEM DE MÁQUINA - I

Mineração de Dados e Aprendizado de Máquinas. Rodrigo Leite Durães.

Introdução ao Reconhecimento. Prof. Dr. Geraldo Braz Junior

INF 1771 Inteligência Artificial

Aprendizado de Máquina (Machine Learning)

Visão computacional. Juliana Patrícia Detroz Orientador: André Tavares Silva

Rede RBF (Radial Basis Function)

CIÊNCIA DOS DADOS E A ANÁLISE PREDITIVA ABSTRATO. Extrair conhecimento dos dados para tomar melhores decisões

Classificação e Predição de Dados - Profits Consulting - Consultoria Empresarial - Serviços SAP- CRM Si

Mineração de Dados para Detecção de Padrões de Mudança de Cobertura da Terra. Padrões e processos em Dinâmica de uso e Cobertura da Terra

PÓS-GRADUAÇÃO ANÁLISE DE DATA MINING

DATA MINING SISTEMAS DE SAÚDE. Diogo Soares Pedro Coelho Nadine Carvalho Rui Ferreira Salomé Monteiro

Paradigmas de Aprendizagem

Por que atributos irrelevantes são um problema Quais tipos de algoritmos de aprendizado são afetados Abordagens automáticas

FACULDADE CAMPO LIMPO PAULISTA (FACCAMP) COORDENADORIA DE EXTENSÃO E PESQUISA CURSO DE PÓS-GRADUAÇÃO LATO SENSU EM MINERAÇÃO E CIÊNCIA DOS DADOS

Inteligência Artificial. Raimundo Osvaldo Vieira [DComp IFMA Campus Monte Castelo]

Implementação de Kernel Customizado Aplicado à Análise de Sentimentos em Resenhas de Filmes

Aula 3: Algoritmos: Formalização e Construção

Inteligência Artificial. Aula 2

serotonina (humor) dopamina (Parkinson) serotonina (humor) dopamina (Parkinson) Prozac inibe a recaptação da serotonina

[2CTA121] Processamento de Imagens em Alimentos: Conceitos e Aplicações

Aprendizagem de Máquina - 2. Prof. Júlio Cesar Nievola PPGIa - PUCPR

2 Mineração de Dados Processo de Busca de Conhecimento (KDD) 2 Mineração de Dados

2 Sentiment Analysis 2.1

Reconhecimento facial. uma aplicação prática do reconhecimento de padrões

SCC0173 Mineração de Dados Biológicos

Prof.: Eduardo Vargas Ferreira

Aprendizado por Árvores de Decisão

Aprendizado de Máquinas

Pontifícia Universidade Católica de São Paulo Graduação em Matemática Empresarial

CURSO DE GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO MATRIZ CURRICULAR MATUTINO Fase N.

Agregação de Algoritmos de Aprendizado de Máquina (AM) Professor: Eduardo R. Hruschka Estagiário PAE: Luiz F. S. Coletta

MATRIZ CURRICULAR DO CURSO DE LICENCIATURA EM COMPUTAÇÃO

MATRIZ CURRICULAR BACHARELADO EM ENGENHARIA DA COMPUTAÇÃO. 1º Período

Inteligência Artificial. Aula 1 Prof. Nayat Sánchez Pi

com Big Data Fabrício Olivetti de França Universidade Federal do ABC

Figura 1: Metodologia de Reconhecimentos de Padrões desenvolvida na UFC

INF 1771 Inteligência Artificial

Mineração de Dados - II

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Aula 7 Medidas de Distância. Profa. Elaine Faria UFU

1.1 Tema Aprendizado de Máquina (Mit97) é o campo da Inteligência Artificial responsável pelo desenvolvimento de modelos inferidos automaticamente a

Estatística e Matemática Aplicadas a Data Science. Diógenes Justo BM&FBOVESPA & Professor FIAP

Aprendizado de Máquina

Mineração de Dados. Eduardo Raul Hruschka. Baseado no curso de Gregory Piatetsky-Shapiro, disponível no sítio

Matriz Curricular Curso de Licenciatura em Computação Habilitação: Licenciatura em Computação

SERVIÇO PÚBLICO FEDERAL INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO AMAPÁ IFAP CÂMPUS MACAPÁ

Fabrício Jailson Barth BandTec

Técnicas de Inteligência Artificial

3 Aprendizado por reforço

FACULDADE DE COMPUTAÇÃO E INFORMÁTICA CURSO: CIÊNCIA DA COMPUTAÇÃO HORÁRIOS DO 2º SEM/2017

Computação e Imagens: PI, CG e Visualização. Computação Visual

Processamento digital de imagens

Tabela de Pré-Requisitos. Interdisciplinar 36 Não há

FACULDADE DE CIÊNCIA DE ENGENHARIA DE SOFTWARE MATRIZ CURRICULAR DO CURSO DE ENGENHARIA DE SOFTWARE PRIMEIRO PERÍODO SEGUNDO PERÍODO

UNIVERSIDADE FEDERAL DO ESPÍRITO SANTO Data: 05/07/2017 Currículo de Cursos Hora: 17:30:22

Introdução à Mineração de Dados com Aplicações em Ciências Espaciais

Inteligência Articial: Introdução

UNIVERSIDADE DO ESTADO DE MATO GROSSO - UNEMAT. Faculdade de Ciências Exatas e Tecnológicas FACET / Sinop Curso de Bacharelado em Engenharia Elétrica

Mineração de Dados com Big Data. Prof. Fabrício Olivetti de França Universidade Federal do ABC

Aprendizado de Máquina Conceitos. Conceitos. Introdução... Projeto de um Sistema de Aprendizado. Conceitos

Existem diversas formas de tratar dados e este conjunto de formas chama-se Data

Automação Inteligente de Processos e Sistemas

Aprendizado de Máquinas. Introdução à Aprendizado Não- Supervisionado

Fundamentos de Fundamentos de Sistemas de Geometria Analítica. Comunicação e Expressão I

Cálculo Numérico Noções básicas sobre erros

BACHARELADO EM SISTEMAS DE INFORMAÇÃO

GRADE CURRICULAR E CORPO DOCENTE. Fase 1 Carga horária total: 360h

Aprendizado de Máquina

Aprendizado de Máquina (Machine Learning)

Introdução à Matemática Discreta

Inteligência Artificial

Teoria. Prática. Uma trajetória aleatória. Luís Gustavo Silva e Silva III Encontro Comemorativo do Dia do Estatístico Maio

Orientações de Inscrição nas Unidades Curriculares. da Licenciatura em Informática

Metodologia Aplicada a Computação.

DISCIPLINA/ATIVIDADE. Total disciplinas Atividades Complementares DISCIPLINA/ATIVIDADE

Saída: Representação de conhecimento

INF 1771 Inteligência Artificial

Transcrição:

Ciência da Computação (Machine Learning) Aula 01 Motivação, áreas de aplicação e fundamentos Max Pereira

Nem todo conhecimento tem o mesmo valor.

O que torna determinado conhecimento mais importante que outro? O que exatamente fornece ao conhecimento, ou a informação o seu valor?

Resumindo... O conhecimento que utilizamos tem mais valor do que o conhecimento que não utilizamos.

Para que os humanos usam o conhecimento? Por que sempre queremos mais? O que planejamos fazer com tal conhecimento?

Humanos usam o conhecimento para tomar decisões! Estamos constantemente tentando prever as consequências das escolhas que fazemos. Por que?

Se podemos prever as consequências das escolhas, então podemos escolher as consequências que queremos.

O valor do conhecimento é a sua utilidade em influenciar as decisões. Em outras palavras, seu valor é determinado pela sua utilidade em fazer previsões precisas. Isso pode ser quantificado?

Apesar de ser impraticável a tentativa de quantificar o valor de um determinado conhecimento, torna-se muito mais fácil quando ele é combinado com uma tarefa de previsão.

Ter ou não ter um algoritmo, eis a questão!

Problema: ordenar números Entrada: uma sequência de números Saída: uma lista ordenada dos números Existem vários algoritmos!

Problema: Identificar spam e-mails Entrada: um e-mail (arquivo de caracteres) Saída: sim/não Não sabemos como transformar a entrada para a saída!

A falta de conhecimento é compensada pelos dados. Queremos aprender o que diferencia os spams de e-mails que não são spams. Queremos que o computador (máquina) extraia automaticamente o algoritmo.

Os dados armazenados se tornam úteis quando analisados e são transformados em informação que, podemos utilizar para, por exemplo, fazer previsões.

Há um processo que explica os dados que observamos. Os dados não são completamente randômicos. Há certos padrões nos dados.

Talvez não possamos identificar completamente o processo, mas podemos construir uma boa aproximação. Assim, podemos detectar certos padrões e regularidades. Esse é o foco do aprendizado de máquina!

Áreas de aplicação Aplicações de crédito Detecção de fraudes Mercado de ações Controle e otimização de manufatura Diagnóstico médico Otimização de redes de telecomunicação Análise de dados biológicos e físicos Análise de dados na Web

A aplicação de métodos de aprendizado de máquina em grandes bases de dados é chamada de Mineração de Dados (data mining).

Aprendizado de máquina não é apenas um método para problemas de banco de dados; é também uma parte da Inteligência Artificial.

Aprendizado de máquina nos ajuda a resolver problemas nas áreas de: Visão computacional; Reconhecimento de voz; Robótica Reconhecimento de padrões.

Aprendizado de máquina é a programação de computadores para otimizar a execução de critérios usando dados de exemplos ou experiências passadas.

Os modelos definidos podem ser preditivos para realizar previsões, ou descritivos para adquirir conhecimento a partir dos dados, ou mesmo ambos.

O aprendizado de máquina usa a teoria estatística para construir modelos matemáticos, porque a tarefa principal é a realização de inferência a partir de uma amostra.

Resumindo... Basicamente, o aprendizado de máquina trata de prever o futuro com base no passado.

Desafios Escalabilidade Alta dimensionalidade Dados complexos e heterogêneos Propriedade e Distribuição de Dados Análises não Tradicionais

Exemplo: Prever quanto uma determinada pessoa irá gostar de um filme que ela ainda não viu, com base nas notas dos filmes que ela já viu.

E quanto aos dados? Podem ser palavras em um documento ou pixels em uma imagem. Pode ser necessário convertê-los em um formato padrão. Representação dos Dados

Muitos datasets podem ser representados por matrizes, com valores binários, reais, discretos, etc. Outros podem ser documentos ou imagens com tamanhos diversos. É importante pensar na representação (estrutura) e transformar os dados caso seja necessário, antes de aplicar os algoritmos.

O que significa aprender? Uma forma comum de verificar se uma pessoa aprendeu sobre determinado assunto é aplicar uma prova.

Espera-se que a pessoa estude (aprenda) exemplos específicos sobre o assunto, e depois possa responder questões novas, porém relacionadas ao assunto. Dessa forma, pode-se testar a habilidade de generalização da pessoa.

A generalização é um dos conceitos mais importantes em aprendizado de máquina. Overfitting, underfitting...???

Principais tarefas Classificação Na classificação, nosso objetivo é prever qual classe uma determinada instância de dados pertence. Regressão Na regressão, procuramos prever um valor numérico.

Classificação e regressão são exemplos de aprendizado supervisionado. Supervisionado porque estamos dizendo ao algoritmo o que ele deve prever.

Em contrapartida, há um conjunto de tarefas conhecido como aprendizado não-supervisionado. Nesse tipo de aprendizado não há rótulos ou valor alvo contidos nos dados. A tarefa de agrupar dados similares é conhecida como agrupamento (clustering).

No aprendizado não-supervisionado podemos também procurar valores estatísticos que descrevam os dados. Estimativa de densidade

Algoritmos Aprendizado supervisionado k-nearest Neighbors Naive Bayes Support vector machines (SVM) Decision trees Aprendizado nãosupervisionado k-means DBSCAN Como escolher o algoritmo correto?

Primeiro: Definir qual o seu objetivo. O que você quer? A probabilidade de chuva amanhã ou encontrar grupos de eleitores com interesses similares?

Segundo: Quais dados você tem ou pode conseguir?

Desenvolvimento de aplicações de aprendizado de máquina 1. Coletar os dados 2. Preparar os dados de entrada 3. Analisar os dados de entrada 4. Treinar o algoritmo 5. Testar o algoritmo