MCZA Processamento de Linguagem Natural Modelando a linguagem com N-gramas

Tamanho: px
Começar a partir da página:

Download "MCZA Processamento de Linguagem Natural Modelando a linguagem com N-gramas"

Transcrição

1 MCZA Processamento de Linguagem Natural Modelando a linguagem com N-gramas Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 1Q

2 Outras abordagens para stemming? 2

3 Bibliografia Daniel Jurafsky & James H. Martin. Speech and language processing: An introduction to natural language processing, computational linguistics, and speech recognition. Pearson/Prentice Hall. 2019? Stanford University University of Colorado, Boulder 3

4 Bibliografia Capítulo 4 4

5 Porcentagem da presença do n-grama no corpus Para ser contabilizado o n-grama precisa estar presente em pelo menos 40 livros Dados normalizados por ano. Crítica: Os dados podem estar incompletos (devido a erro nos OCRs) 5

6 6

7 7

8 8

9 9

10 Google Books N-gram Viewer Fonte de dados: livros indexados pelo Google. Muitos dos livros foram digitalizados das coleções das bibliotecas (acadêmicas ou públicas) 10

11 N-gramas Um N-grama é uma sequência contigua de N elementos (e.g., caracteres, palavras, sílabas, fonemas, pares-base). São comumente obtidas (analisadas) a partir de um corpus. Número de elementos Nome 1 Unigrama 2 Bigrama, Digrama 3 Trigrama 4 4-grama 5 5-grama 11

12 N-gramas Exemplo: Um dois tres quatro 4 Unigramas Um dois tres quatro 3 Bigramas Um dois tres quatro 2 Trigramas 12

13 N-gramas Using Twitter to Examine Smoking Behavior and Perceptions of Emerging Tobacco Products 13

14 N-gramas Bigramas: da aula anterior (The Iliad of Homer) 14

15 N-gramas Modelo de Markov de ordem 0. Geralmente, é utilizado para predizer o seguinte item em um n-grama. 15

16 N-gramas Um modelo probabilístico pode ser utilizado para: Correção ortográfica Tradução automática de textos Reconhecimento de fala 16

17 Modelo probabílistico (estatístico) 17

18 Modelo de linguagem (language model) Um modelo que atribue probabilidades a uma sequência de palavras é denominado Modelo de linguagem. Um modelo de linguagem por N-grama permite predizer o seguinte item de uma sequência usando um Modelo de Markov de ordem (N-1). São modelos simples e escaláveis. 18

19 19

20 Modelo de linguagem (language model) Probabilidade de uma palavra w dado um histório h: Exemplo: 20

21 Modelo de linguagem (language model) Probabilidade de uma palavra w dado um histório h: Exemplo: Pode ser utilizado um Corpus para contar o número de vezes que w e h aparecem 21

22 Modelo de linguagem (language model) 22

23 Modelo de linguagem (language model) A linguagem humana é criativa e, independente do tamanho do corpus, muitas sequencias podem não ser identificadas. C("a ufabc jamais foi") = 0 23

24 Modelo de linguagem (language model) Um modelo que calcule ou é denominado modelo de linguagem. W é uma frase composta pelas palavras wis 24

25 Um pouco de formalização 25

26 Probabilidade condicional Considerando mais variáveis 26

27 Probabilidade de palavras em uma frase 27

28 Probabilidade de palavras em uma frase Muitas possibilidades de arranjos de palavras Não é recomendável pois no corpus não teremos dados suficientes para a contagem das vezes em que a sequência aparece. 28

29 Aproximando ou simplificando... Podemos usar apenas a(s) última(s) palavra(s) para aproximar a medida Uso de bigramas Uso de trigramas 29

30 Cadeias de Andrei Markov Pressuposto de Markov: é a suposição que a probabilidade de uma palavra depende apenas da probabilidade de uma(s) palavra(s) anterior(es)

31 Modelos por unigrama, bigrama 31

32 Modelos por unigrama, bigrama e trigrama 32

33 Estimando as probabilidades usando bigramas Estimativa por Máxima verossimilhança (ou seja, baseados em um corpus podemos determinar as probabilidades) 33

34 Estimando as probabilidades usando bigramas Estimativa por Máxima verossimilhança (ou seja, baseados em um corpus podemos determinar as probabilidades) Todo bigrama que inicia com w_{i-1} é igual ao número de vezes que aparece w_{i-1} (unigrama)! 34

35 Exemplo com um corpus de 3 frases 35

36 Exemplo com um corpus de 3 frases 36

37 N-gramas do texto Capivara 37

38 N-gramas do texto Capivara 38

39 Outro exemplo: Berkeley Restaurant Project Sistema de consulta sobre os restaurantes da Universidade de Berkeley International Conference on Spoken Language Processing

40 Outro exemplo: Berkeley Restaurant Project Ao todo, 9332 frases. 40

41 Alguns bigramas extraídos das 9332 frases 41

42 Alguns bigramas extraídos das 9332 frases Unigramas 42

43 Probabilidades calculadas para o corpus 43

44 Probabilidades calculadas para o corpus P(<s> I want english food </s>) = P(I <s>) P(want I) P(english want) P(food english) P(</s> food) =

45 Probabilidades calculadas para o corpus P(I <s>) P(want I) P(english want) P(food english) P(</s> food) =

46 Atividade em aula 46

47 4-gramas do texto Capivara A capivara (nome científico: Hydrochoerus hydrochaeris) é uma espécie de mamífero roedor da família Caviidae e subfamília Hydrochoerinae. Alguns autores consideram que deva ser classificada em uma família própria. Está incluída no mesmo grupo de roedores ao qual se classificam as pacas, cutias, os preás e o porquinho-da-índia. Ocorre por toda a América do Sul ao leste dos Andes em habitats associados a rios, lagos e pântanos, do nível do mar até m de altitude. Extremamente adaptável, pode ocorrer em ambientes altamente alterados pelo ser humano. <s><s><s> <s><s> <s> 47

48 Modelos por unigrama, bigrama e trigrama 48

49 Considerações finais 49

50 1) Podemos identificar padrões? 50

51 1) Podemos identificar padrões? 51

52 1) Podemos identificar padrões? 52

53 2) N-gramas e sinais de pontuação Os sinais de pontuação geralmente não são considerados na análise por N-gramas. A capivara (nome científico: Hydrochoerus hydrochaeris) é uma espécie de mamífero roedor da família Caviidae e subfamília Hydrochoerinae. Alguns autores consideram que deva ser classificada em uma família própria. Está incluída no mesmo grupo de roedores ao qual se classificam as pacas, cutias, os preás e o porquinho-da-índia. Ocorre por toda a América do Sul ao leste dos Andes em habitats associados a rios, lagos e pântanos, do nível do mar até m de altitude. Extremamente adaptável, pode ocorrer em ambientes altamente alterados pelo ser humano www 53

54 3) N-gramas e imagens? N-gramas podem ser utilizadas para diferentes contextos: Por exemplo imagens satelitais: Utilizada para determinar a que parte da terra pertence uma determinada imagem. 54

55 4) Uma questão prática P(<s> I want english food </s>) = P(I <s>) P(want I) P(english want) P(food english) P(</s> food) = Podemos ter números muito pequenos para representar. Sugestão: Utilizar Log! 55

Aula de Hoje. Processamento Estatístico da Linguagem Natural. Módulo útil: re. Módulo útil: random

Aula de Hoje. Processamento Estatístico da Linguagem Natural. Módulo útil: re. Módulo útil: random Processamento Estatístico da Linguagem Natural Aula 8 Professora Bianca (Sala 302 Bloco E bianca@ic.uff.br http://www.ic.uff.br/~bianca/peln/ Python Aula de Hoje Expressões regulares Números aleatórios

Leia mais

MCZA Processamento de Linguagem Natural Laboratório: Classificação de textos

MCZA Processamento de Linguagem Natural Laboratório: Classificação de textos MCZA017-13 Processamento de Linguagem Natural Laboratório: Classificação de textos Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 1Q-2018 1 Bibliografia Daniel Jurafsky & James H. Martin. Speech and

Leia mais

MCZA Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte III

MCZA Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte III MCZA017-13 Processamento de Linguagem Natural Semântica e similaridade de palavras: Parte III Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 1Q-2018 1 Bibliografia Daniel Jurafsky & James H. Martin.

Leia mais

6 Atributos. A dívida da empresa subiu.

6 Atributos. A dívida da empresa subiu. 6 Atributos Para buscar o sentimento de um texto automaticamente precisamos encontrar boas pistas ao longo do discurso. Uma grande variedade de palavras e expressões possui conotação positiva ou negativa,

Leia mais

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed

Índice. Classificação de textos para o ensino de português como segunda língua. Índice. technology from seed Classificação de textos para o ensino de português como segunda língua Pedro Santos Curto Conclusões, Contribuições e Trabalho futuro 1 2 Motivação Aplicações e escala da classificação de textos Motivação

Leia mais

Reconhecimento da voz baseado em segmento

Reconhecimento da voz baseado em segmento Reconhecimento da voz baseado em segmento Introdução Pesquisando gráficos baseados no espaço de observações Modelamento antifonema Modelamento Near -miss Modelamento por marcas Modelamento fonológico 1

Leia mais

MINERAÇÃO DE DADOS. Thiago Marzagão MINERAÇÃO DE TEXTOS. marzagao.1@osu.edu. Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1/2016 1 / 25

MINERAÇÃO DE DADOS. Thiago Marzagão MINERAÇÃO DE TEXTOS. marzagao.1@osu.edu. Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1/2016 1 / 25 MINERAÇÃO DE DADOS Thiago Marzagão marzagao.1@osu.edu MINERAÇÃO DE TEXTOS Thiago Marzagão (UnB) MINERAÇÃO DE DADOS 1/2016 1 / 25 transformando textos em dados Documento 1: "Não trabalho para ter clientes;

Leia mais

Processos Estocásticos. Professora Ariane Ferreira

Processos Estocásticos. Professora Ariane Ferreira Professora Conteúdos das Aulas 2 1.Apresentação da disciplina e introdução aos (PE) 2.Conceitos de Probabilidades 3.Variaveis aleatorias 4.Introdução aos 5.Processos de Poisson 6.Cadeias de Markov 7.Passeio

Leia mais

Processamento da Informação Teoria Funções

Processamento da Informação Teoria Funções Processamento da Informação Teoria Funções Semana 01 Prof. Jesús P. Mena-Chalco 27/04/2013 Funções No contexto de linguagens de programação, uma função é uma sequência de instruções utilizada para realizar

Leia mais

Gráficos de Barra e de Pareto Gráficos de Linha

Gráficos de Barra e de Pareto Gráficos de Linha Gráficos de Gerenciamento da Qualidade 1 Gráficos de Barra e de Pareto Gráficos de Linha Bibliografia e Gráficos Larry Ritzman Planejamento de Operações Logísticas Isnard Martins O gráfico de Pareto é

Leia mais

2 Teoria da Informação

2 Teoria da Informação 2 Teoria da Informação Neste capítulo apresentamos alguns conceitos básicos sobre Teoria da Informação que utilizaremos durante este trabalho. 2.1 Alfabeto, texto, letras e caracteres Um alfabeto Σ = (σ

Leia mais

Plano. Aspectos Relevantes de HMMs. Teoria de HMMs. Introdução aos Modelos Escondidos de Markov

Plano. Aspectos Relevantes de HMMs. Teoria de HMMs. Introdução aos Modelos Escondidos de Markov Plano Esta apresentação é para pessoas sem conhecimento prévio de HMMs Introdução aos Modelos Escondidos de Markov 2004 Objetivos: Ensinar alguma coisa, não tudo (Visão geral, sem muitos detalhes). Tentar

Leia mais

TE802 Processos Estocásticos em Engenharia. Informação sobre a disciplina Notes. Processos Estocásticos em Engenharia Conteúdo Notes.

TE802 Processos Estocásticos em Engenharia. Informação sobre a disciplina Notes. Processos Estocásticos em Engenharia Conteúdo Notes. TE802 Processos Estocásticos em Engenharia Conceitos Básicos de Teoria de Probabilidade 7 de março de 2016 Informação sobre a disciplina Terças e Quintas feiras das 09:30 às 11:20 horas Professor: Evelio

Leia mais

2 Sentiment Analysis 2.1

2 Sentiment Analysis 2.1 2 Sentiment Analysis 2.1 Definição do Problema Sentiment Analysis é um problema de categorização de texto no qual deseja-se detectar opiniões favoráveis e desfavoráveis com relação a um determinado tópico

Leia mais

Verificação automática de substantivos compostos através de reconhecimento de padrões sintáticos

Verificação automática de substantivos compostos através de reconhecimento de padrões sintáticos Universidade Federal do Rio Grande do Sul Grupo de Processamento de Linguagens Naturais Projeto Expressões Multipalavras Verificação automática de substantivos compostos através de reconhecimento de padrões

Leia mais

Paradigmas de programação

Paradigmas de programação Paradigmas de programação 1 Paradigma? Um paradigma é algo que serve de exemplo ou modelo. Sinônimos: Padrão Prototipo 2 Paradigma de programação? É uma proposta tecnológica. Fornece uma visão do programador

Leia mais

Distorções Dinâmicas no Tempo & Pesquisa. Distorção dinâmica no tempo Pesquisa Algoritmos gráficos de pesquisa Algoritmos de programação dinâmica

Distorções Dinâmicas no Tempo & Pesquisa. Distorção dinâmica no tempo Pesquisa Algoritmos gráficos de pesquisa Algoritmos de programação dinâmica Distorções Dinâmicas no Tempo & Pesquisa Distorção dinâmica no tempo Pesquisa Algoritmos gráficos de pesquisa Algoritmos de programação dinâmica 1 Casamento de Template Baseado em Palavra Medida de Característica

Leia mais

O que fazemos com estas ferramentas?

O que fazemos com estas ferramentas? Definição: A estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisálos, interpretá-los e deles extrair conclusões (Triola, 1998). O que fazemos

Leia mais

MC3305 Algoritmos e Estruturas de Dados II. Aula 00 Apresentação. Prof. Jesús P. Mena-Chalco.

MC3305 Algoritmos e Estruturas de Dados II. Aula 00 Apresentação. Prof. Jesús P. Mena-Chalco. MC3305 Algoritmos e Estruturas de Dados II Aula 00 Apresentação Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 2Q-2015 1 Apresentação Professor: Jesús P. Mena-Chalco (CMCC) Formação: - Engenheiro da

Leia mais

3 Aprendizado supervisionado

3 Aprendizado supervisionado 3 Aprendizado supervisionado Neste capítulo será apresentado as técnicas para aprendizagem adotadas e como o sistema foi modelado para suportá-las. 3.1.Técnicas para aprendizado supervisionado Pesquisando

Leia mais

Uso de Técnicas e Informações para Potencializar Políticas de Substituição em Sistemas de Memória Virtual

Uso de Técnicas e Informações para Potencializar Políticas de Substituição em Sistemas de Memória Virtual Uso de Técnicas e Informações para Potencializar Políticas de Substituição em Sistemas de Memória Virtual Ricardo L. Piantola, Edson T. Midorikawa Departamento de Engenharia de Computação e Sistemas Digitais

Leia mais

PROBABILIDADE E ESTATÍSTICA. Aula 2 Professor Regina Meyer Branski

PROBABILIDADE E ESTATÍSTICA. Aula 2 Professor Regina Meyer Branski PROBABILIDADE E ESTATÍSTICA Aula 2 Professor Regina Meyer Branski Probabilidade 1. Conceitos básicos de probabilidade 2. Probabilidade condicional 3. Eventos Dependentes e Independentes 4. Regra da Multiplicação

Leia mais

Modelos de Linguagem N-grama para Reconhecimento de Voz com Grande Vocabulário

Modelos de Linguagem N-grama para Reconhecimento de Voz com Grande Vocabulário Modelos de Linguagem N-grama para Reconhecimento de Voz com Grande Vocabulário Ênio Silva, Marcus Pantoja, Jackline Celidônio e Aldebaro Klautau 1 Laboratório de Processamento de Sinais Universidade Federal

Leia mais

MCTA028 Programação Estruturada Aula 03: - Funções e procedimentos - Vetores e matrizes

MCTA028 Programação Estruturada Aula 03: - Funções e procedimentos - Vetores e matrizes MCTA28 Programação Estruturada Aula 3: - Funções e procedimentos - Vetores e matrizes Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 3Q-217 1 Funções 2 Funções (modularidade) Consiste em dividir uma

Leia mais

VETORES Motivação AULA 19

VETORES Motivação AULA 19 AULA 19 VETORES 19.1 Motivação Considere o problema de calcular a média aritmética das notas de 5 alunos de uma disciplina e determinar e escrever o número de alunos que obtiveram nota superior à média

Leia mais

I.2 Introdução a Teoria da Computação

I.2 Introdução a Teoria da Computação I.2 Introdução a Teoria da Computação O que é? Fundamento da Ciência da Computação Tratamento Matemático da Ciência da Computação Estudo Matemático da Transformação da Informação Qual sua importância?

Leia mais

Uma Abordagem de Extração de Terminologia Para a Construção de uma Representação Atributo-valor a Partir de Documentos Não Estruturados

Uma Abordagem de Extração de Terminologia Para a Construção de uma Representação Atributo-valor a Partir de Documentos Não Estruturados Uma Abordagem de Extração de Terminologia Para a Construção de uma Representação Atributo-valor a Partir de Documentos Não Estruturados Daniel de Faveri Honorato 1, Maria Carolina Monard 1, and Huei Diana

Leia mais

TP-DISCOVER: um ambiente computacional para auxílio no pré-processamento de laudos médicos não-estruturados

TP-DISCOVER: um ambiente computacional para auxílio no pré-processamento de laudos médicos não-estruturados TP-DISCOVER: um ambiente computacional para auxílio no pré-processamento de laudos médicos não-estruturados Daniel de Faveri Honorato 1, Maria Carolina Monard 2, Huei Diana Lee 1, Carlos Andres Ferrero

Leia mais

Expressões Regulares. Processamento Estatístico da Linguagem Natural. Expressões Regulares. Mais Expressões Regulares. Mais Expressões Regulares

Expressões Regulares. Processamento Estatístico da Linguagem Natural. Expressões Regulares. Mais Expressões Regulares. Mais Expressões Regulares Processamento Estatístico da Linguagem Natural Aula 3 Professora Bianca (Sala 302 Bloco E) bianca@ic.uff.br http://www.ic.uff.br/~bianca/peln/ Expressões Regulares Considere as seguintes tarefas: Procurar

Leia mais

Análise Sintática de Frases utilizando Gramáticas Livres de Contexto Probabilísticas

Análise Sintática de Frases utilizando Gramáticas Livres de Contexto Probabilísticas Universidade de São Paulo Mestrado em Ciência da Computação Instituto de Matemática e Estatística Disciplina MAC5725 Lingüística Computacional Análise Sintática de Frases utilizando Gramáticas Livres de

Leia mais

Aula 19 Conjuntos disjuntos (Union-find)

Aula 19 Conjuntos disjuntos (Union-find) MC3305 Algoritmos e Estruturas de Dados II Aula 19 Conjuntos disjuntos (Union-find) Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 2Q-2015 1 Números de Ackermann 2 3 Ackermann A função de Ackermann

Leia mais

Introdução ao tema das Redes Bayesianas

Introdução ao tema das Redes Bayesianas Introdução ao tema das Redes Bayesianas Seminário de Modelação Cátia Azevedo 25/01/2013 Índice Introdução Redes Bayesianas Aprendizagem Bayesiana Teorema de Bayes Distribuição de probabilidade conjunta

Leia mais

Combinação de Classificadores (fusão)

Combinação de Classificadores (fusão) Combinação de Classificadores (fusão) André Tavares da Silva andre.silva@udesc.br Livro da Kuncheva Roteiro Sistemas com múltiplos classificadores Fusão por voto majoritário voto majoritário ponderado

Leia mais

A velocidade de fala como marca de segmentação da narrativa espontânea. Miguel Oliveira, Jr. Instituto de Linguística Teórica e Computacional

A velocidade de fala como marca de segmentação da narrativa espontânea. Miguel Oliveira, Jr. Instituto de Linguística Teórica e Computacional A velocidade de fala como marca de segmentação da narrativa espontânea Miguel Oliveira, Jr. Instituto de Linguística Teórica e Computacional seja pronto para ouvir tardio para falar Tiago (1:19) 0. Introdução

Leia mais

Metodologia de inversão

Metodologia de inversão 6 Metodologia de inversão Nesta tese, a transformação de velocidades em pressão de poros é encarada como um problema de inversão. Pela natureza do problema, essa transformação apresenta caráter não único

Leia mais

Unidade 2: Sistemas de Numeração Numerais Binários e Bases de Potência de Dois Prof. Daniel Caetano

Unidade 2: Sistemas de Numeração Numerais Binários e Bases de Potência de Dois Prof. Daniel Caetano Arquitetura e Organização de Computadores Atualização: /8/ Unidade : Sistemas de Numeração Numerais Binários e Bases de Potência de Dois Prof. Daniel Caetano Objetivo: Apresentar as diferentes bases numéricas,

Leia mais

Apresentação do Curso

Apresentação do Curso Instituto Federal de Educação, Ciência e Tecnologia da Paraíba Programa de Pós-Graduação em Engenharia Elétrica Universidade Federal de Campina Grande Unidade Acadêmica de Sistemas e Computação Processamento

Leia mais

Aula 02: Custos de um algoritmo e funções de complexidade

Aula 02: Custos de um algoritmo e funções de complexidade MCTA028 Programação Estruturada Aula 02: Custos de um algoritmo e funções de complexidade Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 3Q-20106 1 Linguagem C: Tipos de dados 2 Linguagem C: Tipos

Leia mais

Teste de % de defeituosos para 1 amostra

Teste de % de defeituosos para 1 amostra DOCUMENTO OFICIAL DO ASSISTENTE DO MINITAB Este documento é de uma série de papéis que explicam a pesquisa conduzida por estatísticos da Minitab para desenvolver os métodos e as verificações de dados usadas

Leia mais

TÉCNICO DE INFORMÁTICA - SISTEMAS

TÉCNICO DE INFORMÁTICA - SISTEMAS 782 - Programação em C/C++ - estrutura básica e conceitos fundamentais Linguagens de programação Linguagem de programação são conjuntos de palavras formais, utilizadas na escrita de programas, para enunciar

Leia mais

27/02/2014. Tratamento de Incertezas TIC Aula 0. Conteúdo Apresentação da Disciplina. Motivação Programa da disciplina

27/02/2014. Tratamento de Incertezas TIC Aula 0. Conteúdo Apresentação da Disciplina. Motivação Programa da disciplina Tratamento de Incertezas TIC-00.176 Aula 0 Conteúdo Apresentação da Disciplina Professor Leandro Augusto Frata Fernandes laffernandes@ic.uff.br Material disponível em http://www.ic.uff.br/~laffernandes/teaching/2014.1/tic-00.176

Leia mais

Estatística Descritiva

Estatística Descritiva C E N T R O D E M A T E M Á T I C A, C O M P U T A Ç Ã O E C O G N I Ç Ã O UFABC Estatística Descritiva Centro de Matemática, Computação e Cognição March 17, 2013 Slide 1/52 1 Definições Básicas Estatística

Leia mais

Distribuições Amostrais e Estimação Pontual de Parâmetros

Distribuições Amostrais e Estimação Pontual de Parâmetros Distribuições Amostrais e Estimação Pontual de Parâmetros ESQUEMA DO CAPÍTULO 7.1 INTRODUÇÃO 7.2 DISTRIBUIÇÕES AMOSTRAIS E TEOREMA DO LIMITE CENTRAL 7.3 CONCEITOS GERAIS DE ESTIMAÇÃO PONTUAL 7.3.1 Estimadores

Leia mais

Combinando Mineração de Textos e Análise de Redes Sociais para a Identificação das Áreas de Atuação de Pesquisadores

Combinando Mineração de Textos e Análise de Redes Sociais para a Identificação das Áreas de Atuação de Pesquisadores Combinando Mineração de Textos e Análise de Redes Sociais para a Identificação das Áreas de Atuação de Pesquisadores Bruno K. O. Miyata 1, Vitor Y. Kano 1, Luciano A. Digiampietri 1 1 Escola de Artes,

Leia mais

MC3305 Algoritmos e Estruturas de Dados II. Aula 02 Hashing. Prof. Jesús P. Mena-Chalco.

MC3305 Algoritmos e Estruturas de Dados II. Aula 02 Hashing. Prof. Jesús P. Mena-Chalco. MC3305 Algoritmos e Estruturas de Dados II Aula 02 Hashing Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 2Q-2015 1 Sobre a busca de dados/chaves 2 Busca em tabelas (vetores/arrays) Para se resolver

Leia mais

CAPÍTULO 4 PROBABILIDADE PROBABILIDADE PPGEP Espaço Amostral e Eventos Espaço Amostral e Eventos UFRGS. Probabilidade.

CAPÍTULO 4 PROBABILIDADE PROBABILIDADE PPGEP Espaço Amostral e Eventos Espaço Amostral e Eventos UFRGS. Probabilidade. PROBABILIDADE CAPÍTULO 4 PROBABILIDADE UFRGS A Teoria das s estuda os fenômenos aleatórios. Fenômeno Aleatório: são os fenômenos cujo resultado não pode ser previsto exatamente. Se o fenômeno se repetir,

Leia mais

Extração Automática de Multipalavras

Extração Automática de Multipalavras Universidade de São Paulo USP Universidade Federal de São Carlos UFSCar Universidade Estadual Paulista UNESP Extração Automática de Multipalavras Aline M. Paz da Silva Maria das Graças V. Nunes NILC TR

Leia mais

LÓGICA APLICADA - GST0049 LÓGICA APLICADA (20/10/2014) Perfil Docente Especialista em Matemática, preferencialmente com pós-graduação stricto sensu na

LÓGICA APLICADA - GST0049 LÓGICA APLICADA (20/10/2014) Perfil Docente Especialista em Matemática, preferencialmente com pós-graduação stricto sensu na LÓGICA APLICADA - GST0049 LÓGICA APLICADA (20/10/2014) Perfil Docente Especialista em Matemática, preferencialmente com pós-graduação stricto sensu na área. Mestre ou Doutor em áreas afins. Experiência

Leia mais

SELEÇÃO PARA NOVOS ALUNOS TURMAS SÃO PAULO

SELEÇÃO PARA NOVOS ALUNOS TURMAS SÃO PAULO SELEÇÃO PARA NOVOS ALUNOS TURMAS SÃO PAULO 2 0 15 CONTEÚDOS DOS TESTES DE SELEÇÃO Para o 1º Ano do Ensino Médio LINGUAGENS, CÓDIGOS E SUAS TECNOLOGIAS LÍNGUA PORTUGUESA Norma ortográfica Grafia de vocábulos

Leia mais

A ELABORAÇÃO DE UM CATÁLOGO: CONSTRUÇÕES RECORRENTES EM TEXTOS DE PEDIATRIA PARA APRENDIZES DE TRADUÇÃO

A ELABORAÇÃO DE UM CATÁLOGO: CONSTRUÇÕES RECORRENTES EM TEXTOS DE PEDIATRIA PARA APRENDIZES DE TRADUÇÃO A ELABORAÇÃO DE UM CATÁLOGO: CONSTRUÇÕES RECORRENTES EM TEXTOS DE PEDIATRIA PARA APRENDIZES DE TRADUÇÃO Gustavo de Azambuja Feix (bolsista SEAD/UFRGS) Co-autoria: Maria Cristina Alencar Silva (voluntária

Leia mais

REUNIÃO DE PAIS 2 ANO ANDRÉA E LARISSA

REUNIÃO DE PAIS 2 ANO ANDRÉA E LARISSA REUNIÃO DE PAIS 2 ANO - 2013 ANDRÉA E LARISSA PROPÓSITOS DA REUNIÃO Apresentar o trabalho do ano letivo Tratar assuntos de interesse Notícias do grupo ROTINA AULAS LÍNGUA PORTUGUESA 4 AULAS DE 40 MINUTOS

Leia mais

Série: 1 Ano. 1º Período HABILIDADES CONTEÚDOS

Série: 1 Ano. 1º Período HABILIDADES CONTEÚDOS História, Geografia e Ciências 1º Período - Quem sou eu? - O que muda com o tempo. - Você criança. - Datas Comemorativas: Carnaval, Páscoa, Dia internacional da Mulher, índio, Tiradentes, Descobrimento

Leia mais

Estatística Básica. Probabilidade. Renato Dourado Maia. Instituto de Ciências Agrárias. Universidade Federal de Minas Gerais

Estatística Básica. Probabilidade. Renato Dourado Maia. Instituto de Ciências Agrárias. Universidade Federal de Minas Gerais Estatística Básica Probabilidade Renato Dourado Maia Instituto de Ciências Agrárias Universidade Federal de Minas Gerais Lembrando... O que é Probabilidade? 2/29 Leitura Recomendada Na página da disciplina

Leia mais

Processamento da Informação Teoria. Exercícios sobre strings

Processamento da Informação Teoria. Exercícios sobre strings Processamento da Informação Teoria Exercícios sobre strings Semana 04 Prof. Jesús P. Mena-Chalco 18/05/2013 Uma string é uma sequência Uma string (cadeia) é uma sequência de caracteres. Podemos acessar

Leia mais

IA - Planejamento II

IA - Planejamento II PO IA - Planejamento II Professor Paulo Gurgel Pinheiro MC906A - Inteligência Articial Instituto de Computação Universidade Estadual de Campinas - UNICAMP 16 de Novembro de 2010 1 / 48 PO http://www.ic.unicamp.br/

Leia mais

INE5317 Linguagens Formais e Compiladores AULA 3: Introdução a Teoria da Computação

INE5317 Linguagens Formais e Compiladores AULA 3: Introdução a Teoria da Computação INE5317 Linguagens Formais e Compiladores AULA 3: Introdução a Teoria da Computação bas eado em material produzido pelo prof Olinto Jos é Varela Furtado Ricardo Azambuja Silveira INE-CTC-UFSC E-Mail: silveira@inf.ufsc.br

Leia mais

Bases Computacionais da Ciência (BC-0005)

Bases Computacionais da Ciência (BC-0005) Bases Computacionais da Ciência (BC-0005) Base de Dados Jesús P. Mena-Chalco Jesus.mena@ufabc.edu.br Centro de Matemática, Computação e Cognição (CMCC) Universidade Federal do ABC Slides (UFABC) adaptados

Leia mais

6EMA Lucas Santana da Cunha 19 de abril de Universidade Estadual de Londrina

6EMA Lucas Santana da Cunha  19 de abril de Universidade Estadual de Londrina ESTATÍSTICA ECONÔMICA 6EMA020-2000 lscunha@uel.br http://www.uel.br/pessoal/lscunha/ Universidade Estadual de Londrina 19 de abril de 2017 1 o Bimestre Plano do Curso Cronograma Critério de Avaliação Bibliografia

Leia mais

Inferência Bayesiana - Aula 1 -

Inferência Bayesiana - Aula 1 - Inferência Bayesiana - Aula 1 - Márcia D Elia Branco Universidade de São Paulo Instituto de Matemática e Estatística www.ime.usp.br/ mbranco - sala 295-A - Paradigmas Bayesiano Introdução Fazer inferência

Leia mais

Compressão de Textos. Introdução. Introdução. Introdução. O volume de informação textual disponível on-line é imenso:

Compressão de Textos. Introdução. Introdução. Introdução. O volume de informação textual disponível on-line é imenso: Compressão de Textos Estrutura de Dados II Prof. Guilherme Tavares de Assis Universidade Federal de Ouro Preto UFOP Instituto de Ciências Exatas e Biológicas ICEB Departamento de Computação DECOM O volume

Leia mais

PROGRAMAÇÃO E ALGORITMOS (LEI, TSI) Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2016/2017

PROGRAMAÇÃO E ALGORITMOS (LEI, TSI) Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2016/2017 PROGRAMAÇÃO E ALGORITMOS (LEI, TSI) Universidade da Beira Interior, Departamento de Informática Hugo Pedro Proença, 2016/2017 Página da Disciplina http://www.di.ubi.pt/~hugomcp/progalg Avaliação. n Consulta

Leia mais

DO SINGULAR AO PLURAL: A APRENDIZAGEM INICIAL DA LEITURA E DA ESCRITA

DO SINGULAR AO PLURAL: A APRENDIZAGEM INICIAL DA LEITURA E DA ESCRITA DO SINGULAR AO PLURAL: A APRENDIZAGEM INICIAL DA LEITURA E DA ESCRITA VINÍCIUS ADRIANO DE FREITAS E-MAILS: vinicius.freitas@unifamma.edu.br viniadriano@hotmail.com OS ESPAÇOS DISCURSIVOS NA ESCOLA (BRASIL,

Leia mais

Trabalho Prático 1. Valor: 1,0 pontos (10% da nota total) Data de Entrega: 02/05/2010

Trabalho Prático 1. Valor: 1,0 pontos (10% da nota total) Data de Entrega: 02/05/2010 Universidade Federal de Ouro Preto Instituto de Ciências Exatas e Biológicas Programa de Pós-Graduação em Ciência da Computação Projeto e Análise de Algoritmos - 1 o semestre de 2010 Professor: David Menotti

Leia mais

Linguagens Formais e Autômatos (LFA)

Linguagens Formais e Autômatos (LFA) Linguagens Formais e Autômatos (LFA) Aula de 12/08/2013 Introdução 1 2 Grade Curricular para Ciência da Computação 3 Grade Curricular para Engenharia da Computação Grade Curricular para Sistemas de Informação

Leia mais

UMA ANÁLISE BAYESIANA DO PERFIL COR/RAÇA DOS INDIVÍDUOS QUE TEM CURSO SUPERIOR NO BRASIL

UMA ANÁLISE BAYESIANA DO PERFIL COR/RAÇA DOS INDIVÍDUOS QUE TEM CURSO SUPERIOR NO BRASIL ISSN 2175-6295 Rio de Janeiro- Brasil, 08 e 09 novembro de 2007. SPOLM 2007 UMA ANÁLISE BAYESIANA DO PERFIL COR/RAÇA DOS INDIVÍDUOS QUE TEM CURSO SUPERIOR NO BRASIL Giovani Glaucio de Oliveira Costa Universidade

Leia mais

Reconhecimento de Tipos de Movimento Humano baseados no método GMM.

Reconhecimento de Tipos de Movimento Humano baseados no método GMM. Reconhecimento de Tipos de Movimento Humano baseados no método GMM. C.Gonçalves 1 ; L.A.Pereira; J.C.Pizolato, Jr.; A.Gonzaga. Escola de Engenharia de São Carlos-EESC-USP Av. Trab. São-Carlense, 400 CP

Leia mais

Extração de paráfrases em português a partir de léxicos bilíngues: um estudo de caso

Extração de paráfrases em português a partir de léxicos bilíngues: um estudo de caso Extração de paráfrases em português a partir de léxicos bilíngues: um estudo de caso Paulo César Polastri 1,2, Helena de Medeiros Caseli 1,2, Eloize Rossi Marques Seno 2,3 1 Departamento de Computação,

Leia mais

Determinação do Grau de Similaridade entre Frases

Determinação do Grau de Similaridade entre Frases Determinação do Grau de Similaridade entre Frases UC 21095 Projeto Final Licenciatura em Informática Estudante nº 1100194: Helena Sofia Felisberto Coelho Orientadora: Prof.ª Gracinda Carvalho Lisboa, setembro

Leia mais

Aula 13: Listas encadeadas (estruturas lineares)

Aula 13: Listas encadeadas (estruturas lineares) Algoritmos e Estruturas de Dados I Aula 13: Listas encadeadas (estruturas lineares) Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 1Q-2017 1 Estruturas (alguns autores usam o termo registro) 2 Linguagem

Leia mais

Inteligência Artificial. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional

Inteligência Artificial. Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional Inteligência Artificial Prof. Esp. Pedro Luís Antonelli Anhanguera Educacional OBJETIVOS : Introduzir o estudo Processamento de Linguagem Natural. Histórico O processamento de linguagem natural, nasceu

Leia mais

Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais. Prof. Adilson Gonzaga

Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais. Prof. Adilson Gonzaga Aula 7 - Representação e Descrição de Estruturas Bi-dimensionais Prof. Adilson Gonzaga 1 Introdução Objetos ou Segmentos são representados como uma coleção de pixels em uma imagem. Para o reconhecimento

Leia mais

Programação III 2016/1

Programação III 2016/1 Programação III 2016/1 Vítor E. Silva Souza (vitor.souza@ufes.br) http://www.inf.ufes.br/~vitorsouza Departamento de Informática Centro Tecnológico Universidade Federal do Espírito Santo Antes de mais

Leia mais

Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação

Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação Universidade Federal do Rio Grande do Sul Instituto de Informática Programa de Pós-Graduação em Computação Identificação e Tratamento de Expressões Multipalavras aplicado à Recuperação de Informação Otávio

Leia mais

Distribuições Estatísticas

Distribuições Estatísticas Distribuições Estatísticas Para darmos sequência ao estudo da estatística, será necessário conhecer um pouco mais sobre as distribuições mais utilizadas, como distribuição normal, distribuição Gama, distribuição

Leia mais

Corretor Gramatical Para o Emacs

Corretor Gramatical Para o Emacs Trabalho de Conclusão de Curso Thiago Maciel batista Orientador: Prof. Dr. Marcelo Finger Instituto de Matemática e Estatística Universidade de São Paulo 16 de novembro de 2010 Roteiro 1 Introdução 2 Processamento

Leia mais

47 = 1349 (ou multiplicando por 100 para converter para porcentagem: 3,5%).

47 = 1349 (ou multiplicando por 100 para converter para porcentagem: 3,5%). Probabilidade Elementar Probabilidade e Estatística I Antonio Roque Aula 9 Fundamentos A tabela a seguir apresenta freqüências associadas a classes de níveis de colesterol no soro de uma amostra de homens

Leia mais

Análise Decisional: integridade e validação Por: Lionel Morgado Susana Silva

Análise Decisional: integridade e validação Por: Lionel Morgado Susana Silva Análise Decisional: integridade e validação Por: Lionel Morgado Susana Silva Algoritmos de Diagnóstico e de Auto-Regulação FCTUC 07-08 1 DIAGNÓSTICO DIAGNÓSTICO - em Medicina é o processo analítico de

Leia mais

Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto

Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto Comparação dos algoritmos sequencial e paralelo para contagem de palavras e contexto Eduardo Delazeri Ferreira, Francieli Zanon Boito, Aline Villavicencio 1. Introdução 1 Instituto de Informática - Universidade

Leia mais

2 Modelos de sintetização de séries temporais de atenuação por chuva

2 Modelos de sintetização de séries temporais de atenuação por chuva 2 Modelos de sintetização de séries temporais de atenuação por chuva Alguns modelos estocásticos de sintetização de séries temporais de atenuação por chuva são baseados no modelo proposto por Maseng &

Leia mais

ÍNDICE. Introdução 5. p b 9. t d 15. q g 21. f v 27. s z 33. x j 39. m n 45. nh lh 49. r l 53. r rr 59. a e i o u 63. Cartões de sons 69

ÍNDICE. Introdução 5. p b 9. t d 15. q g 21. f v 27. s z 33. x j 39. m n 45. nh lh 49. r l 53. r rr 59. a e i o u 63. Cartões de sons 69 ÍNDICE Introdução 5 p b 9 t d 15 q g 21 f v 27 s z 33 x j 39 m n 45 nh lh 49 r l 53 r rr 59 a e i o u 63 Cartões de sons 69 3 INTRODUÇÃO Aprender a falar é um processo natural e espontâneo em que a criança

Leia mais

Processamento de Imagem. Histograma da Imagem Professora Sheila Cáceres

Processamento de Imagem. Histograma da Imagem Professora Sheila Cáceres Processamento de Imagem Histograma da Imagem Professora Sheila Cáceres Histograma É a distribuição de frequência dos níveis de cinza da imagem onde cada entrada no eixo x representa o nível de cinza específico

Leia mais

Aprendizado Bayesiano Anteriormente...

Aprendizado Bayesiano Anteriormente... Aprendizado Bayesiano Anteriormente... Conceito de Probabilidade Condicional É a probabilidade de um evento A dada a ocorrência de um evento B Universidade de São Paulo Instituto de Ciências Matemáticas

Leia mais

Computaçã. Visão Geral. Sistema Gráfico. Computação Gráfica. Pixels. Sistema Gráfico e o Frame Buffer. Introdução à Computação Gráfica

Computaçã. Visão Geral. Sistema Gráfico. Computação Gráfica. Pixels. Sistema Gráfico e o Frame Buffer. Introdução à Computação Gráfica Visão Geral Computaçã ção o Gráfica Introduçã ção, conceitos básicosb sicos, áreas relacionadas Introdução à Computação Gráfica Como funciona um sistema gráfico Como imagens são representadas Áreas relacionadas,

Leia mais

3ª Gustavo Lopes. Competência Objeto de aprendizagem Habilidade

3ª Gustavo Lopes. Competência Objeto de aprendizagem Habilidade Matemática 3ª Gustavo Lopes 7º Ano E.F. Competência Objeto de aprendizagem Habilidade Competência 3 Foco: Espaço e forma Utilizar o conhecimento geométrico para realizar a leitura e a representação da

Leia mais

English version at the end of this document

English version at the end of this document English version at the end of this document Ano Letivo 2016-17 Unidade Curricular ANÁLISE GRAMATICAL Cursos LÍNGUAS E COMUNICAÇÃO (1.º ciclo) LÍNGUAS, LITERATURAS E CULTURAS (1.º ciclo) - RAMO DE ESTUDOS

Leia mais

Árvores e Florestas Probabilísticas

Árvores e Florestas Probabilísticas Árvores e Florestas Probabilísticas e como elas ajudam a distinguir os ritmos do Português Brasileiro e do Português Europeu Instituto de Matemática e Estatística Universidade de São Paulo Colaboradores

Leia mais

Abordagens na Tradução Automática

Abordagens na Tradução Automática Abordagens na Tradução Automática Alberto Manuel Brandão Simões ambs@di.uminho.pt Escola de Verão Junho 2009 Alberto Simões Abordagens na Tradução Automática (1/38) 1 Arquitecturas de Tradução Automática

Leia mais

INF 1771 Inteligência Artificial

INF 1771 Inteligência Artificial Edirlei Soares de Lima INF 1771 Inteligência Artificial Aula 15 Árvores de Decisão Árvores de Decisão Uma das formas de algoritmo de aprendizado mais simples e de maior sucesso.

Leia mais

Para ajudar a interpretar os resultados, o Cartão de Relatórios do Assistente do teste de % de defeituosos para 1 amostra exibe os seguintes

Para ajudar a interpretar os resultados, o Cartão de Relatórios do Assistente do teste de % de defeituosos para 1 amostra exibe os seguintes Este documento é de uma série de papéis que explicam a pesquisa conduzida por estatísticos da Minitab para desenvolver os métodos e as verificações de dados usadas no assistente no software estatístico

Leia mais

Aula 10 Estimação e Intervalo de Confiança

Aula 10 Estimação e Intervalo de Confiança Aula 10 Estimação e Intervalo de Confiança Objetivos da Aula Fixação dos conceitos de Estimação; Utilização das tabelas de Distribuição Normal e t de Student Introdução Freqüentemente necessitamos, por

Leia mais

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU

Organizaçãoe Recuperaçãode Informação GSI521. Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Organizaçãoe Recuperaçãode Informação GSI521 Prof. Dr. Rodrigo Sanches Miani FACOM/UFU Pré-processamento de documentos Organização e Recuperação de Informação(GSI521) Introdução O pré-processamento de

Leia mais

Linguagem Python. Processamento Estatístico da Linguagem Natural. Barra invertida em strings. Strings. Aspas triplas. Operações com Strings

Linguagem Python. Processamento Estatístico da Linguagem Natural. Barra invertida em strings. Strings. Aspas triplas. Operações com Strings Processamento Estatístico da Linguagem Natural Aula 7 Professora Bianca (Sala 302 Bloco E) bianca@ic.uff.br http://www.ic.uff.br/~bianca/peln/ Linguagem Python Introdução Características de Python Rodando

Leia mais

CCM002 Metodologia de Pesquisa em Ciência da Computação Preparação de um trabalho de pesquisa: - Objetivo - Revisão bibliográfica

CCM002 Metodologia de Pesquisa em Ciência da Computação Preparação de um trabalho de pesquisa: - Objetivo - Revisão bibliográfica CCM002 Metodologia de Pesquisa em Ciência da Computação Preparação de um trabalho de pesquisa: - Objetivo - Revisão bibliográfica Prof. Jesús P. Mena-Chalco jesus.mena@ufabc.edu.br 3Q-2017 1 Atividade

Leia mais

Extração de características: textura

Extração de características: textura Extração de características: textura Image Processing scc0251 www.icmc.usp.br/ moacir moacir@icmc.usp.br ICMC/USP São Carlos, SP, Brazil 2011 Moacir Ponti (ICMCUSP) Extração de características: textura

Leia mais

PROBABILIDADE E ESTATÍSTICA. Profa. Dra. Yara de Souza Tadano

PROBABILIDADE E ESTATÍSTICA. Profa. Dra. Yara de Souza Tadano PROBABILIDADE E ESTATÍSTICA Profa. Dra. Yara de Souza Tadano yaratadano@utfpr.edu.br Aula 5 09/2014 Probabilidade Espaços Amostrais e Eventos Probabilidade e Estatística 3/41 Experimentos Aleatórios Experimento

Leia mais

Probabilidade. Luiz Carlos Terra

Probabilidade. Luiz Carlos Terra Luiz Carlos Terra Nesta aula, você conhecerá os conceitos básicos de probabilidade que é a base de toda inferência estatística, ou seja, a estimativa de parâmetros populacionais com base em dados amostrais.

Leia mais

Processamento da Informação Teoria. Strings

Processamento da Informação Teoria. Strings Processamento da Informação Teoria Strings Semana 04 Prof. Jesús P. Mena-Chalco 15/05/2013 Das aulas anteriores... Vimos vários tipos de dados: int, float, long, string Stings são qualitativamente diferentes

Leia mais

ANEXO VII DO CONTEÚDO PROGRAMADO DAS PROVAS OBJETIVAS

ANEXO VII DO CONTEÚDO PROGRAMADO DAS PROVAS OBJETIVAS ANEXO VII DO CONTEÚDO PROGRAMADO DAS PROVAS OBJETIVAS PARA TODOS OS CARGOS: CONHECIMENTOS GERAIS EM EDUCAÇÃO: Projeto Político Pedagógico: princípios e metodologias de planejamento, sistematização, execução,

Leia mais