Processamento Estatístico da Linguagem Natural



Documentos relacionados
Aula de Hoje. Processamento Estatístico da Linguagem Natural. Bottom-Up Filtering. Ambiguidade. Combinando Top-Down e Bottom-Up

Aula de Hoje. Processamento Estatístico da Linguagem Natural. Decodificação. Decodificação. A treliça do algoritmo Viterbi

28/04/2011 SINTAXE PARTE 1. SCC5908 Tópicos em Processamento de Língua Natural. Thiago A. S. Pardo SINTAXE E GRAMÁTICAS

Matemática Discreta. Leandro Colombi Resendo. Matemática Discreta Bacharel em Sistemas de Informações

Teoria de Jogos. Algoritmo Minimax e Alfa-Beta AED


17/09/2010 SINTAXE PARTE 1. SCC5869 Tópicos em Processamento de Língua Natural. Thiago A. S. Pardo SINTAXE E GRAMÁTICAS

Ano: 8 Turmas: 8.1 e 8.2

Medidas e Escalas: Escalas não Comparativas

Proporcionar a modelagem de sistemas utilizando todos os conceitos da orientação a objeto;

Curso: Letras Português/Espanhol. Disciplina: Linguística. Docente: Profa. Me. Viviane G. de Deus

Algoritmos e Programação : Conceitos e estruturas básicas. Hudson Victoria Diniz

Árvore de Decisão. 3. Árvore de Decisão

Como Fazer uma Monografia

EXAMES DE PROFICIÊNCIA EM LEITURA EM LÍNGUA ESTRANGEIRA SEGUNDO SEMESTRE DE 2012 INGLÊS - ESPANHOL

Prova de Conhecimentos Específicos

Gramáticas Livres de Contexto

Inteligência Artificial IA I. MÉTODOS DE BUSCA

ROTEIRO DE ESTUDO 2ª AVALIAÇÃO MENSAL ENSINO FUNDAMENTAL I TARDE

Aula 36.1 Conteúdos: Período simples e composto; Coordenação LÍNGUA PORTUGUESA FORTALECENDO SABERES DINÂMICA LOCAL INTERATIVA CONTEÚDO E HABILIDADES

Introdução. Liliane Santana

Análise Léxica. Sumário

Medidas de Tendência Central

TOM, SEMITOM, SUSTENIDO, BEMOL.

Relatório das Provas da 2ª. Fase - Vestibular 2016

Árvores de Decisão Matemática Discreta

PERSISTÊNCIA DO PODER POLÍTICO E DESENVOLVIMENTO ECONÔMICO: O CASO DA TRANSIÇÃO DE REGIME NO BRASIL

d) usar um pronome (a apontação ostensiva) numa localização particular quando a referência for óbvia;

Metodologias de Programação

Universidade Federal do ABC Disciplina: Natureza da Informação Lista de Exercícios 02 Códigos e conversão A/D Prof. João Henrique Kleinschmidt

2.Diferenças semânticas entre as orações subordinadas adjetivas. 3.Funções sintáticas dos pronomes relativos nas orações adjetivas.

Introdução à Inteligência Artificial 2007/08

A escrita antes de aprender a escrever, isto é, como as crianças se vão apropriando do sistema de linguagem escrita

Introdução. Ou seja, de certo modo esperamos que haja uma certa

Montadores e Compiladores

ME613 - Análise de Regressão


3.3 Qual o menor caminho até a Escola? 28 CAPÍTULO 3. CICLOS E CAMINHOS

LÍNGUA PORTUGUESA EBSERH HOSPITAIS UNIVERSITÁRIOS FEDERAIS BIOMÉDICO. Sobre a origem de tudo Marcelo Gleiser

Avaliação Diagnóstica de Língua Portuguesa

Circuitos Aritméticos

PROJETO DE REDES Prof. José Maurício S. Pinheiro UniFOA

Análise do adjetivo no livro didático

3 Modelo Cinemático do Veículo

Representação de Circuitos Lógicos

Engenharia de Software

Universidade de São Paulo. Escola de Comunicação e Artes, ECA-USP

AULA 11 Experimentos Multinomiais e Tabelas de Contingência

LISTA DE EXERCÍCIOS PARA RECUPERAÇÃO PARALELA PORTUGUÊS

Objetivos. Material a ser utilizado. - Cópias da avaliação. Procedimentos

Aula3 ESTUDOS CULTURAIS E PRODUÇÃO DISCURSIVA DA NATUREZA. Marlécio Maknamara

Análise Sintática. Análise Sintática. Tipos de Analisadores Gramáticais: PARSERS

BCC202 - Estrutura de Dados I

Business intelligence para empresas de segurança. Como uma instituição pode gerar recursos e errar menos com ajuda da informação

Um Tradutor Dirigido por Sintaxe

4 As concepções de objeto direto

Conjuntos mecânicos II

PESQUISA SOBRE GRAMÁTICA NORMATIVA: SEMELHANÇAS E DIFERENÇAS EM CEGALLA, BECHARA, CELSO CUNHA E ROCHA LIMA.

Métodos Quantitativos Aplicados

Herança. Prof. Leonardo Barreto Campos 1

AULA : DICAS PARA UMA BOA REDAÇÃO

PLANEJAMENTO (LIVRO INFANTIL) NOME DO LIVRO: O MENINO QUE APRENDEU A VER

Ano: 9 Turma: 9.1 / 9.2

Modulo II Padrões GRASP

Diferenças entre termo profundo e termo de superfície e os mecanismos da variação nas linguagens de especialidade

Não Não Sim Não Sim Sim

Orientações gerais. Apresentação

Árvores Parte 1. Aleardo Manacero Jr. DCCE/UNESP Grupo de Sistemas Paralelos e Distribuídos

INF 1010 Estruturas de Dados Avançadas

Jogos Bayesianos Estratégias e Equilíbrio Aplicações. Jogos Bayesianos. Prof. Leandro Chaves Rêgo

INF 1010 Estruturas de Dados Avançadas. Indexação em Espaços Multidimensionais DI, PUC-Rio Estruturas de Dados Avançadas 2012.

Agora vamos assistir a uma apresentação da Profª. Ms. Eliana Nagamini sobre os Gêneros Textuais Técnico-profissionais. Ao final desta unidade

Nome: Sexo: ( )F ( )M. 1. Você cursou ou cursa Inglês em uma escola de idiomas ou com professor particular? Sim ( ) Não ( )

Onde está o peso extra? Série Problemas e Soluções. Objetivos 1. Estudar uma estratégia que valoriza ao máximo as informações disponíveis.

ENSAIO SOBRE AS FASES DA LUA

COMPUTAÇÃO. O estudante deve ser capaz de apontar algumas vantagens dentre as seguintes, quanto à modalidade EaD:

Aula 01 Introdução Custo de um algoritmo, Funções de complexidad e Recursão

PROBABILIDADE: DIAGRAMAS DE ÁRVORES

No outono e inverno: Na primavera e no verão: As estações do ano (Pp. 95 a 101) Estações do ano. Manual

Processo Seletivo Conteúdo Programático - 1º ano do Ensino Fundamental

Gerência de Memória. Algoritmos de Substituição de Páginas

Boas situações de Aprendizagens. Atividades. Livro Didático. Currículo oficial de São Paulo

Vinte Palpites Teoria da Informação

3 DERIVAÇÃO IMPRÓPRIA E CONVERSÃO CATEGORIAL

Isomorfismos de Grafos, Grafos Planares e Árvores

Entendendo a Física - Prof. Panosso

Circuitos Seqüenciais

Classificação da Pesquisa:

Escrita de Relatórios

USO EFETIVO DO SÍMBOLO

5. O Mapa de Karnaugh

Algoritmos de Busca Local. Prof. Sheila Cáceres.Material baseado no livro de Inteligência Artificial de Russel e Norvig, Capítulo 4, Seções 3 4.

Algoritmos. Prof. Jonatas Bastos

Transcrição:

Processamento Estatístico da Linguagem Natural Aula 18 Professora Bianca (Sala 302 Bloco E) bianca@ic.uff.br http://www.ic.uff.br/~bianca/peln/ Aula 18-13/11/2008 1

Aula de Hoje Cap. 12 Jurafsky & Martin Gramáticas Formais de Inglês Seções 12.4, 12.5 e 12.7 Cap. 13 Jurafsky & Martin Parsing Sintático Seções 13.1 Aula 18-13/11/2008 2

Treebanks Um treebank é um corpus com anotações de sintaxe. Tem um papel importante para o parsing e na investigação empírica de fenômenos sintáticos. O projeto Penn Treebank produziu (semi-automaticamente) treebanks para uma variedade de corpora. Brown, Switchboard, ATIS e Wall Street Journal, além de corpora em outras línguas. Aula 18-13/11/2008 3

Exemplos de Treebanks Aula 18-13/11/2008 4

Outro exemplo Aula 18-13/11/2008 5

Cabeças Léxicas Cada agrupamento pode ser associado com uma cabeça léxica. A cabeça é a palavra ou conjunto de palavras gramaticalmente mais importante. N é a cabeça de um NP V é a cabeça de um VP. Cabeças são úteis para alguns tipos de parsing. Parsing lexicalizado. Treebanks atuais usam um conjunto de regras fixas para determinar as cabeças. Aula 18-13/11/2008 6

Exemplo: Cabeças Léxicas Aula 18-13/11/2008 7

Equivalência de Gramáticas e Forma Normal de Chomsky Duas gramáticas são equivalentes De maneira fraca: se elas geram as mesmas seqüências de palavras. De maneira forte: se elas geram as mesmas seqüências de palavras, com as mesmas estruturas. Alguns algoritmos de parsing necessitam que a gramática esteja em uma forma normal. Exemplo: CNF = Forma Normal de Chomsky Aula 18-13/11/2008 8

Forma Normal de Chomsky Uma gramática está em CNF se todas regras são da forma A B C ou A a. Gramáticas em CNF são gramáticas de ramificação binária, isto é, elas geram árvores sintáticas binárias (até o nível préléxico). Toda gramática pode ser convertida em CNF. Aula 18-13/11/2008 9

Gramáticas de Dependência Tipo de formalismo diferente das gramáticas livres de contexto. Agrupamentos e regras sobre a estrutura da frase não têm um papel fundamental. Ao invés disso, a estrutura sintática é descrita puramente em termos das palavras e relações binárias sintáticas ou semânticas entre elas. Aula 18-13/11/2008 10

Gramáticas de Dependência Aula 18-13/11/2008 11

Gramáticas de Dependência Vantagens: Poder preditivo que as palavras exibem em relação aos seu dependentes, o que facilita o parsing. Saber a identidade do verbo ajuda a decidir que substantivo é o sujeito e qual é o objeto. Capacidade de lidar com línguas que tenham uma liberdade maior na ordem das palavras. Uma CFG teria que listar todas as possibilidades. Aula 18-13/11/2008 12

Relações entre dependências e cabeças Um grafo de dependência não-rotulado pode ser automaticamente derivado de um parse livre-de-contexto. Algoritmo: Marque a cabeça de cada nó da árvore do parse. Na estrutura de dependência, faça a cabeça de cada filho (que não seja cabeça) depender da cabeça de seu pai. Aula 18-13/11/2008 13

Exemplo Aula 18-13/11/2008 14

Parsing Sintático Parsing sintático = tarefa de reconhecer uma frase e atribuir uma estrutura sintática a ela. Capítulo 13: três algoritmos baseados em gramáticas livre-de-contexto para fazer o parsing. Cocke-Kasami-Younger (CKY) Earley Chart Parsing Aula 18-13/11/2008 15

Parsing como Busca O parsing pode ser visto como uma busca no espaço de árvores de parse para uma determinada frase. O espaço de busca é restringido pela gramática e pelas palavras da frase. Estratégias de busca: Top-down Bottom-up Aula 18-13/11/2008 16

Gramática L 1 Aula 18-13/11/2008 17

Exemplo: Árvore de Parse Aula 18-13/11/2008 18

Parsing Top-Down Começa a partir do nó raiz S e desce em direção às folhas. Tenta todas as possibilidades até chegar às folhas. Mantém a árvore que tiver as folhas de acordo com a frase em questão. Aula 18-13/11/2008 19

Parsing Bottom-Up Começa com as palavras da frase e tenta construir a árvore a partir das palavras subindo em direção à raiz. O parse tem sucesso se conseguimos chegar à raiz S. Aula 18-13/11/2008 20

Parsing Bottom-Up Aula 18-13/11/2008 21

Comparação Top-Down vs. Bottom-Up O top-down não perde tempo explorando árvores que não podem gerar um S. O bottom-up não perde tempo explorando árvores que não são consistentes com a frase em questão. Aula 18-13/11/2008 22