MAB Análise Semântica. Monday, October 10, 11

Documentos relacionados
MAB Análise Semântica. Wednesday, May 23, 12

Introdução à Geração de Código

Análise Sintática Bottom-up

FACULDADE LEÃO SAMPAIO

Compiladores Geração de Código

Universidade de Santa Cruz do Sul UNISC Departamento de informática COMPILADORES. Introdução. Geovane Griesang

Compiladores. Motivação. Tradutores. Motivação. Tipos de Tradutores. Tipos de Tradutores

Introdução. Compiladores Análise Semântica. Introdução. Introdução. Introdução. Introdução 11/3/2008

Análise Semântica. Eduardo Ferreira dos Santos. Outubro, Ciência da Computação Centro Universitário de Brasília UniCEUB 1 / 40

Compiladores Análise Semântica

Lembrando análise semântica. Compiladores. Implementação de esquemas de tradução L-atribuídos. Exemplo de implementação top-down (1)

Compiladores. Bruno Lopes. Bruno Lopes Compiladores 1 / 32. Instituto de C

Compiladores - Análise SLR

Compiladores Ambiente de Execução

Um Compilador Simples. Definição de uma Linguagem. Estrutura de Vanguarda. Gramática Livre de Contexto. Exemplo 1

Compiladores Análise Semântica

Compiladores Ambiente de Execução

Análise Sintática - Final

Universidade Federal de Goiás Bacharelado em Ciências da Computacão Compiladores

Nomes, vinculações e escopos

V.2 Especificação Sintática de Linguagens de Programação

CP Compiladores I Prof. Msc.. Carlos de Salles

PLANO DE UNIDADE DIDÁTICA- PUD

Introdução à Programação Aula 03. Prof. Max Santana Rolemberg Farias Colegiado de Engenharia de Computação

Linguagem de Programação e Compiladores

Compiladores. Fabio Mascarenhas

Linguagens de Programação Aula 3

Conceitos de Linguagens de Programação

Compiladores e Computabilidade

O que é uma variável?

Universidade de Santa Cruz do Sul UNISC Departamento de informática COMPILADORES. Síntese. Prof. Geovane Griesang

EA876 - Introdução a Software de Sistema

V Teoria de Parsing. Termos Básicos: Parser Analisador Sintático Parsing Analise Sintática Parse Representação da analise efetuada

Análise semântica. Função, interação com o compilador Tabela de símbolos Análise semântica. Prof. Thiago A. S. Pardo

Construção de Compiladores. Capítulo 1. Introdução. José Romildo Malaquias. Departamento de Computação Universidade Federal de Ouro Preto 2014.

CAP. VI ANÁLISE SEMÂNTICA

Compiladores - Especificando Sintaxe

Análise Semântica e Representação Intermédia

Compiladores - Análise Recursiva

Conceitos de Linguagens de Programação - Características. Paavo Soeiro

Fundamentos de Programação

Compiladores. Bruno Lopes. Bruno Lopes Compiladores 1 / 30. Instituto de C

Compiladores. Introdução

As fases de um compilador

Compiladores Análise de Tipos

Ambientes de Execução

Ambientes de Execução

Compiladores. Gerência de Memória

Pró-Reitoria Acadêmica Diretoria Acadêmica Assessoria Pedagógica da Diretoria Acadêmica

Especificações Gerais do Compilador e Definição de FRANKIE

INE5421 LINGUAGENS FORMAIS E COMPILADORES

Linguagens de Domínio Específico

Conceitos de Linguagens de Programação

Compiladores Análise de Tipos

Compiladores - Análise Recursiva

MAB Compiladores I Introdução

Introdução Uma linguagem de programação apoiada em um paradigma imperativo apresenta algum grau de dificuldade nos aspectos relativos ao contexto;

Análise Semântica: Verificação de Tipos

Universidade Estadual da Paraíba - UEPB Curso de Licenciatura em Computação

Linguagens de Programação Aula 11

Linguagem C Princípios Básicos (parte 1)

Compiladores - Análise Ascendente

Introdução à Ciência da Computação. Prof. Dr. Rogério Vargas

Introdução à Programação

II.1 Conceitos Fundamentais. Uma delas é programar o =>

As fases de um compilador

Compiladores. Bruno Lopes. Bruno Lopes Compiladores 1 / 25. Instituto de C

Conclusões. Baseado no Capítulo 9 de Programming Language Processors in Java, de Watt & Brown

Noções de compilação

Noções de compilação

Projeto de Linguagem. Linguagens de Programação

Compiladores. Otimização de código

Apresentação. !! Familiarização com os métodos de construção de compiladores de linguagens e com as técnicas de compilação mais habituais.

Autômatos e Linguagens

Compiladores. Bruno Lopes. Bruno Lopes Compiladores 1 / 12. Instituto de C

Compiladores I Prof. Ricardo Santos (cap 1)

Compiladores. Árvore de derivação anotada. Geração de TAC para as principais construções. tradução em código TAC de expressões

Paradigmas de Programação

Linguagens de Programação Classificação

Compiladores Aula 12. Celso Olivete Júnior.

Capítulo 5. Nomes, Vinculações e Escopos

CAP. VII GERAÇÃO DE CÓDIGO

Paradigmas de Programação

Detalhes da geração de código Usando a técnica ad hoc, amarrada aos procedimentos sintáticos, igual à análise semântica

Ferramenta para Desenvolvimentode Sistemas EmbarcadosUtilizando Linguagem de Alto Nível p.1/25

ao paradigma imperativo

Concurso Público para provimento de cargo efetivo de Docentes. Edital 20/2015 CIÊNCIA DA COMPUTAÇÃO II Campus Rio Pomba

Linguagens Computacionais (Conceitos Básicos)

Compiladores. Otimização de Código

Conversões de Linguagens: Tradução, Montagem, Compilação, Ligação e Interpretação

Essencialmente, um ponteiro nada mais é do que uma variável que ao invés de conter um valor, contém um endereço de memória.

Projeto de Compiladores

MAB Análise Sintática. Wednesday, April 4, 12

Paradigmas de Programação. Java First-Tier: Aplicações. Orientação a Objetos em Java (I) Nomenclatura. Paradigma OO. Nomenclatura

Transcrição:

MAB 471 2011.2 Análise Semântica http://www.dcc.ufrj.br/~fabiom/comp

Além da Sintaxe Há um nível de corretude além da gramática foo(a,b,c,d) { int a, b, c, d; bar() { int f[3],g[0], h, i, j, k; char *p; foo(h,i, ab,j, k); k = f * i + j; h = g[17]; printf( <%s,%s>.\n,p,q); p = 10; Para gerar código, precisamos entender seu sigficado 2

Além da Sintaxe Há um nível de corretude além da gramática foo(a,b,c,d) { int a, b, c, d; bar() { int f[3],g[0], h, i, j, k; char *p; foo(h,i, ab,j, k); k = f * i + j; h = g[17]; printf( <%s,%s>.\n,p,q); p = 10; O que há de errado? Para gerar código, precisamos entender seu sigficado 2

Além da Sintaxe Há um nível de corretude além da gramática foo(a,b,c,d) { int a, b, c, d; bar() { int f[3],g[0], h, i, j, k; char *p; foo(h,i, ab,j, k); k = f * i + j; h = g[17]; printf( <%s,%s>.\n,p,q); p = 10; O que há de errado? (vamos contar ) Para gerar código, precisamos entender seu sigficado 2

Além da Sintaxe Há um nível de corretude além da gramática foo(a,b,c,d) { int a, b, c, d; bar() { int f[3],g[0], h, i, j, k; char *p; foo(h,i, ab,j, k); k = f * i + j; h = g[17]; printf( <%s,%s>.\n,p,q); p = 10; O que há de errado? (vamos contar ) número de argumentos de foo() Para gerar código, precisamos entender seu sigficado 2

Além da Sintaxe Há um nível de corretude além da gramática foo(a,b,c,d) { int a, b, c, d; bar() { int f[3],g[0], h, i, j, k; char *p; foo(h,i, ab,j, k); k = f * i + j; h = g[17]; printf( <%s,%s>.\n,p,q); p = 10; O que há de errado? (vamos contar ) número de argumentos de foo() declarou g[0], usou g[17] Para gerar código, precisamos entender seu sigficado 2

Além da Sintaxe Há um nível de corretude além da gramática foo(a,b,c,d) { int a, b, c, d; bar() { int f[3],g[0], h, i, j, k; char *p; foo(h,i, ab,j, k); k = f * i + j; h = g[17]; printf( <%s,%s>.\n,p,q); p = 10; O que há de errado? (vamos contar ) número de argumentos de foo() declarou g[0], usou g[17] ab não é int Para gerar código, precisamos entender seu sigficado 2

Além da Sintaxe Há um nível de corretude além da gramática foo(a,b,c,d) { int a, b, c, d; bar() { int f[3],g[0], h, i, j, k; char *p; foo(h,i, ab,j, k); k = f * i + j; h = g[17]; printf( <%s,%s>.\n,p,q); p = 10; O que há de errado? (vamos contar ) número de argumentos de foo() declarou g[0], usou g[17] ab não é int dimensão errada no uso de f Para gerar código, precisamos entender seu sigficado 2

Além da Sintaxe Há um nível de corretude além da gramática foo(a,b,c,d) { int a, b, c, d; bar() { int f[3],g[0], h, i, j, k; char *p; foo(h,i, ab,j, k); k = f * i + j; h = g[17]; printf( <%s,%s>.\n,p,q); p = 10; O que há de errado? (vamos contar ) número de argumentos de foo() declarou g[0], usou g[17] ab não é int dimensão errada no uso de f variável não declarada q Para gerar código, precisamos entender seu sigficado 2

Além da Sintaxe Há um nível de corretude além da gramática foo(a,b,c,d) { int a, b, c, d; bar() { int f[3],g[0], h, i, j, k; char *p; foo(h,i, ab,j, k); k = f * i + j; h = g[17]; printf( <%s,%s>.\n,p,q); p = 10; O que há de errado? (vamos contar ) número de argumentos de foo() declarou g[0], usou g[17] ab não é int dimensão errada no uso de f variável não declarada q 10 não é uma string Tudo isso está além da sintaxe Para gerar código, precisamos entender seu sigficado 2

Além da Sintaxe Para gerar código, o compilador deve responder as questões: x é escalar, array, ou função? x foi declarado? Há nomes não declarados? Declarados mas não usados? Qual declaração de x é usada por uma ref. a x? A expressão x * y + z é corretamente tipada? Em a[i,j,k], a tem três dimensões? Onde z pode ficar? (registrador, local, global, heap, estática) Em f 15, como representar 15? Quantos argumentos foo() recebe? E printf()? *p referencia o resultado de um malloc()? p & q se referem ao mesmo local na memória? x é definido antes de Além ser usado? poder expressivo de uma CFG 3

Além da Sintaxe Essas questões são parte da análise semântica Respostas dependem de valores, não de categorias sintáticas Questões e respostas usam informação não-local Respostas podem precisar de computação Como responder essas questões? Usar métodos formais Gramáticas sensíveis ao contexto? Gramáticas de Atributos Usar técnicas ad-hoc Tabelas de símbolos Código ad-hoc 4

Além da Sintaxe Essas questões são parte da análise semântica Respostas dependem de valores, não de categorias sintáticas Questões e respostas usam informação não-local Respostas podem precisar de computação Como responder essas questões? Usar métodos formais Gramáticas sensíveis ao contexto? Gramáticas de Atributos Usar técnicas ad-hoc Tabelas de símbolos Código ad-hoc Em análise sintática os formalismos ganharam. 4

Além da Sintaxe Essas questões são parte da análise semântica Respostas dependem de valores, não de categorias sintáticas Questões e respostas usam informação não-local Respostas podem precisar de computação Como responder essas questões? Usar métodos formais Gramáticas sensíveis ao contexto? Gramáticas de Atributos Usar técnicas ad-hoc Tabelas de símbolos Código ad-hoc Em análise sintática os formalismos ganharam. Em análise semântica as ténicas ad-hoc ganharam. 4

Análise Ad-hoc Tradução dirigida por sintaxe Usa parser shift-reduce bottom-up Associa trecho de código a cada produção Executa o trecho a cada redução Código arbitrário dá muita flexibilidade Inclusive a habilidade de dar um tiro no próprio pé Para fazer funcionar Precisa de nomes para cada símbolo de uma regra gramatical Yacc e derivados usam $$, $1, $2, $n, esquerda pra direita Mecanismo de avaliação pós-ordem Natural no algoritmo LR(1) 5

Exemplo Tipagem Assume tabelas de tipagem F +, F, F, e F 6

Exemplo Construção de AST Assume construtores para cada nó Assume que a pilha guarda ponteiros pros nós 7

Example Emissão de IR linear Assume que NextRegister() retorna nome de reg. virtual Assume que Emit() formata código assembly 8

Example Emissão de IR linear Assume que NextRegister() retorna nome de reg. virtual Assume que Emit() formata código assembly Assume que EmitLoad() lida com endereçamento e carrega um valor em um registrador 9

Usos Típicos Construção de tabela de símbolos Entra informação de declarações à medida que são processadas Usa tabela para checar erros à medida que o parsing progride Checagem de erros e tipos simples Definição antes de uso busca na referência Dimensão, tipo,... checado quando encontrado Consistência dos tipos de uma expressão na redução da exp. Interfaces de procedimentos são mais difíceis se não quiser impor definições antes de usos (ou protótipos) Construir representação para listas de parâmetros e tipos Criar lista de sítios para checagem Checagem offline 10

Limitações Força avaliação em uma ordem específica: pós-ordem Esquerda pra direita Bottom up Implicações Declarações antes de usos Informação de contexto não pode ser passada para baixo Como saber de dentro de qual regra você foi chamado? Poderia usar globais? Requer inicialização e pensar direito nas soluções Pode influenciar o projeto da linguagem, para ser mais fácil de analisar dessa maneira 11

Tradução Dirigida por Sintaxe Como encaixar em um parser LR(1)? stack.push(inválido); stack.push(s 0 ); token = scanner.next_token(); loop { s = stack.top(); // estado inicial if ( ACTION[s,token] == reduce A β ) then { stack.popnum(2* β ); // desempilha 2* β símbolos s = stack.top(); stack.push(a); // empilha A stack.push(goto[s,a]); // empilha próximo estado else if ( ACTION[s,token] == shift s i ) then { stack.push(token); stack.push(s i ); token scanner.next_token(); else if ( ACTION[s,token] == accept & token == EOF ) then break; else erro de sintaxe; 12

Parser LR(1) com ações TDS stack.push(inválido); stack.push(null); stack.push(s 0 ); token = scanner.next_token(); loop { s = stack.top(); // estado inicial if ( ACTION[s,token] == reduce A β ) then { /* insira ações aqui (switch) */ stack.popnum(3* β ); // desempilha 3* β símbolos s = stack.top(); stack.push(a); // empilha A stack.push(goto[s,a]); // empilha próximo estado else if ( ACTION[s,token] == shift s i ) then { stack.push(token); stack.push(s i ); token scanner.next_token(); else if ( ACTION[s,token] == accept & token == EOF ) then break; else erro de sintaxe; Para adicionar ações YACC: Empilhe 3 items por símbolo ao invés de 2 (3 o é $$) Switch na seção de processar reduções Switch no número da produção Cada cláusula tem o trecho de código para aquela produção Substitui nomes apropriados para $$, $1, $2, Aumento modesto no tempo 50% de aumento na pilha 13

Análise em ASTs E se é preciso fazer ações que não se encaixam bem no framework da tradução dirigida por sintaxe? Construir a AST usando tradução dirigida por sintaxe Fazer as ações em uma ou mais passagens pela árvore Várias maneiras de se estruturar em uma linguagem OO Faz computação arbitrária e controla a ordem Múltiplas passadas se necessário 14

Representações Intermediárias Código Fonte Front End IR Middle End IR Back End Código Nativo Front end - produz uma representação intermediária (IR) Middle end - transforma a IR do front end em uma IR equivalente que é mais eficiente (otimização) Back end - transforma a IR final em código nativo IR codifica conhecimento do compilador sobre o programa 15

Representações Intermediárias Decisões no projeto da IR afetam a eficiência do compilador e do código que ele gera Propriedades importantes Facilidade de geração Facilidade de manipulação Tamanho dos programas Expressividade Nível de Abstração A importância de diferentes propriedades varia entre diferentes compiladores Escolher a IR apropriedada é fundamental 16

Tipos de Representações Intermediárias Três grandes categorias Estrutural Gráficas Muito usada em tradução fonte para fonte Tende a ser grande Linear Pseudo-código para máquina abstrata Nível de abstração varia Simples e compacta Mais fácil de rearrumar o código Híbrida Combinação de grafos e código linear Grafos de fluxo de controle Exemplo: ASTs Exemplos: Código 3 endereços Código máq. de pilha Exemplo: CFGs 17

Nível de Abstração O nível de detalhe exposto em uma IR influencia a possibilidade de diferentes otimizações Duas representações para acesso a array: subscript A i j AST alto nível: Boa para desambiguar acessos loadi 1 => r 1 sub r j, r 1 => r 2 loadi 10 => r 3 mult r 2, r 3 => r 4 sub r i, r 1 => r 5 add r 4, r 5 => r 6 loadi @A => r 7 add r 7, r 6 => r 8 load r 8 => r Aij Código linear de baixo nível: Bom para cálculo de endereço mais eficiente 18

Nível de Abstração IRs estruturais normalmente são alto nível IRs lineares normalmente são baixo nível Não necessariamente verdade: load AST baixo nível + + @A loadarray A,i,j Código lin. alto nível * - - 10 j 1 j 1 19

Árvore de Sintaxe Abstrata (AST) Uma árvore de sintaxe abstrata é a árvore sintática com os nós para a maioria dos não-terminais removido - x * 2 y x - 2 * y Pode usar forma linearizada da árvore Mais fácil de manipular do que ponteiros x 2 y * - em forma pós-fixada - * 2 y x em forma pré-fixada S-expressions (Scheme, Lisp) e XML são essencialmente ASTs 20

Código de Máquina de Pilha Burroughs B-5000, p-code Pascal, Smalltalk, Java Exemplo: x - 2 * y vira push x push 2 push y mul sub Vantagens Compacta (muitas operações precisam só de 1 byte - bytecode) Nomes dos temporários são implícitos Simples de gerar código e executar Útil para transmissão de código 21

Código de Três Endereços Muitas representações diferentes Em geral, código de 3 endereços tem comandos da forma: x y op z Com 1 operador (op ) e até 3 nomes (x, y, & z) Exemplo: z x - 2 * y vira Vantagens: Lembra uma máquina RISC simples Introduz nomes para temporários Forma compacta 22

Código de Três Endereços Muitas representações diferentes Em geral, código de 3 endereços tem comandos da forma: x y op z Com 1 operador (op ) e até 3 nomes (x, y, & z) Exemplo: z x - 2 * y vira t 2 * y z x - t Vantagens: Lembra uma máquina RISC simples Introduz nomes para temporários * Forma compacta 22

Código de 3 Endereços: Quádruplas Representação simples de código de 3 endereços Tabela de k * 4 inteiros ou vetor de registros Fácil de reordenar Nomes explícitos O compilador FORTRAN original usava quads load r1, y loadi r2, 2 mult r3, r2, r1 load r4, x sub r5, r4, r3 Código de 3 endereços load 1 y loadi 2 2 mult 3 2 1 load 4 x sub 5 4 3 Quádruplas 23

Código de 3 Endereços: Triplas Índice é nome implícito do destino 25% menos espaço que quads Muito mais difícil de reordenar, a não ser que índices nas operações sejam ponteiros (1) load y (2) loadi 2 (3) mult (1) (2) Nomes implícitos não ocupam espaço (4) load x (5) sub (4) (3) 24

Grafo de Fluxo de Controle Modela a transferência de controle em um procedimento Nós do grafo são blocos básicos Pode usar quads, triplas ou outra representação linear Arestas no grafo representam fluxo de controle Exemplo if (x = y) a 2 b 5 a 3 b 4 c a * b 25

Forma SSA Ideia principal: definir cada nome apenas uma vez Introduzir funções φ (seleção) para fazer funcionar Original Forma SSA x y while (x < k) x x + 1 y y + x Vantagens da forma SSA Análise mais precisa Algoritmos mais rápidos!! x 0!! y 0!! if (x 0 >= k) goto next loop:! x 1 φ(x 0,x 2 )!!! y 1 φ(y 0,y 2 )!x 2 x 1 + 1!y 2 y 1 + x 2!!! if (x 2 < k) goto loop next: 26

Usando Múltiplas Representações Código Fonte Front End IR 1 Middle IR 2 Middle IR 3 End End Back End Código Nativo Repetidamente reduzir o nível da representação intermediária Cada representação é voltada para certas otimizações Exemplo: GCC AST, GIMPLE, RTL Exemplo: V8 AST, Hydrogen, Lithium 27

O Resto Representar código é apenas parte de uma IR Outros componentes necessários Tabela de Símbolos Tabela de constantes Representação, tipo Local de armazenamento, offset Mapa de armazenamento Layout geral Registradores virtuais 28

Tabelas de Símbolo com Escopo O problema Compilador precisa de um registro para cada declaração Escopo léxico aninhado admite múltiplas declarações A interface insert(nome, nível): cria registro para nome em nível lookup(nome): retorna registro para nome Muitas implementações foram propostas Vamos usar uma simples e que funciona bem para um compilador pequeno (poucos níveis léxicos, poucos nomes) Tabelas de símbolos são estruturas em tempo de compilação para resolver referências para nomes. Veremos as estruturas em tempo de execução correspondentes na geração de código. 29

Exemplo procedure p {!! int a, b, c!! procedure q {!!! int v, b, x, w!!! procedure r {!!!! int x, y, z!!!!.!!!!!! procedure s {!!!! int x, a, v!!!!!!!!!! r s!!!! q B0: {!! int a, b, c B1:!! {!!! int v, b, x, w B2:!!! {!!!! int x, y, z!!!!.!!! B3:!!! {!!!! int x, a, v!!!!!!!!!!!!!! 30

Tabelas de Símbolo com Escopo Ideia geral Criar nova tabela para cada escopo Encadeá-las para busca Implementação em resma de tabelas insert() pode precisar criar uma tabela sempre insere no nível corrente lookup() percorre cadeia de tabelas e retorna primeira ocorrência do nome Se o compilador tem que preservar a tabela (para depuração, por exemplo), essa ideia é bastante prática. Tabelas individuais são tabelas hash. 31