Conteúdo. Introdução a compiladores Tradução x Interpretação Processo de Compilação

Documentos relacionados
Compiladores. Motivação. Tradutores. Motivação. Tipos de Tradutores. Tipos de Tradutores

Compiladores. Introdução à Compiladores

Introdução parte II. Compiladores. Mariella Berger

II.1 Conceitos Fundamentais. Uma delas é programar o =>

Introdução aos Compiladores

Projeto de Compiladores

Universidade de Santa Cruz do Sul UNISC Departamento de informática COMPILADORES. Introdução. Geovane Griesang

Introdução à Programação

Projeto de Compiladores

Compiladores I Prof. Ricardo Santos (cap 1)

INE5421 LINGUAGENS FORMAIS E COMPILADORES

Compiladores. Introdução

Compiladores. Conceitos Básicos

FERRAMENTA DE AUXÍLIO AO PROCESSO DE DESENVOLVIMENTO DE SOFTWARE INTEGRANDO TECNOLOGIAS OTIMIZADORAS

Conversões de Linguagens: Tradução, Montagem, Compilação, Ligação e Interpretação

Universidade Estadual da Paraíba - UEPB Curso de Licenciatura em Computação

Universidade Católica de Pelotas Bacharelado em Ciência da Computação Linguagens Formais e Autômatos TEXTO 6 Introdução à Compilação

Conceitos de Linguagens de Programação

COMPILAÇÃO. Ricardo José Cabeça de Souza

Linguagens de Programação Classificação

PROGRAMAÇÃO I. Introdução

Universidade Federal de Goiás Bacharelado em Ciências da Computacão Compiladores

Programação: Compiladores x Interpretadores PROF. CARLOS SARMANHO JR

CP Compiladores I Prof. Msc.. Carlos de Salles

Linguagens de Programação

Introdução. Tradutores de Linguagens de Programação

Tratamento dos Erros de Sintaxe. Adriano Maranhão

FACULDADE LEÃO SAMPAIO

Linguagens de Programação Aula 3

Noções de compilação

Noções de compilação

Compiladores. Análise Léxica

Compiladores. Fabio Mascarenhas

Construção de Compiladores. Capítulo 1. Introdução. José Romildo Malaquias. Departamento de Computação Universidade Federal de Ouro Preto 2014.

Prof. Adriano Maranhão COMPILADORES

Autômatos e Linguagens

Compiladores. Análise Léxica

Compiladores e Computabilidade

Introdução a Ciência da Computação

CAP. VI ANÁLISE SEMÂNTICA

Compiladores Aula 1. Celso Olivete Júnior.

Desenvolvimento de Aplicações Desktop

Compiladores. Bruno Lopes. Bruno Lopes Compiladores 1 / 32. Instituto de C

Lembrando análise semântica. Compiladores. Implementação de esquemas de tradução L-atribuídos. Exemplo de implementação top-down (1)

Especificações Gerais do Compilador e Definição de FRANKIE

Compiladores. Geração de Código Objeto

Universidade de Santa Cruz do Sul UNISC Departamento de informática COMPILADORES. Síntese. Prof. Geovane Griesang

Algoritmos e Programação

Paradigmas de Programação

Como construir um compilador utilizando ferramentas Java

16. Compilação no Linux

Introdução à Programação Aula 03. Prof. Max Santana Rolemberg Farias Colegiado de Engenharia de Computação

Aula 5 Oficina de Programação Introdução ao C. Profa. Elaine Faria UFU

Análise Sintática I. Eduardo Ferreira dos Santos. Abril, Ciência da Computação Centro Universitário de Brasília UniCEUB 1 / 42

Programação de Sistemas (Sistemas de Programação) Semana 10, Aula 17

INE5318 Construção de Compiladores. Ricardo Azambuja Silveira INE CTC UFSC E Mail: URL:

Apresentação. !! Familiarização com os métodos de construção de compiladores de linguagens e com as técnicas de compilação mais habituais.

Análise Sintática. Eduardo Ferreira dos Santos. Outubro, Ciência da Computação Centro Universitário de Brasília UniCEUB 1 / 18

Linguagens e Compiladores

Compiladores. Eduardo Ferreira dos Santos. Fevereiro, Ciência da Computação Centro Universitário de Brasília UniCEUB 1 / 38

Programação de Computadores

Programação de Computadores

Working 03 : Conceitos Básicos I

Sistema Computacional

Tecnólogo em Análise e Desenvolvimento de Sistemas. Sistemas Operacionais (SOP A2)

Compiladores. Análise Semântica

Um Compilador Simples. Definição de uma Linguagem. Estrutura de Vanguarda. Gramática Livre de Contexto. Exemplo 1

Aula 23: Noções de Compilação, Montagem, Link-edição, e Interpretação

INE5622 INTRODUÇÃO A COMPILADORES

Introdução à Computação

Compiladores. Prof. Bruno Moreno

Existem três categorias principais de linguagem de programação: linguagem de máquina, linguagens assembly e linguagens de alto nível.

DESENVOLVIMENTO DO COMPILADOR PARA A LINGUAGEM SIMPLE

Prof. Antonio Almeida de Barros Jr. Prof. Antonio Almeida de Barros Junior

IFSC/Florianópolis - Programação Orientada a Objetos com Java - prof. Herval Daminelli

EA876 - Introdução a Software de Sistema

As fases de um compilador

Conclusões. Baseado no Capítulo 9 de Programming Language Processors in Java, de Watt & Brown

AULA 03: FUNCIONAMENTO DE UM COMPUTADOR

Aula teórica 7. Preparado por eng.tatiana Kovalenko

ORGANIZAÇÃO DE COMPUTADORES

Análise Léxica I. Eduardo Ferreira dos Santos. Março, Ciência da Computação Centro Universitário de Brasília UniCEUB 1 / 31

Aplicação. Programa Linguagem de Alto Nível. Programa em Linguagem Assembly. Programa em Linguagem Máquina

INE5416 Paradigmas de Programação. Ricardo Azambuja Silveira INE CTC UFSC E Mail: URL:

15/03/2018. Professor Ariel da Silva Dias Aspectos sintáticos e semânticos básicos de linguagens de programação

Linguagens de Programação

Programação de Computadores IV. Introdução a Linguagens de Programação Simone Martins SLIDES CEDIDOS POR BRUNO MARQUES 1

Interfaces de Vanguarda do Compilador

Capítulo 1 Linguagens e processadores

Banco de Dados Profa. Dra. Cristina Dutra de Aguiar Ciferri. Banco de Dados Processamento e Otimização de Consultas

Compiladores 02 Analise léxica

Infraestrutura de Hardware. Funcionamento de um Computador

Programação de Computadores:

Algoritmos. Prof. Jonatas Bastos Site:

Introdução à Computação: Máquinas Multiníveis

Conceitos básicos sobre computadores (continuação)

Compiladores. Gerência de Memória

Paradigmas de Linguagem de Programação. Aspectos Básicos

Transcrição:

Compiladores

Conteúdo Introdução a compiladores Tradução x Interpretação Processo de Compilação

Quando se inventou o computador criou se uma máquina a mais, quando se criou o compilador criou se uma nova era tecnológica. Autor Desconhecido

Computador Digital Máquina que resolve problemas executando uma série de instruções

Computador Digital Instruções descrevem a maneira de se realizar uma determinada tarefa, é chamada PROGRAMA

Computador Digital Programa pode estar em diversas linguagens. O processador entende apenas a linguagem de máquina (0 s e 1 )

Computador Digital Converter para LM

Métodos de Conversão Tradução (compilação): Interpretação:

Métodos de Conversão Tradução (compilação): cada instrução do programa de alto nível é substituída por uma seqüência equivalente de instruções em linguagem de máquina. Interpretação: O interpretador converte as instruções de um programa fonte para a forma binária (linguagem de máquina) e as executa imediatamente.

Tradutores Podem ser classificados em: Montadores (assemblers): Macro-assemblers: Compiladores: Pré compiladores, Pré processadores, Filtros:

Tradutores Podem ser classificados em: Montadores (assemblers): linguagem simbólica (assembly) linguagem de máquina (1-para-1) Macro-assemblers: idem, numa relação de uma-para-várias. Compiladores: linguagem de alto nível linguagem simbólica/linguagem de máquina. Pré compiladores, Pré processadores, Filtros: conversões entre duas linguagens de alto nível. Facilita a extensão de linguagens.

Tradutores Programa Fonte Compilador Programa Alvo Mensagem de Erro O tradutor relata a seu usuário a presença de erros no programa fonte. Não é gerado nenhum código se algum erro for encontrado no programa fonte. Após a correção é necessária nova tradução. Exemplos de linguagens traduzidas são C e Pascal.

Interpretadores Um interpretador não gera nenhum tipo de código. Converte as instruções e as executa imediatamente. Para executar cada ação possível existe um subprograma (escrito na linguagem da máquina do computador hospedeiro) Recebe programas escritos em linguagem de alto nível Efetua a execução examinando uma instrução de cada vez Executa a seqüência equivalente de instruções em linguagem de máquina. Estabelecem o conceito de maquinas virtuais, pois a execução do programa alvo está atrelada a essa ferramenta como se fosse o próprio computador.

Vantagens da compilação em relação à interpretação A execução é mais rápida, pois não necessitam de qualquer tradução durante a execução. Economia de memória na execução, pois não requerem a carga de maquina virtual na memória. Maior controle sobre o código gerado Pode efetuar otimização de código Geram um programa objeto bem mais eficiente, pois esse interage diretamente com o computador.

Desvantagens da compilação em relação à interpretação Inadequada para usuários novatos, pois cada vez que se comete um erro deve-se compilar o programa inteiro, já o interpretador, ao perceber erros durante a execução do programa, pausa, o erro então deve ser corrigido, sem perda da sua mansa de testes. Perde-se a referência com o código fonte, em caso de erro é difícil apontar a consequência do erro. Construção mais complexa Com a geração do código intermediário pode-se gerar programas com excelente grau de portabilidade, desenvolvendo-se máquinas virtuais para diferentes plataformas.

Processo de Compilação Um compilador é um programa que traduz um texto de programa escrito em alguma linguagem denominada linguagem fonte (normalmente de alto nível) para uma outra linguagem denominada linguagem objeto (normalmente de baixo nível). Programa Fonte - Linguagem de Alto Nivel (C, Pascal, Basic) Compil ador Programa Alvo Linguagem de Montagem (.ASM) MOV X3,3 montag em Troca código mnemonicos (umpara-um) Monta um progrma de números. MOV X3, 3 => 57 21 3 (hexadecimais) Programa executável.exe (windows,dos). (Linux) Linkedição Programa Objeto (.o,.obj)

Processo de Compilação Com o desenvolvimento de teorias criou se um consenso sobre a estrutura básica desses. A estrutura independe da linguagem a ser traduzida ou do programa objeto a ser gerado. Compõem-se de funções padronizadas: A análise do programa fonte A síntese para a derivação do código objeto.

Processo de Compilação Existem duas partes na compilação: Análise: divide o programa fonte nas partes constituintes e cria uma representação intermediária do mesmo. Síntese: constrói o programa alvo desejado, a partir da representação intermediária. Das duas, a síntese requer as técnicas mais especializadas. Program a Fonte Análise Representação Intermediária Sintese Program a Alvo

Processo de Tradução é estruturado em fases. cada fase se comunica com a seguinte através de uma linguagem intermediaria adequada Gerenciador da Tabela de Símbolos Programa Fonte Léxico Sintático Semântico Gerador de cód. intermediário Otimizador de código Gerador de cód. objeto Programa Alvo Tratador de erros Análise Síntese

Processo de Tradução A distinção entre as fases não é muito clara. Programa Fonte Léxico Sintático Tratador de erros Análise Fases agrupadas Representação intermediária não precisa ser explicitamente construída. Gerenciador da Tabela de Símbolos Semântico Gerador de cód. intermediário Otimizador de código Gerador de cód. objeto Programa Alvo Síntese

Análise O compilador lê o texto escrito em linguagem fonte e verifica se está escrito de acordo com as construções da linguagem. São armazenadas internamente ao compilador uma representação da gramática que descreve a forma das construções válidas e uma representação das regras semânticas. Erros detectados na análise devem ser reportados ao programador. É feita a geração de uma representação intermediária.

Análise A análise consiste em três fases (tipos de análise): Análise Léxica Análise Sintática Análise Semântica

As Fases de Análise Á medida que a tradução progride, a representação interna do compilador para o programa fonte muda. Enunciado 1: montante := depósito + taxa * 60 Enunciado 2: WHILE I<100 do I:=J+I

Análise Léxica Lê palavra. Também chamada de esquadrinhamento (scanning). Um fluxo de caracteres constituindo um programa é lido da esquerda para a direita e agrupado em tokens Exemplos são: WHILE, x1, 23. São detectados erros léxicos!epa não é um lexema válido em C. É considerada apenas a relação dos caracteres entre si para a formação do lexema. O relacionamento dos lexemas entre si fica a cargo da análise sintática.

Análise Léxica Programa Fonte Léxico Objetivo: identificar seqüências de caracteres que constituem unidades léxicas ( tokens ). Lê o código fonte, caractere a caractere Verifica se os caracteres lidos pertencem ao alfabeto da linguagem Despreza comentários e espaços em branco.

Análise Léxica Programa Fonte Léxico Os tokens constituem classes de símbolos tais como: palavras reservadas, delimitadores, identificadores, etc., Podem ser representados (internamente) Através do próprio símbolo (delimitadores, palavras reservadas) Por um par ordenado [classe do símbolo, índice para uma área]

Análise Léxica Programa Fonte Léxico Inicia a construção da Tabela de Símbolos Envia mensagens de erro Saída: cadeia de tokens que é passada para a próxima fase, a Análise Sintática. O Léxico é implementado como uma subrotina que funciona sob o comando do Sintático.

Análise Léxica Enunciado 1: montante := depósito + taxa * 60 id1 := id2 + id3 * 60 Enunciado 2: WHILE I<100 do I:=J+I [while,][id,7][<,][cte,100][do,][id,7][:=,][id,12][+,] [id,7]

Análise Sintática Lê a frase. Ou parsing. É uma análise hierárquica, também chamada de análise gramatical. Envolve o agrupamento dos tokens do programa fonte em frases gramaticais. As frases gramaticais do programa fonte são representadas por uma árvore gramatical.

Análise Sintática O programa fonte é como uma lista de tokens. Verifica se a estrutura gramatical do programa está correta (se essa estrutura foi formada usando as regras gramaticais da linguagem). Programa Fonte Léxico Sintático

Análise Sintática Identifica seqüências de símbolos que constituem estruturas sintáticas, através de uma varredura ou parsing da representação interna (cadeia de tokens) do programa fonte. Programa Fonte Léxico Sintático

Análise Sintática Produz (explicita ou implicitamente) uma estrutura em árvore (árvore de derivação) Sua construção está implícita nas chamadas das rotinas recursivas que executam a análise sintática. Programa Fonte Léxico Sintático

Análise Sintática Em muitos compiladores, a representação interna do programa resultante da análise sintática não é a árvore de derivação completa do texto fonte, mas uma árvore compactada (árvore de sintaxe) que visa a eliminar redundâncias e elementos supérfluos. Essa estrutura objetiva facilitar a geração do código que é a fase seguinte à análise. Programa Fonte Léxico Sintático

Análise Sintática Detecção de erros de sintaxe. Identificando a posição e o tipo de erro ocorrido. Recuperar erros e prosseguir a análise do texto restante. Muitas vezes, o Sintático opera conjuntamente com o Semântico.

Análise Sintática Exemplo: while <expressão> do <comando>; a estrutura <expressão> deve apresentarse sintaticamente correta, e sua avaliação deve retornar um valor do tipo lógico.

Análise Sintática As regras gramaticais podem ser descritas através de Gramática Livres de Contexto. Forma Normal de Backus. <comando> <while> <atrib>... <while> while <expr_bool> do <comando> <atrib> <variavel> := <expr_arit> <expr_bool> <expr_arit> < <expr_arit> <expr_arit> <expr_arit> + <termo> <termo> <termo> <numero> <variavel> <variavel> I J <numero> 100

Análise Sintática Enunciado 1: montante := depósito + taxa * 60 id1 := id2 + id3 * 60 := id1 + id2 * id3 60

Análise Semântica Verifica a validade, sentido Verifica os erros semânticos no programa fonte e captura informações de tipo para a fase subseqüente de geração de código. Faz verificação quanto à compatibilidade de tipos, se um identificador não foi declarado, etc...

Analise Semântica Determina se as estruturas sintáticas analisadas fazem sentido Verifica erros do tipo: variável declarada mais não utilizada, variável utilizada e não declarada, incompatibilidade de tipos, etc.. Programa Fonte Léxico Sintático Semântico

Representação Intermediária Durante o processo de análise, o computador pode gerar uma representação intermediária do programa fonte. Programa Fonte Análise Representação Intermediária Sintese Programa Alvo

Representação Intermediária Vantagens: Facilita o trabalho de portar programas para máquinas de arquitetura diferentes. Algumas formas de representação intermediária são passíveis de otimização, facilitando e antecipando o trabalho de otimização do código objeto que é feita durante o processo de síntese.

Síntese Durante a fase de síntese a representação intermediaria pode ser otimizada e é posteriormente traduzida em linguagem objeto. A síntese pode envolver ainda a otimização do código gerado em linguagem objeto. Progra ma Fonte Análise Representação Intermediária Sintese Progra ma Alvo

Síntese Construir o código objeto: geração de código intermediário, otimização geração de código objeto.

Gerador de Código Intermediário Utiliza a representação interna produzida pelo Sintático Gera como saída uma sequência de código. Pode ser o código objeto final Ou um código intermediário. Programa Fonte Léxico Sintático Semântico Gerador Cod. Intermediario

Vantagens do Código Intermediário Possibilita a otimização de código intermediário gerando código objeto final mais eficiente Resolve gradualmente as dificuldades da passagem de código fonte para código objeto (alto nível para baixo nível).

Código Intermediário Propriedades importantes: fácil de produzir fácil de traduzir no programa alvo A grande diferença entre o código intermediário e o código objeto final é que o intermediário não especifica detalhes tais como quais registradores serão usados, quais endereços de memória serão referenciados, etc...

Exemplo Enunciado 2: WHILE I<100 do I:=J+I L0 if I < 100 goto L1 goto L2 L1 TEMP := J + I I := TEMP goto L0 L2...

Código Intermediário Propriedades: Cada instrução de três endereços possui, no máximo, um operador, além do de atribuição. Então, ao gerar essas instruções, o compilador precisa decidir sobre a ordem em que as mesmas devam ser realizadas. Precisa gerar um nome temporário para receber o valor computado em cada instrução.

Otimização de Código Existe uma grande variação na quantidade de otimizações de código que cada compilador executa. Naqueles que mais a realizam, chamados de compiladores otimizantes, uma porção significativa de seus tempos é gasta nessa fase. Existem otimizações simples que melhoram significativamente o tempo de execução do programa alvo, sem alongar o tempo de compilação.

Programa Fonte Geração de Código A fase final do compilador é a geração do código alvo. Consiste normalmente de código de máquina relocável ou código de montagem. Léxico Sintático Semântico Gerador Cod. Intermediario Otimização de Código Geração de Código

Programa Fonte Geração de Código Esta fase tem como objetivos: produção de código objeto, reserva de memória para constantes e variáveis, seleção de registradores. É a fase mais difícil, Requer uma seleção cuidadosa das instruções e dos registradores da máquina alvo a fim de produzir código objeto eficiente. Léxico Sintático Semântico Gerador Cod. Intermediario Otimização de Código Geração de Código

Programa Fonte Otimização de Código Tenta melhorar o código intermediário, de tal forma que venha resultar um código de máquina mais rápido em tempo de execução e otimizado em termos de espaço de memória. Léxico Sintático Semântico Gerador Cod. Intermediario Otimização de Código

Programa Fonte Otimização de Código Algumas otimizações são triviais. Enunciado 1: id1 := id2 + id3 * 60 temp1:= inttoreal (60) temp2 := id3 * temp1 temp3 := id2 + temp2 id1 := temp3 temp1 := id3 * 60.0 id1 := id2 + temp1 Léxico Sintático Semântico Gerador Cod. Intermediario Otimização de Código

Programa Fonte Geração de Código Existem tradutores que possuem mais uma fase para realizar a otimização do código objeto, isto é, otimização do código dependente de máquina. As instruções intermediárias são, cada uma, traduzidas numa seqüência de instruções de maquina que realizam a mesma tarefa. Um aspecto crucial é a atribuição das variáveis aos registradores. Léxico Sintático Semântico Gerador Cod. Intermediario Otimização de Código Geração de Código

Programa Fonte Geração de Código temp1 := id3 * 60.0 id1 := id2 + temp1 poderia se tornar MOVF id3, R2 MULF #60.0, R2 MOVF id2, R1 ADDF R2, R1 MOVF R1, id1 Léxico Sintático Semântico Gerador Cod. Intermediario Otimização de Código Geração de Código

Tabela de Símbolos Compreende um conjunto de tabelas e rotinas associadas que são utilizadas por quase todas as fases do tradutor. Algumas das tabelas usadas são fixas para cada linguagem a tabela de palavras reservadas, tabelas de delimitadores, etc.

Tabela de Símbolos Entretanto, a estrutura que possui importância fundamental é aquela que é montada durante a análise do programa fonte, quando são coletadas informações sobre os seus diversos atributos.

Tabela de Símbolos Esses atributos podem providenciar informações sobre a memória reservada para o identificador, seu tipo, escopo (onde é válido no programa) e ainda informações sobre: declarações de variáveis; declarações dos procedimentos e subrotinas; parâmetros de subrotinas; etc.

Tabela de Símbolos Uma tabela de símbolos é uma estrutura de dados contendo um registro para cada identificador, com os campos contendo os atributos do identificador.

Tabela de Símbolos A cada ocorrência de um identificador no programa fonte, a tabela é acessada, e o identificador é procurado na tabela. Quando encontrado, as informações associadas a ele são comparadas com as informações obtidas no programa fonte, sendo que qualquer nova informação é inserida na tabela.

Tabela de Símbolos Os atributos mais comumente registrados são: para variáveis: classe(var), tipo, endereço no texto, precisão, tamanho; parâmetros formais: classe (par), tipo, mecanismo de passagem; procedimentos/subrotinas: classe (proc), número de parâmetros.

Tabela de Símbolos A tabela de símbolos deve ser estruturada de uma forma tal que permita rápida inserção e extração de informações, porém deve ser tão compacta quanto possível.

Atendimento a Erros Este módulo tem por objetivo tratar os erros que são detectados em todas as fases de análise do programa fonte. Qualquer fase analítica deve prosseguir em sua análise, ainda que erros tenham sido detectados.

Atendimento a Erros Isso pode ser realizado através de mecanismos de recuperação de erros, encarregados de re-sincronizar a fase com o ponto do texto em análise. A perda desse sincronismo faria a análise prosseguir de forma errada, propagando o efeito do erro.

Atendimento a Erros As fases de análise sintática e semântica tratam usualmente de uma ampla fatia dos erros detectáveis pelo compilador.

Atendimento a Erros A fase de análise léxica pode detectá-los quando os caracteres remanescentes na entrada não formem qualquer token da linguagem.

Atendimento a Erros Os erros, onde o fluxo de tokens viole as regras estruturais (sintaxe) da linguagem, são determinados pela fase de análise sintática.

Atendimento a Erros Durante a análise semântica, o compilador tenta detectar as construções que possuam a estrutura sintática correta, sem nenhuma preocupação com o significado da operação envolvida, como, por exemplo, ao tentarmos adicionar dois identificadores, um dos quais seja um nome de um array e o outro o nome de um procedimento.

Curiosidade Em PL/I as palavras chaves não são palavras reservadas. THEN pode significar parte do comando IF-THEN- ELSE, ou pode ser um identificador. A construção abaixo é válida em PL/I IF THEN THEN THEN=ELSE ELSE ELSE=THEN