Tipos de Dados Biológicos e Multimídia Arthur Emanuel de O. Carosia Felipe Alves da Louza Luana Peixoto Annibal 1
Dados Biológicos São dados ou medidas coletadas a partir de fontes biológicas São geralmente armazenadas em arquivos ou bancos de dados 2
Sequências de Nucleotídeos : DNA: RNA: Adenina (A), Guanina (G), Citosina (C) e Tinina (T) Adenina (A), Guanina (G), Citosina (C) e Uracila (U) ACATACACATTAGAGAATACA TACATGATAGAGAATACATAC ACATTAGAGAATACATACACA TTAGAGATGAAATACACATAA GAGAATACATACACATTTAAG Arquivo tipo.fasta 3
Sequências de Nucleotídeos : 4
Aminoácidos são gerados por códons Geram 20 diferentes aminoácidos Códons especiais Iniciação Met Terminação End 5
Mapas genéticos: 6
Sequências de Aminoácidos: Estrutura primária Secundária Terciária Quaternária ADQLTEEQIAEFKEAFSLFDKDG DGTITTKELGTVMRSLGQNPTE AELQDMINEVDADGNGTID FPEFLTMMARKMKDTDSEEEIRE AFRVFDKDGNGYISAAELRHVM TNLGEKLTDEEVDEMIREA DIDGDGQVNYEEFVQMMTAK Arquivo tipo.fasta 7
Estruturas Tridimensionais de Proteínas: Protein Data Bank (PDB) - www.rcsb.org/pdb Cristalografia por difração de raios X (1977) Formato PDB - Armazena informações sobre: Técnica experimental usada para determinar a estrutura Detalhes sobre a macromolécula Origem Fonte Forma de obtenção Referências dos artigos relacionados à estrutura depositada Coordenadas atômicas Identifica cada átomo e sua posição, bem como a qual resíduo o átomo pertence e a numeração do resíduo de aminoácido, bem como a numeração do átomo. 8
Estrutura Primária de Proteínas: Sequência de aminoácidos Ligações peptídicas Cadeia peptídica Análise química (sítio ativo, conservação de resíduos de aa, identidade sequencial) 9
Estrutura Primária de Proteínas: Sequência de aminoácidos Alinhamento de sequências 10
Estrutura Secundária de Proteínas: Características químicas dos aminoácidos: Ligação de H ou Polares Com enxofre Aromáticos Ácidos Básicos Alifáticos Hidrofobicidade Ângulos de torção (phi e psi) Regiões permitidas (não há choque) Regiões não-permitidas (há choque) 11
Estrutura Secundária de Proteínas: Alfa hélice (1950) Cadeias laterais voltadas para fora Leu, Glu, Met e Ala Hélice 3 10 Hélice Pi 12
Estrutura Secundária de Proteínas: Folha Beta Não possibilita ligações de hidrogênio Folha Beta Paralela Folha Beta Anti-Paralela 13
Estruturas Terciária de Proteínas: Combinações de elementos da estrutura secundária Grampo beta Grampo alfa Beta-alfa-beta 14
Níveis de Estrutura Proteíca: 15
Exemplos de Dados Multimídia 16
Imagem Digital Representação de uma imagem bidimensional usando números binários. Pode ser de dois tipos: Raster (bitmap ou matricial): apresenta uma correspondência bit-a-bit entre os pontos da imagem original e os pontos da imagem reproduzida na tela de um monitor. Vetorial: apresenta a imagem atraves de formas elemetares e geométricas. Estas formas podem ser pontos, linhas, circulos ou polígonos. É armazenada sob a forma matemática de vetores, descrevendo cada componente básico. 17
Análise de imagens digitais Consiste no reconhecimento da cena para a geração de características dimensionais (área ou comprimento) ou atributos (cor e textura) e sua mensuração através da contagem de pixels. Não se baseia descrições textuais do conteúdo das imagens, mas da avaliação de seu conteúdo visual. Exemplos de Sistemas: Agricultura: Avaliação do vigor de sementes de milho. Medicina: Sistema para recuperação de mamografias com base em conteúdo 18
Representação da imagem Em sistemas de análise de imagens, a imagem é representada como: Vetor de características: é uma representação numérica sucinta de uma imagem, ou parte dela, caracterizando medidas dos aspectos representativos desse objeto, como, por exemplo, cor textura e forma. 19
Representação da imagem Espaço métrico Descritores de textura Matriz de co-ocorrência Para cada Ɵ e cada d 20
Representação da imagem Descritores de textura Matriz de co-ocorrência Operações sobre a matriz de co-ocorrência 21
Representação da imagem Descritores de textura Matriz de co-ocorrência Para cada Ɵ e cada d 22
Similaridade Comparação da similaridade das imagens Imagens digitais não são ordenáveis (relação de ordem total) Função de distância Função de distância métrica Simetria d(s1,s2) = d(s2,s1) Não-negatividade 0 < d(s1,s2) < se s1 s2 Desigualdade triangular d(s1,s2) d(s1,s3) + d(s3, s2) Algoritmos de consulta 23
Imagens Bitmap x Imagens Vetoriais. Disponível em http://www.cbpf.br/~mpa/bitxvet.htm. Visitado em 14/08/2010. Avaliação do vigor de sementes de milho. Disponível em http://www.scielo.br/pdf/rbs/v28n2/a22v28n2.pdf.visitado em 14/08/2010. Sistema para recuperação de mamografias com base em conteúdo. Disponível em: http://www.cefetsp.br/edu/sertaozinho/revista/volumes_anteriores /volume1numero1/ensaio/volume1ensaio3.pdf. Visitado em 14/08/2010. Estruturas proteicas disponível em: http://www.biocristalografia.df.ibilce.unesp.br/cursos/biologia_estr utural/aulas/aula10.pdf. Visitado em 16/08/2010 24