Métodos Estatísticos para análise. de Y-STRs. em Genética Forense



Documentos relacionados
BREVE INTRODUÇÃO AO SISTEMA DA GESTÃO DE DOCUMENTOS DA CÂMARA MUNICIPAL DE MACAU PROVISÓRIA

UNIVERSIDADE FEDERAL DO PARANÁ DEPARTAMENTO DE ESTATÍSTICA

Origem da variação. Conceitos importantes. Diversidade Genética. Variação genética

DNA A molécula da vida. Prof. Biel Série: 9º ano

Ancestralidade Materna polimorfismos matrilínea DNA Mitocondrial (mtdna).

Barómetro Regional da Qualidade Avaliação da Satisfação dos Utentes dos Serviços de Saúde

1. Requisitos quanto a detecção e sensores

Mensal. Saúde. Nacional TENHO O COLESTEROL ALTO OS MEUS FILHOS VÃO HERDÁ LO

PARLAMENTO EUROPEU. Comissão do Meio Ambiente, da Saúde Pública e da Política do Consumidor

BIOFÍSICA DAS RADIAÇÕES IONIZANTES

Área de Intervenção IV: Qualidade de vida do idoso

Cadernos da

c. Técnica de Estrutura de Controle Teste do Caminho Básico

IV Fórum do Sector Segurador e Fundos de Pensões. Lisboa, 15 de Abril de 2009

Apresentação do Manual de Gestão de IDI

Disciplina: Biologia Educacional. Curso: Pedagogia 2 Semestre

Organização. Trabalho realizado por: André Palma nº Daniel Jesus nº Fábio Bota nº Stephane Fernandes nº 28591

O DNA é formado por pedaços capazes de serem convertidos em algumas características. Esses pedaços são

NOTA DE APRESENTAÇÃO

PLANO DE OCUPAÇÃO PLENA DOS TEMPOS ESCOLARES

Avaliação do Desempenho do. Pessoal Docente. Manual de Utilizador

Perguntas Mais Frequentes Sobre

Análise Econômica do Mercado de Resseguro no Brasil

Áudio. GUIA DO PROFESSOR Síndrome de Down - Parte I

Descrição do processo de priorização para tomada de tempos: Pesquisa ação em uma empresa job shop de usinados aeronáuticos.

Índice. Como aceder ao serviço de Certificação PME? Como efectuar uma operação de renovação da certificação?

Reprodução Sexuada Meiose e Fecundação

NORMAS INTERNACIONAIS DO TRABALHO Convenção (n.º 102) relativa à segurança social (norma mínima), 1952

Resolução da Assembleia da República n.º 64/98 Convenção n.º 162 da Organização Internacional do Trabalho, sobre a segurança na utilização do amianto.

FEUP RELATÓRIO DE CONTAS BALANÇO

Madeira. Bens e serviços. Açores. Taxa Taxa intermédia. Observações / Legislação reduzida

EPIDEMIOLOGIA DAS DOENÇAS HEREDITÁRIAS DO METABOLISMO (DHM)

MENDELISMO. Primeira Lei de Mendel ou Princípio da Segregação ou Lei da pureza dos gametas:

Resistência de Bactérias a Antibióticos Catarina Pimenta, Patrícia Rosendo Departamento de Biologia, Colégio Valsassina

POC 13 - NORMAS DE CONSOLIDAÇÃO DE CONTAS

4.1. UML Diagramas de casos de uso

CENSOS 2001 Análise de População com Deficiência Resultados Provisórios

Exemplos de Exercícios da Cadeira Gestão de Projectos. Qualidade e Manutenção. Ano Lectivo 2006/2007

AVALIAÇÃO DA SATISFAÇÃO DOS UTILIZADORES DO CANAL INTERNET AT 2014

BASES MACROMOLECULARES DA CONSTITUIÇÃO CELULAR

SISTEMA DE ACOMPANHAMENTO E AVALIAÇÃO DE ESTÁGIO (Art.º 22.º do Regulamento de Estágio, publicado no Diário da República de 9 de Fevereiro de 2010)

Norma Interpretativa 2 Uso de Técnicas de Valor Presente para mensurar o Valor de Uso

AULA. Natércia do Céu Andrade Pesqueira Menezes UNIVERSIDADE PORTUCALENSE. Doutora Sónia Rolland Sobral

SEMINÁRIOS AVANÇADOS GESTÃO DE PROJECTOS

NORMA CONTABILISTICA E DE RELATO FINANCEIRO 1 ESTRUTURA E CONTEÚDO DAS DEMONSTRAÇÕES FINANCEIRAS

Gramática do Português, Maria Fernanda Bacelar do Nascimento (Centro de Linguística da Universidade de Lisboa)

População residente em Portugal com tendência para diminuição e envelhecimento

Orientações sobre o tratamento de dados dos documentos de identificação dos titulares de cartão de pagamento por parte das firmas comerciais

Auditoria nos termos do Regulamento da Qualidade de Serviço Relatório resumo EDP Serviço Universal, S.A.

Escola Secundária de Forte da Casa

Introdução à genética quantitativa usando os recursos do R

1.º PERÍODO. n.º de aulas previstas DOMÍNIOS SUBDOMÍNIOS/CONTEÚDOS OBJETIVOS. De 36 a 41

Portuguese Summary. Resumo

PROJECTO DE NORMA REGULAMENTAR. Relatório de auditoria para efeitos de supervisão prudencial das empresas de seguros

Gerenciamento de Projetos Modulo VIII Riscos

Formulários FOLHA DE ROSTO

Matemática Aplicada às Ciências Sociais

1. Os métodos Não-Paramétricos podem ser aplicados a uma ampla diversidade de situações, porque não exigem populações distribuídas normalmente.

deficiências gênicas em amostras de DNA, de seres humanos e/ou animais, o qual além

INQUÉRITO ÀS ENTIDADES GESTORAS NORMA ISO OBJECTIVO DO INQUÉRITO 2 CONSTITUIÇÃO DO INQUÉRITO RELATÓRIO FINAL

JURINFOR JURIGEST Facturação e Mapas

NOVA CONTABILIDADE DAS AUTARQUIAS LOCAIS

Pedro R ibeiro Ribeiro e S ilva Silva MAPFRE Seguros

Avaliação do Encerramento dos Blocos de Partos

PROGRAMA DE ACÇÃO COMUNITÁRIO RELATIVO À VIGILÂNCIA DA SAÚDE. PROGRAMA DE TRABALHO PARA 2000 (Nº 2, alínea b), do artigo 5º da Decisão nº 1400/97/CE)

TRABALHO LABORATORIAL NO ENSINO DAS CIÊNCIAS: UM ESTUDO SOBRE AS PRÁTICAS DE FUTUROS PROFESSORES DE BIOLOGIA E GEOLOGIA

PARECER N.º 26/CITE/2006

ESTATÍSTICAS DEMOGRÁFICAS DISTRITO DE VIANA DO CASTELO E SEUS CONCELHOS. F e v e r e i r o d e

ASSUNTO: Processo de Auto-avaliação da Adequação do Capital Interno (ICAAP)

Apresentação de Dados em Tabelas e Gráficos

Modelos, em escala reduzida, de pontes e barragens. Simuladores de voo (ou de condução), com os quais se treinam pilotos (ou condutores).

GRUPO DE TRABALHO DE PROTECÇÃO DE DADOS DO ARTIGO 29.º

PROJECTO DE CARTA-CIRCULAR SOBRE POLÍTICA DE REMUNERAÇÃO DAS INSTITUIÇÕES FINANCEIRAS

Requisitos do Sistema de Gestão de Segurança para a Prevenção de Acidentes Graves (SGSPAG)

Referenciais da Qualidade

PAINEL DE ADMINISTRADOR

Ciências Físico - Químicas. Planificação de uma Actividade Laboratorial No contexto dos Novos Programas

Projecto de diploma. que estabelece o regime jurídico aplicável aos aparelhos áudio portáteis

GENÉTICA FORENSE E PATERNIDADE

6. Pronunciamento Técnico CPC 23 Políticas Contábeis, Mudança de Estimativa e Retificação de Erro

REGULAMENTO DO ARQUIVO MUNICIPAL DE GOUVEIA. Capítulo 1. Constituição e Funções do Arquivo Municipal. Artigo 1º. Artigo 2º. Capítulo II Da Recolha

newsletter Nº 86 MARÇO / 2014

REGULAMENTO DA COMISSÃO DE AUDITORIA BANCO ESPÍRITO SANTO, S. A. Artigo 1.º Composição

Bona: Chamada para a Ação

Taxa de desemprego estimada em 11,9%

Implicações da alteração da Taxa de Juro nas Provisões Matemáticas do Seguro de Vida

Património Genético. Genética - estuda a transmissão de características de uma geração para a outra

Projeto de Resolução n.º 238/XIII/1.ª. Recomenda ao Governo que implemente medidas de prevenção e combate à Diabetes e à Hiperglicemia Intermédia.

República de Moçambique Ministério da Saúde Direcção Nacional de Saúde Pública

NOVO REGIME DE INSTALAÇÃO E FUNCIONAMENTO EMPREENDIMENTOS TURÍSTICOS

PROTOCOLO ENERGIA POSITIVA CONTRA A OBESIDADE

Exercícios resolvidos sobre Função de probabilidade e densidade de probabilidade

Montepio, Portugal. Tecnologia de recirculação de notas na optimização dos processos de autenticação e de escolha por qualidade

Avaliação do Pessoal Não Docente SIADAP

FICHA DOUTRINÁRIA. Diploma: CIVA. Artigo: alínea c) do n.º 1 do artigo 18.º. Assunto:

Contabilidade Gerencial PROFESSOR: Salomão Soares VPL E TIR

Metadados. 1. Introdução. 2. O que são Metadados? 3. O Valor dos Metadados

Estes sensores são constituídos por um reservatório, onde num dos lados está localizada uma fonte de raios gama (emissor) e do lado oposto um

Trabalho 7 Fila de prioridade usando heap para simulação de atendimento

Transcrição:

UNIVERSIDADE DE LISBOA FACULDADE DE CIÊNCIAS DEPARTAMENTO DE ESTATÍSTICA E INVESTIGAÇÃO OPERACIONAL Métodos Estatísticos para análise de Y-STRs em Genética Forense Cláudia Isabel Vieira da Silva Mestrado em Bioestatística 20

UNIVERSIDADE DE LISBOA FACULDADE DE CIÊNCIAS DEPARTAMENTO DE ESTATÍSTICA E INVESTIGAÇÃO OPERACIONAL Métodos Estatísticos para análise de Y-STRs em Genética Forense Cláudia Isabel Vieira da Silva Tese orientada por Prof. Maria Antónia Amaral Turkmann Mestrado em Bioestatística 20

Resumo Resumo A implementação dos marcadores de DNA nas ciências forenses consistiu no maior avanço nesta área nos últimos vinte anos. Os fenómenos de mutação e recombinação genética contribuem para uma grande diversidade genética, o que se traduz no facto de todos os indivíduos, com excepção de gémeos verdadeiros, apresentarem sequências de DNA diferentes entre si, mas invariváveis em todas as suas células. Estas características permitem a sua aplicação na área forense em investigações criminais, relações de parentesco, imigração, pessoas desaparecidas em acidentes de massa e estudos históricos\antropológicos. Nos últimos dez anos os marcadores de DNA específicos dos indivíduos do sexo masculino, Y-STRs, foram estudados e aplicados em diferentes laboratórios na área forense. Estes marcadores permitem a identificação das linhagens paternas do indivíduos e esta informação pode ser de grande importância nos casos de abuso sexual e de investigação de parentesco. No entanto a sua correcta aplicação nos casos do Serviço de Genética e Biologia Forense implica a implementação de um método científico adequado para avaliar a probabilidade de coincidência de dois perfis genéticos. Para este objectivo foi implementado um kit de estudo de Y-STRs, designado por AmpFlSTR Yfiler (Applied Biosystems), previamente desenvolvido e validado para a área forense e aplicado em 97 pares pai\filho, provenientes de uma base de dados da população de referência do Sul de Portugal. Este estudo permitiu realizar inferências populacionais, estimar taxas de mutação da linha germinal paterna e efectuar cálculos de probabilidade de coincidência de perfis genéticos (matching probabilities) em diferentes tipos de casos estudados. As inferências populacionais foram realizadas com diferentes conjuntos dey-strs, designadas por Haplotipo mínimo, Haplotipo Estendido e Haplotipo completo, de forma a verificar qual o conjunto de Y STRs que permite obter a maior diversidade genética A análise com os diferentes conjuntos de haplótipos revelou a presença de 7, 83 e 9 haplotipos diferentes, correspondendo a diversidades genéticas de 0.64, 0.6403 e 0.6508. No que diz respeito à metodologia aplicada recorrendo à formulação bayesiana, verificou-se que a metodologia recorrendo à distribuição a priori Beta permite estimar Cláudia Isabel Vieira da Silva iii

Resumo valores de taxas de mutação mais próximos dos valores referenciados por outros autores, disponíveis no site www.yhrd.org. O valor mais baixo da taxa de mutação obtido foi de 6.00-4 (5.747-4 3.242-4 ) para o marcador DYS438. Estes resultados contribuiram para a estimativa das probabilidades de coincidência de dois perfis genéticos. Estes cálculos foram efetuados recorrendo a diferentes metodologias, nomeadamente, método frequencista, método de haplotype survyeing e método de Charles Brenner. Os resultados obtidos com as diferentes metodologias, permitiram concluir que a metodologia Haplotype Surveying é presentemente a mais adequada para aplicação na área forense como actualmente está implementada. Palavras chave:y-strs, matching, germline mutation, Likelihood ratio. Cláudia Isabel Vieira da Silva iv

Abstract Abstract DNA analysis has been the greatest technological advance in forensic science in the past twenty years. Due to mutation and recombination no two persons, except true twins, have the same DNA sequence, wich enables to determine DNA sequence in every biological sample, and this knowlodge can be used in the investigation of crime, kinship relationships, immigration, missing persons, mass disasters and historical cases. In the last ten years, among DNA markers with forensic interest, a few with potencial to identify male specific DNA, Y-STRs, were described and implemented in most forensic genetic laboratorys. These markers are very important since they contribute to identify male lineages and this information can be invaluable in cases of sexual assault and in kinship testing, as well as in anthropological and population genetics studies. However to apply Y-STRs in Forensic Genetics Service from National Institute of Legal Medicine, it is convenient to have a scientific method to analyse and evaluate the evidential strength of a Y-haplotype match. For this purpose, a 7 locus microsatellite kit, AmpFlSTR Yfiler (Applied Biosystems), previously developed and validated for forensic cases, was adopted in a 97 father son\pairs south Portugal reference database, in order to make population inferences, Y-STR germline mutation rates estimation, and matching probabilities evaluations. Population inferences were done with different sets of Y STRs markers, classified as Complete Haplotype, Extended Haplotype and Minimal Haplotype, in order to study which set can give the strongest genetic diversity. A total of 7,83, 9 haplotypes were observed when analysed the Minimal Haplotype, Extended Haplotype and Complete Haplotype, respectively, corresponding to genetic diversity 0.64, 0.6403 and 0.6508. The locus specific mutation rates were estimated with Bayesian formulation, and the best approximation was obtained with a priori Beta distribution. These results contributed to estimate matching probabilities in different kind of cases, kinship and criminal ones, with three distinct methodologies, frequencist, haplotype surveying and Brenner s, in order to distinguish the best one to apply in the laboratory. Keywords:Y-STRs, haplotype matching, germline mutation, Likelihood ratio. Cláudia Isabel Vieira da Silva v

Agadecimentos Agradecimentos À Prof. Maria Antónia Amaral Turkman pelo seu interesse neste trabalho de dissertação, e por todo o apoio dispensado na execução deste trabalho. Ao Prof. Jorge Costa Santos, Director do Instituto Nacional de Medicina Legal IP, Delegação do Sul, pelo seu apoio e interesse na realização deste trabalho, pela autorização na disponibilização dos dados, sem os quais este trabalho nunca teria sido possível. À Dra Rosa Maria Espinheira, Directora do Serviço de Genética e Biologia Forense da delegação do Sul do INML IP, pelo seu interesse neste trabalho, pelo apoio e confiança e pela disponibilização imediata dos dados do serviço para a realização deste trabalho. Aos meus pais Fernando de Jesus Silva e Maria Isabel Lopes Vieira, a quem devo quase tudo na vida, pelo incentivo e apoio à minha formação contínua, pela compreensão dos muitos fins de semana ausentes e por estarem sempre presentes. Aos meus amigos, sobretudo aos que se disponibilizaram desde o início para a leitura das extensas páginas deste trabalho, bem como a todos os outros que aceitaram as minhas muitas recusas para saídas e convívios, pelo apoio e carinho nos meus momentos de dúvida e incerteza, sem cuja força e incentivo, atingir a meta teria sido muito mais difícil. Cláudia Isabel Vieira da Silva vi

Conteúdo Conteúdo Resumo... iii Abstract... v Agradecimentos... vi Conteúdo... vii Lista de Tabelas... ix Lista de Figuras... xi Abreviaturas e Definições... xii Capítulo.... Introdução... A evolução da Genética Forense... A Estrutura do Genoma Humano e Hereditariedade... 2 Classes de Polimorfismos de DNA... 4 O cromossoma Y... 6 Vantagens da aplicação dos marcadores do cromossoma Y... 0 Desvantagens da utilização do cromossoma Y... Análise dos resultados do Cromossoma Y... 2 Taxas de Mutação dos Loci do cromossoma Y... 3 Valorização estatística dos resultados... 4 Objectivo do Trabalho... 5 Capítulo 2... 7 2. Material e Métodos... 7 Estudo Biológico... 7 Amostras Biológicas... 7 A extracção de DNA... 7 Amplificação e Análise dos Y-STRs... 8 Análise dos produtos amplificados... 9 Análise Estatística... 20 Análise Estatística Populacional... 20 Estudo das Taxas de Mutação... 27 Modelo de Probabilidade para as taxas de mutação... 28 Cláudia Isabel Vieira da Silva vii

Conteúdo Estimativa do número de mutações assumindo uma distribuição de Poisson... 34 Probabilidade de Matching... 39 Princípios da probabilidade de transmissão alélica... 39 Metodologia aplicada nos cálculos da probabilidade de paternidade em processos com trio Presumível Pai(A)/Mãe(B)/Filho(a) (C)... 4 Aplicação dos Y-STRs nos casos de investigação de parentesco... 43 A utilização dos Y-STRs nos casos criminais... 46 Metodologias para estimativa da frequência dos haplótipos na população... 49 Método das Frequências... 49 Método Haplotype Surveying... 50 Método de Charles Brenner... 5 Análise de casos... 53 Capítulo 3... 64 3. Resultados... 64 Análise estatística populacional... 64 Análise das taxas de mutação... 70 Análise de casos Práticos... 77 Capítulo 4... 82 4. Conclusões... 82 5. Bibliografia... 87 Cláudia Isabel Vieira da Silva viii

Lista de Tabelas Lista de Tabelas Tabela - Y-STRs usados actualmente na rotina dos casos forenses incluídos no AmpFlSTR Y filer PCR amplification kit, estrutura da unidade de repetição e nº possível de repetições em cada um destes locus... 9 Tabela 2- Valores da taxa de mutação e respectivos intervalos de confiança para os marcadores Y-STRs em estudo obtidos no site www.yhrd.org... 3 Tabela 3 Informação relativa ao nº de mutações obtido em cada marcador genético e respectiva extrapolação para a amostra em estudo... 36 Tabela 4 resultados obtidos com os marcadores autossómicos... 57 Tabela 5- resultados obtidos com Y-STRs... 58 Tabela 6- resultados obtidos com os marcadores autossómicos para o caso 2... 6 Tabela 7- resultados obtidos com os... 6 Tabela 8 resultados obtidos com os Y-STRs... 62 Tabela 9- resultados obtidos com os Y-STRs para o caso 4... 63 Tabela 0- Tabela do nº de características alélicas detectadas em cada Y-STR,... 64 Tabela --Resultados da Diversidade Genética em cada locus... 66 Tabela 2- Resultados da Diversidade Genética média... 66 Tabela 3- representação do nº médio de diferenças entre indivíduos uando estudados com diferentes conjuntos de Y-STRs e respetiva Diversidade Haplótipica... 67 Tabela 4- haplotipos partilhados quando usados os Y-STRs do Haplotipo Mínimo... 69 Tabela 5- haplotipos partilhados quando quando usados os Y-STRs do Haplotipo Estendido... 69 Tabela 6- haplótipos partilhados quando quando usados os Y-STRs do Haplotipo Completo... 70 Tabela 7 Valores dos parâmetros a priori e a posteriori para a priori Uniforme (,) e uniforme (/2,/2)... 7 Tabela 8- Valores estimados para o valor médio da taxa de mutação (µ), variância e respectivos intervalos de credibilidade com recurso à metodologia Bayesiana, com uma distribuição a priori uniforme (,)... 7 Tabela 9- Valores estimados para o valor médio da taxa de mutação (µ), variância e respectivos intervalos de credibilidade com recurso à metodologia Bayesiana, com uma distribuição a priori uniforme (/2,/2)... 72 Tabela 20- valores dos parâmetros α, β, e dos Hiperparâmetros A e B das distribuições a priori e a posteriori beta... 73 Tabela 2- Valores estimados para o valor médio da taxa de mutação (µ), variância e e respectivos intervalos de credibilidade com recurso à metodologia bayesiana, com uma distribuição a priori Beta... 73 Tabela 22 valores dos parâmetros g,h, e dos Hiperparâmetros G e H... 75 Tabela 23- Registo dos valores estimados para a taxa de mutação e respectivos intervalos de confiança quando aplicada a distribuição a priori Gama usando o modelo de Poisson... 76 Cláudia Isabel Vieira da Silva ix

Lista de Tabelas Tabela 24--cálculo da probabilidade de ocorrer coincidência de perfis genéticos presumindo a hipótese H 0 em cada um dos casos de investigação de parentesco em estudo... 77 Tabela 25- Probabilidade de encontrar na população um indivíduo com um perfil coincidente com o dos filhos intervenientes P Y H,I... 78 nos processos de investigação de parentesco [ ] Tabela 26-resultados do LR Y com as taxas de mutação obtidas no site www.yhrd.org... 78 Tabela 27- resultados do LR Y recorrendo às taxas de mutação estimadas recorrendo à metodologia Bayesiana... 79 Tabela 28- valores do LR A obtidos com o software Familias... 79 Tabela 29 resultados finais do valor de LRC, resultantes da multiplicação do LR dos marcadores autossómicos com as diferentes possibilidades de LR do cromossoma Y... 80 Tabela 30 resultados dos valores de probabilidade P[ Y H 0,I] e [ Y H,I] P, para os casos práticos criminais em estudo.... 8 Tabela 3 resultados do LR Y recorrendo às diferentes metodologias para estimação das frequências dos Haplótipos.... 8 Cláudia Isabel Vieira da Silva x

Lista de Figuras Lista de Figuras Figura -imagem representativa de ambos os cromossomas sexuais. O cromossoma X e o cromossoma Y... 6 Figura 2 - Esquema representativo da estrutura do cromossoma Y, com os seus braços curto (p) e longo(q), regiões de recombinação genética (PAR e PAR2) e localização dos respectivos Y-STRs utilizados na área forense.... 8 Figura 3- perfil genetico masculino obtido com o kit AmpFlSRT Y Filer Plus (Applied Biosystems).... 20 Figura 4- Representação gráfica do nº de diferenças alélicas entre indivíduos considerando os marcadores do Haplótipo Mínimo, do Haplótipo Estendido e do Haplótipo Total... 68 Figura 5- representação gráfica das densidades das distribuições a priori, verosimilhança e distribuição a posteriori nos marcadores sem mutações detectadas (DYS437, DYS439) e marcadores com mutações detectadas (DYS458 e GATA H4)... 74 Figura 6- representação gráfica das distribuições a posteriori considerando as distribuições Uniforme (,), Uniforme (½, ½) e Beta ( α, β )... 75 Figura 7- representação gráfica relativa à distribuição a priori e a posteriori Gama para o parâmetro λ... 76 Cláudia Isabel Vieira da Silva xi

Abreviaturas e Definições A Adenina Amelogenina gene, cujo fragmento amplificado tem 03 pares de bases no cromossoma X e 06 pares de bases no cromossoma Y, permite a determinação do género de uma amostra biológica. C Citosina Cromossoma longa sequência de DNA, constituída por milhares de pares de bases, estruturalmente dividida em duas partes designadas respectivamente por braço longo(q) e braço curto (p), separadas por uma região de constrição designada por centrómero. Cromossoma Y Cromossoma que determina o sexo masculino D A desoxirribonucleic acid- ácido desoxirribonucleico cadeia em dupla hélice que codifica a informação genética necessária de cada organismo vivo. G Guanina Genoma património genético total de um organismo. Genótipo composição alélica de uma célula ou várias células obtida pelo estudo de um determinado gene ou num conjunto de genes. Em genética forense corresponde à composição alélica das células do indivíduo quando estudado um ou vários marcadores em simultâneo. Haplótipos conjunto de alelos em dois ou mais loci de um cromossoma sem Heterozigótico um indivíduo que tem um par de genes com diferentes sequências. Homozigótico um indivíduo que tem um par de genes com sequências iguais. ISFG Internacional Society for Forensic Genetics - Sociedade Internacional de Genética Forense que promove o conhecimento científico na pesquisa de marcadores genéticos importantes para análise forense. Loci plural de locus Locus local específico ou segmento na sequência de DNA Meiose método de divisão celular que ocorre nas células sexuais Multiplex reação química que permite amplificar em simultâneo vários sítios específicos do Genoma. Pb pares de bases unidade do comprimento da cadeia de DNA igual ao nº de nucleótidos

Abreviaturas e Definições PCR Polymerase chain reaction- técnica in vitro que permite aumentar exponencialmente o número de cópias de uma determinada sequência de DNA. S Ps Single nucleotide polymorphisms- STRs Short Tandem Repeats SWGDAM Scientific Working Group on DNA Analysis Methods grupo de aproximadamente 50 cientistas representantes de laboratórios de DNA forenses dos USA e Canadá. T Timina V TRs Variable Number Tandem Repeats Y-STRs Short Tandem Repeat do cromossoma Y. Cláudia Isabel Vieira da Silva xiii

A Razão é Incompetente para Determinar uma Verdade... A razão, ou intelecto, nem percebe, nem cria; tão-somente compara, e, por comparação, rectifica e elabora os dados que os sentidos ministram. A razão é, portanto, incompetente para determinar uma verdade, por isso que não pode determinar um facto, mas só compará-los com outros. Fernando Pessoa in 'Textos Filosóficos e Esotéricos'

Capítulo. Introdução A evolução da Genética Forense A Genética e Biologia Forense é o ramo das Ciências Forenses dedicado à identificação biológica de indivíduos ou de amostras biológicas para fins jurídicos, quer no âmbito do direito civil, quer no âmbito do direito criminal. Para esse efeito, são realizados exames periciais em amostras com origem conhecida, que consistem actualmente, na determinação de um perfil genético ou perfil de DNA, contribuindo quer para o esclarecimento de relações biológicas de parentesco, paternidade ou maternidade na sua maioria, identificação de desconhecidos, ou identificação dos contribuintes de amostras biológicas relacionadas com processos de natureza criminal. Esta área científica não é de todo actual, no entanto, nos últimos 20 anos, devido a um grande desenvolvimento científico e à descoberta de características especiais nas sequências de DNA, designadas por polimorfismos de DNA, toda a forma de realizar estudos nesta área foi revolucionada. Até 985, os estudos das amostras biológicas forenses eram baseados na análise dos produtos genéticos na forma de grupos sanguíneos ou de proteínas sorológicas[]. No entanto, estes marcadores apresentavam alguns incovenientes para utilização nesta área, nomeadamente baixo nível de polimorfismo e consequentemente poder de discriminação fraco entre os indivíduos, grande instabilidade molecular e relativa fiabilidade dos resultados, assim como limitações no tipo e quantidade de amostra biológica estudada. Em 985, Allec Jefreys,

Introdução descobriu regiões de grande variabilidade no DNA entre os indivíduos, designadas genericamente por D A fingerprinting, expressão amplamente difundida, embora, não muito correta do ponto de vista biológico. Esta descoberta constituiu os alicerces da genética forense moderna como actualmente é aplicada []. Estes polimorfismos são regiões de DNA não codificante, isto é, regiões não intervenientes na síntese proteica. Em simultâneo com esta descoberta surgiu uma nova metodologia laboratorial, designada por PCR (Polymerase Chain Reaction), técnica que permite a multiplicação exponencial do número de cópias de uma única molécula de DNA[2], contribuindo para a realização de análises em todo o tipo de amostras biológicas, mesmo com quantidades de material biológico exíguas. Estas características técnicas associadas à elevada precisão destas análises, contribuíram para o desenvolvimento de metodologias inovadoras fundamentais na genética forense atual[], adequadas para a resolução de problemas judiciais outrora irresolúveis. A Estrutura do Genoma Humano e Hereditariedade Todos os organismos vivos, com excepção de alguns tipos de vírus, usam o DNA como o seu material genético. O DNA, acrónimo de Deoxyribonucleic Acid, é uma estrutura molecular que desempenha duas funções fundamentais: codificação genética da informação necessária para a construção e funcionamento de todas as células do organismo vivo, bem como, todas as instruções necessárias para a transmissão hereditária dessas mesmas características [3]. A estrutura do polímero de DNA é formada por uma sequência de unidades designadas por nucleótidos. Cada nucleótido é composto por uma molécula de açúcar, desoxirribose, um grupo fosfato e uma outra molécula designada por base. As diferenças entre os nucleótidos ocorrem devido à existência de quatro bases distintas designados por Adenina (A), Guanina(G), Citosina (C) e Timina (T). A ligação entre os diferentes nucleótidos forma aglomerados, constituíndo subestruturas designadas por cromossomas. Em todas as células da espécie humana a informação genética está armazenada em 46 cromossomas, com a excepção dos gâmetas, (óvulos e espermatozóides), cujo material genético está reduzido a metade, isto é 23 cromossomas, sendo por isso designadas por células haplóides. No momento da fecundação a fusão de um óvulo com Cláudia Isabel Vieira da Silva 2

Introdução um espermatozóide produz uma nova célula- zigoto- que irá dar origem a um novo indivíduo. Este, terá na sua génese os 46 cromossomas, isto é, 23 pares, 22 pares autossómicos, isto é não sexuais, e um par de cromossomas sexuais importantes para a determinação do sexo do indivíduo, designados por X ou Y. No caso dos indivíduos do sexo feminino dois cromossomas X, (genótipo XX) e no caso dos indivíduos do sexo masculino um cromossoma X e um cromossoma Y, (genótipo XY) [3,4]. Em cada cromossoma existem sequências específicas, designadas por genes nucleares, localizados em posições perfeitamente definidas, designados por locus (loci no plural) e são transmitidos por ambos os progenitores. Deste modo em cada locus de cada cromossoma existe uma forma génica de origem materna ou paterna, cuja informação codificada não é necessariamente igual. Cada uma das formas génicas localizada num determinado locus é designada por alelo. Assim, em cada locus pode existir uma ou duas formas génicas, uma de origem paterna e outra de origem materna. Se os alelos localizados em cada um desses locus apresentarem uma estrutura igual o indivíduo é Homozigótico para essa característica. Quando os alelos são diferentes o indivíduo é Heterozigótico para essa categoria [3]. Em todos os cromossomas existem sequências com função codificante e outras sequências com função não codificante. As regiões codificantes, correspondentes a 5% do genoma nuclear total e contêm a informação necessária para a síntese de proteínas [4]. As regiões não codificantes, correspondentes a 90-95% do genoma nuclear e têm permanecido com função desconhecida, apresentando grande variabilidade entre os indivíduos, excepto no caso de gémeos idênticos, sendo por esse motivo muito úteis na identificação genética dos indivíduos [-2][4]. De salientar que esta região é constituida por sequências não repetitivas (70-75%) e sequências repetitivas (25-30%) [2] sendo estas, as que apresentam grande variabilidade e consequentemente um elevado nível de polimorfismo, com grande utilidade na identificação humana, consequentemente muito úteis para aplicação forense. De salientar ainda, que o DNA é uma molécula invariável em todas as células do mesmo indivíduo transmissível de geração em geração com grande estabilidade o que permite a sua preservação mesmo em condições ambientais adversas, particularmente em condições de temperatura e humidade destrutivas para outras moléculas biológicas. Cláudia Isabel Vieira da Silva 3

Introdução Classes de Polimorfismos de D A O potencial dos polimorfismos localizado nos diferentes cromossomas foi descoberto inicialmente por Jefreys e seus colaboradores em 985. Jefreys verificou que existia um padrão aleatório de determinadas regiões de DNA diferente entre os indivíduos, localizado nas regiões não codificantes. Esta região não codificante é constituída por pequenos segmentos da cadeia repetidos em tandem, isto é, a mesma sequência repete-se um número variável de vezes na mesma região cromossómica. Cada um desses fragmentos é designado por unidade de repetição e o nº de repetições varia de indivíduo para indivíduo. Assim o perfil genético do indivíduo é caracterizado pelo nº de unidades de repetição que o seu genoma apresenta num determinado locus [5]. Em genética forense esta é a forma de distinguir dois indivíduos desde que não se tratem de gémeos homozigóticos. De acordo com o tamanho do segmento de DNA que inclui as unidades de repetição, estas sequências polimórficas podem ser classificados em: Minisatélites ou V TRs variable number of tandem repeats ou minisatélites Unidades de repetição com aproximadamente 20-70 pares de bases (pb), o que corresponde na prática a fragmentos de DNA com 500-20000 pb[5]. A sua utilização em genética forense não foi muito longa, devido ao tamanho dos fragmentos, o que tornava o seu estudo complexo e pouco fiável. Deste modo a sua aplicação forense é muito limitada, o que rapidamente contribuiu para a substituição destes marcadores por outros de menor tamanho[,5] Microsatélites ou STRs Short tandem repeats- são unidades de repetição de pequeno tamanho variável entre os 3 e os 7 pb que correspondem na prática a fragmentos de DNA com 50-500 pb [5] com grande dispersão no genoma humano. Estima-se que existam aproximadamente 500 000 STRs dispersos por todo o genoma humano, dos quais 6000-0000 são compostos por unidades de repetição com 3 ou 4 pb[6]. Estas unidades de repetição estão dispersas quer nos cromossomas autossómicos quer nos cromossomas sexuais. Estes fragmentos são relativamente pequenos, o que viabiliza com grande sucesso o seu estudo em amostras degradadas, sobretudo em amostras Cláudia Isabel Vieira da Silva 4

Introdução antigas e esqueletos humanos, com especial aplicação em estudos antropológicos e arqueológicos, contribuíndo para a reconstrução de genealogias históricas e estudos de genética populacional. Ao nível forense, estas características são particularmente úteis no estudo de amostras de cadávers em avançado estado de decomposição, quer em cadáveres sujeitos às mais diversas condições de degradação ambiental, isolados ou em valas comuns, tendo contribuído para o esclarecimento de alguns episódios menos positivos da história da humanidade. S Ps- Single ucleótide Polymorphims- consistem no estudo de uma única base localizada num determinado fragmento de DNA. São Polimorfismos de posição em que a variabilidade genética é devida a uma alteração numa única base nucleotídica. Estes sistemas proporcionam o estudo de regiões de DNA mais pequenoas do que os fragmentos usados para o estudo dos STRs[7]. Os SNPs podem igualmente ser estudados quer nos cromossomas autossómicos quer nos cromossomas sexuais e no DNA mitocondrial e estão numa fase de estudo e implementação a nível mundial. Contribuem, tal como os STRs para estudos antropológicos e arqueológicos e apresentam grande utilidade em amostras degradadas. Devido ao seu fraco poder de discriminação comparativamente aos STRs, atualmente só devem ser estudados em conjunto com estes marcadores. O estudo dos STRs e dos SNPs foi implementado devido à introdução de uma técnica laboratorial designada por PCR, descrita por Kary Mullis em 985. Esta metodologia consiste na amplificação in vitro de sequências de DNA específicas, contribuíndo para o aumento exponencial do número de cópias de um segmento de DNA de interesse, com grande sucesso quer em amostras seguras quer em amostras degradadas ou diminutas. Além de grande sensibilidade, a sua completa automatização deste procedimento contribui para análises mais rápidas do genótipo do indivíduo[,5]. Actualmente este procedimento laboratorial permite o estudo em simultâneo de vários loci, designadas por reacções multiplex, contribuindo para a preservação de amostras de evidências, pois é possível a obtenção de informação genética em muitos marcadores a partir de amostras diminutas. Na presente dissertação são estudados STRs específicos do cromossoma Y amplamente usados nos estudos de genética forense. Cláudia Isabel Vieira da Silva 5

Introdução O cromossoma Y Figura -imagem representativa de ambos os cromossomas sexuais. O cromossoma X e o cromossoma Y O cromossoma Y, caraterístico dos indivíduos do sexo masculino, é um dos cromossomas mais pequenos do genoma humano, representando aproximadamente 2% do total do material cromossómico nuclear [8]. Este cromossoma apresenta um tamanho aproximado de 60 milhões de pares de bases (pb) e apenas 6 genes codificantes localizados no braço mais pequeno, ou braço p, da sua estrutura [2,9]. Este cromossoma sexual está dividido em duas grandes regiões distintas, uma região de Eucromatina, região codificante, com tamanho fixo de aproximadamente 30 milhões de pares de bases e uma região de heterocromatina, região não codificante, com tamanho variável em cada indivíduo. Além das características referidas acresce a total ausência de recombinação genética com o cromossoma X, durante o processo de Meiose, excepto em duas pequenas regiões, localizadas nas extremidades do cromossoma, designadas respectivamente por PAR I e PAR II. A ausência de recombinação genética determina que todas as sequências localizadas fora dessas Retirada do site http://www.nature.com/nature/focus/ychromosome/ em 4/07/20 Cláudia Isabel Vieira da Silva 6

Introdução regiões, sejam transmitidas às gerações seguintes como um bloco, sem alterações genéticas a não ser que ocorra alguma mutação [8,9]. Desta forma é possível afirmar que este cromossoma é único nos indivíduos do sexo masculino, haplóide, por só existir um alelo em cada locus, salvo em situações de duplicação no mesmo locus, de herança uniparental paterna, sendo transmitido intacto de pai para filho, a não ser que ocorram fenómenos de mutação, quer por adição ou por deleção de unidades de repetição [9]. Estas características são de grande importância na genética forense. A ausência de recombinação genética implica que os haplótipos, isto é, o conjunto de características genéticas obtidas de um único cromossoma, com excepção das alterações apenas por mutação genética, permitem identificar linhagens paternas. De salientar que o cromossoma Y atual contém o registo de todas as mutações que ocorreram nas diferentes linhagens paternas ao longo da evolução, reflectindo a história das linhagens paternas [9]. O cromossoma Y, tal como os restantes cromossomas nucleares, apresenta sequências polimórficas traduzidas em variantes de comprimento como os microsatélites, designados por Y-STRs, em que as unidade de repetição podem variar tanto em número como em sequência [8] e variantes de posição designados por Y- SNPs, com baixas taxas de mutação e que permitem a construção de uma árvore filogenética única [9]. Os microsatélites definem variações no interior de determinados grupos populacionais, ou haplogrupos, permitindo a separação das populações humanas [0]. Os estudos iniciais com estes Y- STRs que constituem os marcadores genéticos, foram efectuados com um STR designado por DYS9, tendo sido descobertos e validados para a área forense um grande número de sequências polimórficas importantes, não só para esta área, mas também para estudos populacionais[8]. Os primeiros marcadores a serem recomendados para utilização forense foram os seguintes: DYS9, DYS385,DYS389I, DYS389 II, DYS390, DYS39, DYS392, DYS393. Com o objectivo de incrementar o poder discriminativo destes marcadores genéticos, foi recomendada a utilização dos marcadores DYS437, DYS438 e DYS439 selecionados pelo Scientific Working Group on DNA Analysis Methods e incluídos nos principais kits comerciais. Posteriomente a Cláudia Isabel Vieira da Silva 7

Introdução estes 2 marcadores foram adicinados DYS448, DYS456, DYS458, DYS635 e GATA H4 para garantir um maior poder discriminativo entre as linhagens paternas []. A figura 2 consiste numa representação em esquema da estrutura de um cromossoma Y, com as suas diferentes regiões, braço p e braço q, com indicação da região onde estão localizados os marcadores genéticos referenciados anteriormente. PAR I Região de Heterocromatina Figura 2 2 - Esquema representativo da estrutura do cromossoma Y, com os seus braços curto (p) e longo(q), regiões de recombinação genética (PAR e PAR2) e localização dos respectivos Y-STRs utilizados na área forense. PAR II A região não recombinante do cromossoma Y está localizada em todo o cromossoma, com a exceção das extremidades representas na cor laranja na Figura. A região não recombinante apresenta vários tipos de polimorfismos referenciados anteriormente e com ampla aplicação nas diferentes áreas referenciadas. Os marcadores representados com a cor azul, correspondem aos primeiros Y-STRs aplicados nesta área, e o conjunto das suas características genéticas obtidas num indivíduo é designado por Haplótipo Mínimo. Ao conjunto dos resultados de Y-STRs obtido com os marcadores do haplótipo mínimo com os marcadores DYS437, DYS438, DYS439, resultando num Haplótipo com características genéticas, é designado pelo Haplótipo Estendido, incluídos num kit comercial com o nome Powerplex Y System (Promega Corporation). Actualmente, são estudados no laboratório, na rotina dos casos forenses os 7 marcadores representados na tabela, incluídos num kit comercial designado por 2 Retirado do site http://www.cstl.nist.gov/strbase/ystrpos.htm em 7/07/20 Cláudia Isabel Vieira da Silva 8

Introdução AmpFlSTR Y Filer PCR amplification kit (Applied Biosystems, Foster City California), e que foram estudados no âmbito desta tese. Na tabela está representada a informação genética relativa aos Y-STRs usados neste trabalho, a sua respetiva designação técnica, estrutura genética da unidade de repetição e nº de repetições dessa mesma unidade descritas na literatura [2]. Tabela - Y-STRs usados actualmente na rotina dos casos forenses incluídos no AmpFlSTR Y filer PCR amplification kit, estrutura da unidade de repetição e nº possível de repetições em cada um destes locus. Y-STRs Estrutura genética da unidade de repetição (STR) º de repetições DYS9* (TAGA) 3 TAGG(TAGA) n 0-9 *DYS385a/b (AAGG) 6-7 (GAAA) n 7-25,28 *DYS389 I (TCTG) 3 (TCTA) n 9-7 *DYS389 II (TCTG) n (TCTA) n N28(TCTG) 3 (TCTA) n 23-34 *DYS390 (TCTA) 2 (TCTG) n (TCTA) n (TCTG) n (TCTA) n TCA(TCTA) 2 7-28 *DYS39 (TCTG) 3 (TCTA) n 6-4 *DYS392 (TAT) n 6-8 *DYS393 (AGAT) n 8-7 **DYS438 (TTTTC) (TTTTA) 0- (TTTTC) n 6-4 **DYS439 (GATA) n 8-5 DYS437 (TCTA) n (TCTG) -3 (TCTA) 4 3-7 DYS448 (AGAGAT) n N42(AGAGAT) n 7-23 DYS456 (AGAT) n 4-9 DYS458 (GAAA) n 3-20 DYS635 GATA H4 (TCTA) 4 (TGTA) 2 (TCTA) 2 (TGTA) 2 (TCTA) 2 (TGTA) 0,2 (TCTA) n (AGAT) 4 CTAT(AGAT) 2 (AGGT) 3 (AGAT) n N24(ATAG) 4 (ATAC) (ATAG) 2 7,9 26 24-30 Cláudia Isabel Vieira da Silva 9

Introdução Vantagens da aplicação dos marcadores do cromossoma Y A aplicação dos marcadores específicos do cromossoma Y na área forense tem vindo a crescer significativamente na última década com a descoberta e validação de novos marcadores. O seu valor nesta área é apoiado no facto de grande parte dos crimes violentos ser efectivamente provocado por um ou vários indivíduos do sexo masculino[], e como referenciado anteriormente a análise destes marcadores tem várias aplicações fundamentais, nomeadamente identificação da linhagem paterna de um indivíduo, a ancestralidade da mesma, bem como possivelmente a sua origem geográfica[3], o que pode contribuir para resolução de alguns tipos de crimes. Nos casos de abuso sexual um agressor pode ser identificado pela detecção do seu haplótipo numa amostra recolhida no local do crime. Os resultados obtidos podem permitir a obtenção de uma coincidência de perfis genéticos entre o vestígio recolhido e um potencial suspeito[3]. Por outro lado a ausência de resultados pode indicar que o vestígio biológico em estudo apresenta somente DNA feminino. Estas características têm contribuído para a aplicação crescente nos casos de abuso sexual. Nas amostras biológicas provenientes destes casos, habitualmente, existe mistura de material celular da vítima e do suspeito, em quantidades desproporcionais, na grande maioria dos casos com quantidade de material celular feminino consideravelmente superior à do suspeito. Nestas circunstâncias o estudo dos marcadores específicos do cromossoma Y, permite a obtenção de um perfil genético masculino, em muitos dos casos em que somente é detetado o perfil genético feminino quando aplicados os marcadores autossómicos. Esta é em muitos casos a única possibilidade de identificar o agressor. - A utilização destes marcadores pode ser útil na determinação do número de contribuintes masculinos para uma determinada amostra biológica. A presença de mistura de características masculinas nos diferentes marcadores pode indicar a presença de mais do que um contribuine do sexo masculino. Estes casos podem ser de difícil avaliação, na medida em que a obtenção de um perfil masculino do cromossoma Y na amostra, significa que foi identificada uma linhagem paterna e não um indivíduo específico. Cláudia Isabel Vieira da Silva 0

Introdução - A identificação da linhagem paterna em estudos de investigação de parentesco é mais uma aplicação forense destes marcadores. Estes podem ser particularmente úteis em casos de paternidade complexos com o presumível pai do filho do sexo masculino está ausente [3]. São frequentes os casos com recurso aos pretensos avós paternos para a determinação da paternidade do indivíduo. No entanto existem outras situações em que o recurso a esses familiares não é viável. A aplicação dos marcadores de cromossoma Y pode contribuir para a determinação da paternidade com recurso a outros familiares da mesma linhagem paterna. Como os perfis do cromossoma Y são idênticos na mesma linhagem paterna, a não ser que ocorra um fenómeno de mutação, a avaliação pode ser efectuada por observação da coincidência entre o perfil do presumível familiar e o perfil do filho. Nos casos de identificação de desconhecidos e sobretudo nos acidentes de massa, pode contribuir eficazmente para a identificação das linhas paternas nas vítimas. - A aplicação na história evolutiva da humanidade e estudos migratórios, contribui para o esclarecimento da origem geográfica ancestral das linhagens masculinas e assim realizar estudos sobre os fluxos migratórios humanos nos últimos milhares de anos, bem como a compilação dessa informação em bases de dados internacionais. Estes conhecimentos podem ainda ser utilizados para a identificação do grupo étnico de determinado suspeito [3]. Desvantagens da utilização do cromossoma Y Os marcadores genéticos do cromossoma Y não são independentes uns dos outros. A sua transmissão ocorre em bloco, designado por haplótipo, contribuindo para a identificação da linhagem paterna. No entanto, o facto de todos os indivíduos relacionados pela via paterna partilharem o mesmo perfil genético masculino, pode constituir uma limitação na sua aplicação, na medida em que inviabiliza a discriminação genética entre estes indivíduos. Mas apesar deste facto a sua utilidade em genética forense é contudo enorme, pois em muitos casos os resultados genéticos destes marcardores são a única prova baseada na evidência que permite estabelecer a ligação entre o suspeito e as amostras biológicas associadas ao processo criminal. No entanto Cláudia Isabel Vieira da Silva

Introdução sempre que possível devem ser analisados em conjunto com os marcadores autossómicos [8]. Análise dos resultados do Cromossoma Y Um perfil genético do cromossoma Y diz-se que é coincidente com o perfil da linhagem paterna se existir coincidência entre todos os alelos das amostras em comparação. No SGBF, essa análise é qualitativa e consiste unicamente em verificar se existe ou não coincidência entre todos os alelos, isto é se os perfis genéticos são coincidentes ou não são coincidentes, não existindo até à data nenhuma forma de efectuar uma avaliação matematica e consequentemente calcular a probabilidade de um indivíduo contribuir ou não para um determinado vestígio. Não existe no entanto consenso generalizado relativamente à aplicação destes marcadores genéticos. Nos casos em que não existe coincidência entre todos os marcadores genéticos, parece não existir dúvidas relativamente à exclusão de um determinado indivíduo de determinada linhagem paterna, mas não existe consenso na forma de utilização dessa informação em sede de tribunal, sempre que ocorre uma coincidência entre o perfil masculino do suspeito e a amostra de vestígio [0]. Nos casos de investigação de parentesco os marcadores masculinos podem ser particularmente úteis em casos cujo objectivo é analisar se dois indivíduos estão relacionados por via paterna, como por exemplo, num caso em que o presumível pai esteja desaparecido. Se existir uma coincidência entre o perfil masculino dos intervenientes poderá existir então um laço de parentesco entre eles pela via paterna. Se não existir essa coincidência será necessário avaliar quais os marcadores em que foi detetada alguma incompatibilidade, considerando a possibilidade de a mesma ser devida a mutação genética. De salientar nestes casos que a distância entre gerações de indivíduos é um factor que contribui para aumentar a probabilidade de ocorrência de diferenças alélicas entre os indivíduos. Deste modo essas incompatibilidades observadas serão o resultado de alterações genéticas entre gerações e não devem ser avaliadas como se se tratassem de exclusões de laços de parentesco entre os indivíduos. Assim as taxas de mutação são Cláudia Isabel Vieira da Silva 2

Introdução particularmente importantes e devem ser obtidas para utilização na rotina dos casos forenses. Taxas de Mutação dos Loci do cromossoma Y Uma mutação é detectada se existirem diferenças num ou dois loci envolvendo uma ou duas unidades de repetição na transmissão hereditária destas características genéticas. Nestes casos a coincidência de perfis genéticos de dois indivíduos alegadamente pertencentes à mesma linhagem paterna deve ser reconsiderada, dada a informação existente relativa às taxas de mutação [4]. As mutações dos STRs nos marcadores autossómicos ou do cromossoma Y são o resultado de erros no DNA durante a fase da replicação, que normalmente implicam o ganho ou a perda de uma única unidade de repetição e são transmitidos à geração seguinte [4] Em genética populacional, a estimativa aproximada das taxas de mutação dos marcadores de cromossoma Y é particularmente importante para a datação da origem das linhagens paternas, com importância em estudos antropológicos. Em termos forenses, o conhecimento das taxas de mutação é necessário para a interpretação mais correta dos dados relativos aos Y-STRs, sobretudo nos testes de investigação de parentesco [4] [5]., As taxas de mutação relativas para os STRs autossómicos podem ser estimadas pela aplicação de modelos estatísticos, mas as estimativas obtidas a partir da observação directa em casos de investigação de parentesco produzem resultados mais fidedignos [4]. O mesmo princípio pode ser aplicado no caso dos Y-STRs, no entanto, em contraste com os estudos efectuados com os marcadores autossómicos existem poucos dados relativos aos marcadores do cromossoma Y. A nível internacional existe um repositório relativo a marcadores do cromossoma Y, Y-STRs ou Y-SNPs, aplicados na área forense, localizado no domínio www.yhrd.org [6]. Este repositório reúne informação de todos os laboratórios associados que têm contribuido com os seus dados laboratoriais inclusive informação relativa às taxas de mutação. No entanto, tratam-se de taxas de mutação conjuntas, o Cláudia Isabel Vieira da Silva 3

Introdução que devido à grande heterogeneidade populacional podem não corresponder às taxas de mutação do grupo populacional do sul de Portugal objecto deste trabalho. Essa informação pode ser obtida em cada laboratório recorrendo ao estudo de pares pai/filho com paternidade confirmada [4]. Valorização estatística dos resultados As técnicas de análise genética altamente sensíveis permitem a obtenção de um perfil genético nas diferentes amostras em estudo, seja um vestígio recolhido no local do crime, sejam as amostras de referência dos intervenientes, quer dos exames de investigação de parentesco, quer dos intervenientes nos casos criminais. Nos casos criminais o objectivo é verificar se o perfil genético do suspeito é ou não coincidente com o perfil obtido nos vestígios biológicos em estudo no âmbito do respectivo processo. Nos casos de parentesco é necessário verificar se existe ou não coincidência entre os perfis genéticos dos indivíduos em estudo. Actualmente essa avaliação é efectuada de forma qualitativa e as conclusões dos relatórios são baseadas unicamente na coincidência/não coincidência entre perfis genéticos, não existindo até à data uma forma de valorização estatística deste tipo de resultados. É necessário encontrar uma metodologia que permita quantificar a relação entre perfis genéticos obtidos em amostras distintas, metodologia essa traduzida em valores de probabilidade, de alguma forma esclarecedores para quem terá de tomar a decisão em sede de tribunal. Em todos os casos existe sempre alguma incerteza e a incerteza é medida em termos de probabilidade [7]. Os resultados do DNA nas evidências biológicas são vistos como muito poderosos, quer para condenar, quer para ilibar um indivíduo [8], sobreduto porque em muitos dos casos de criminalidade, ou até mesmo nos casos de investigação de parentesco, não existem muitas evidências além dos exames genéticos. O importante nestes casos, quando existe matching de um determinado perfil de DNA, não é o matching per si, mas a valorização matemática do mesmo [9]. Nos casos Cláudia Isabel Vieira da Silva 4

Introdução de investigação de parentesco a informação relativa aos marcadores autossómicos deve ser conjugada com a informação relativa aos marcadores do cromossoma Y. Nos casos criminais, na ausência de resultados de marcadores autossómicos, é necessário encontrar um modelo matemático que permita quantificar a associação entre perfil genético de uma amostra biológica coincidente com o perfil genético do suspeito sendo ele culpado ou não culpado [9]. Objectivo do Trabalho O Serviço de Genética e Biologia Forense introduziu o estudo dos Y-STRs na sua rotina de exames periciais, sobretudo nos casos de abuso sexual, no entanto não existe até à presente data uma metodologia estatística que permita quantificar a coincidência de um perfil genético masculino obtido numa amostra biológica e o perfil genético de um suspeito. Nas investigações de parentesco complexos, com recurso a familiares da linha paterna, não existe igualmente implementado um procedimento para valorização estatística recorrendo aos marcadores do cromossoma Y. Neste sentido urge encontrar novas metodologias estatísticas capazes de resolver este problema. Para a correta interpretação dos resultados de Y-STRs e a sua aplicação na rotina dos casos forenses é necessário conhecer a distribuição das características alélicas de Y- STR na população de referência que apresentam maior diversidade, isto é mais discriminativos, bem como quais os haplótipos mais frequentes. O estudo destes marcadores implica estudo das taxas de mutação para cada um dos marcadores em análise. Os marcadores em estudo, atualmente aplicados na rotina dos casos forenses, são os recomendados pelas ISFG (international Society For Forensic genetics) incluídos no kit comercial AmpFlSTR Y Filer, designados por: DYS9, DYS385a/b, DYS389, DYS390, DYS39,DYS392,DYS393, DYS437, DYS438, DYS439, DYS456, DYS458, DYS635, GATA H4 e DYS448. O estudo populacional será efectuado através de uma pequena amostra de indivíduos do sexo masculino não aparentados, cujo critério de selecção foi terem recorrido ao SGBF para realização de exames de parentesco. As taxas de mutação, estudadas recorrendo aos pares pai/filho, com paternidade Cláudia Isabel Vieira da Silva 5

Introdução comprovada recorrendo aos marcadores de STRs autossómicos, poderão ser estimadas recorrendo a metodologia bayesiana. O conhecimento das características genéticas dos Y-STRs permitirá o cálculo das probabilidade de matching quer nos casos de investigação de parentesco, quer nos casos de criminalística biológica de forma a que as metodologias possam ser aplicadas na rotina dos casos forenses. Cláudia Isabel Vieira da Silva 6

Capítulo 2 2. Material e Métodos Estudo Biológico Amostras Biológicas A primeira fase deste trabalho, relativo ao estudo populacional e taxas de mutação foi realizada recorrendo à análise genética de 97 pares pai/filho, seleccionados a partir dos casos de rotina estudados no SGBF, cuja relação de paternidade foi previamente comprovada durante o respectivo processo de investigação de parentesco. Em todos os intervenientes foi efectuada colheita de sangue em cartões Whatman bloodstain card e células da mucosa bucal em zaragatoa Whatman sterile omniswab. As amostras foram armazenadas nas mesmas condições. A extracção de D A A fase inicial do estudo de DNA consiste na separação desta molécula dos restantes constituintes celulares. Esta fase de procedimento laboratorial é designada por extracção de DNA. Nas amostras biológicas de referência foi aplicado o método de chelex [20] e nas amostras de vestígios biológicos dos casos criminais foi aplicado o método de fenol/clorofórmio com purificação de

Material e Métodos álcool isoamílico[2]. Ambos os métodos foram realizados a partir de protocolos existentes no serviço. Amplificação e Análise dos Y-STRs A análise dos marcadores de DNA é efectuada recorrendo à técnica de PCR. Esta metodologia consiste na amplificação, isto é na multiplicação do número de cópias de determinadas sequências de DNA, correspondentes aos marcadores genéticos validados para a área forense, contribuíndo para a sua análise posterior desses fragmentos amplificados. Todas as amostras estudadas neste trabalho foram sujeitas à mesma metodologia para obtenção dos resultados genéticos. As amostras biológicas de pares Pai/Filho provenientes da população residente no sul de Portugal Continental, foram previamente estudadas no âmbito das investigações de parentesco, com dois kits multiplex, AmpFlSTR Identifiler PCR (Applied Biosystems, Inc, Foster City, CA, USA) amplification kit e Powerplex 6 system (Promega Corporation). Estes kits devidamente validados para a área forense, permitem a amplificação simultânea de 5 marcadores de STRs autossómicos bem como do locus da Amelogenina, gene localizado nos cromossomas sexuais utilizado para a determinação do género do indivíduo. Após a análise destes STRs é verificada a partilha de um dos alelos entre o pai e o filho em todos os loci e após esta fase é efectuado o cálculo da Probabilidade de Paternidade e da Razão de Verosimilhança. Somente foram usados neste estudo indivíduos cujos valores da probabilidade de paternidade é superior a 99,9999% com índices de paternidade superiores a 0000, conforme sugerido por outros autores, nomeadamente Gusmão et al [22]. As amostras selecionadas foram estudadas nos seguintes marcadores genéticos: DYS9, DYS385a\b, DYS389I, DYS389II, DYS390, DYS39, DYS392, DYS393, DYS437, DYS438, DYS439, DYS448, DYS456, DYS458, DYS635 e GATA-H4, incluídos no Kit Amp FlSTR Y Filer (Applied Biosystems Inc, Foster City, CA, USA). A amplificação foi realizada com µl de DNA extraído, num volume de reacção total de 2,5 µl, em vez dos 25 µl sugeridos Cláudia Isabel Vieira da Silva 8