Táticas de Eficiente em Banco de Dados Kory L. Meyerink, MLS, AG, FUGA Salt Lake City, Utah E-mail: KoryM@comcast.net Online ou off-line, a pesquisa genealógica moderna exige uma busca eficiente em bancos de dados. Com milhões de nomes em centenas de bancos de dados diferentes, é fácil um antepassado se perder. O sucesso de sua pesquisa depende de saber a melhor maneira de pesquisar cada coleção diferente. Booleana, truncamento, palavra-chave, dados em campos, proximidade, expressão, caracteres e palavras curingas não são termos estrangeiros, mas, em vez disso, são suas chaves para o sucesso genealógico! Tipos de bancos de dados Organizados em campos Texto ESBOÇO DE DISCUSSÃO Métodos/sintaxe de pesquisa Palavra-Chave Fonética (Soundex, Metaphone) Caracteres curinga Truncamento Expressão Booleana por campo Limitar Proximidade de sequência de caracteres Vocabulário controlado/cabeçalhos de assunto Agrupamento Técnicas de busca Menos é mais Escolha o(s) campo(s) correto(s) Opções avançadas de busca Termos alternativos Experiência Catálogos da biblioteca Dados organizados em campos Vocabulário controlado Versões alternativas do banco de dados
Exemplos de pesquisa booleana e correlatos Tipos de pesquisa de exemplo Encontrar os resultados que contenham Palavra (palavra-chave) keokuk keokuk AND (geralmente automático) família Snow tanto snow quanto família OR (pode ser ) nascimento OR casamento nascimento ou casamento (-) chamberlain -neville chamberlain, mas não neville por expressão cidade de Nova York a expressão: "cidade de Nova York Sinônimos (palavras semelhantes) ~genealogia árvore familiar história da família sobrenome pela raiz de palavras (variantes de palavra) plasket plasket e plaskett Interromper busca forçada por palavras +is +to is to Truncamento cas casar, casado, casamento Curingas: caractere Sm?th Smith, Smyth Curingas: múltiplos town* towns, township, townland Proximidade (near/adj) ellis york@5 ellis e york com espaçamento de até 5 palavras Soundex (fonético) chamberlain chamberlin, chambers, etc. Onde encontrar versões alternativas de alguns bancos de dados Sites importantes de bancos de dados de genealogia Sites governamentais (principalmente para registros vitais) Sites de condados da GenWeb Sites de registros específicos (como listas de cemitérios ou de passageiros) Algumas coleções acadêmicas Referências bibliográficas sobre buscas Calishain, Tara. Web Search Garage. Upper Saddle River, NJ: Prentice Hall, 2005. Crume, Rick. Top 10 Public Libraries (10 melhores bibliotecas públicas) FamilyTreeMagazine.com 10/8/2010. Hill, Brad. Google for Dummies. New York: Wiley Pub., 2003. 360 pgs. Lynch, Daniel M. Google Your Family Tree. Provo: FamilyLink.com, 2008. 340 pgs. Mann, Thomas. The Oxford Guide to Library Research, 3 a ed. New York: Oxford, 2005.
ProQuest Database Guide: Heritage Quest Online (Online: ProQuest, 2010), <http://www.proquest.com/assets/downloads/products/hqo_db_guide.pdf> accessed Nov. 2013. Research Buzz periódico online diário de Tara Calishain <http://www.researchbuzz.com> newsletter@researchbuzz.com
Comparação de recursos de busca em bancos de dados selecionados Observação: Alguns bancos de dados têm parâmetros de pesquisa diferentes. [# indica qualquer número] Fornecedor/ba nco de dados Fonético Booleana Truncamento Caracte re Curinga Expressão Proxi- midade Ancestry Soundex * after 3 * Sim Textos do Internet Archive Fuzzy ~ Heritage Quest: PERSI Google AND, OR, * * aspas and, or, not * aspas Sim AND, OR, Raiz palavra na expressã o aspas GNIS auto and * * aspas Sim Bowker / Books in Print Chadwyck - Healey RootsWeb Fold3 World Bio. Info. Systems Arquivo de jornal Desconhecid o Desconhecid o Soundex Metaphone and, or, andnot * and, or, not *? default near. # * * aspas Sim AND, OR, AND, OR, Sim, por campo * * aspas * * aspas Sim, campo por campo Usa caixas de entrada do campo. biográfica Genealogy Bank and, or, not *? aspas near# Name & date The Genealogist Sim * Sim Encyclopedia Britannica Origins Network WorldCat * não disponível NameX * *,? and, or, not +,, - * or? after 3 #,? aspas n# GaleNet and, or, not *? aspas n# JSTOR and, or, andnot + for -s or es Sim near Sim Classificar colunas personalizada Usar menus suspensos Oxford Eng. and, or, *? default near, Usar menus
Dictionary and not before, after suspensos Definições Booleana Método de busca que usa dois ou mais termos, combinados ou excludentes, e conectores específicos (chamados de 'operadores') que definem a relação entre as duas palavras. Os conectores geralmente são: AND, OR,. A busca tem esse nome por causa de George Boole. Vocabulário controlado Palavras com significados semelhantes ou relacionados são mapeadas a uma palavra específica. As pesquisas que utilizarem essa palavra terão como resultado todas as palavras do mapa. Exemplo: Bavária, Prússia e Hessen são todas mapeadas a Alemanha nas pesquisas do recenseamento dos EUA, no Ancestry.com. por campo As solicitações de pesquisa são feitas em campos especificamente identificados e encontram como resultado somente os dados correspondentes que estão naquele campo. Dados organizados em campos Todas as informações de um banco de dados são inseridas em campos específicos, tais como Nome, Local de nascimento, Data de falecimento, etc. Palavra-chave Tem a capacidade de pesquisar uma palavra específica, geralmente em vários campos de dados. Além disso, é a busca por palavras importantes em meio a palavras irrelevantes, de parada, que não são procuradas na pesquisa. Limitada Exige que os resultados de busca estejam dentro de um intervalo específico, como o campo de data em um catálogo de biblioteca. Agrupamento A pesquisa booleana exige que certas combinações (busca agrupada) sejam feitas antes de outras. Fonéticos por palavras (especialmente sobrenomes) com sonoridade semelhante, mas que podem ser escritas de modo diferente. Existem vários sistemas diferentes de indexação. Dois dos mais comuns são Soundex e Metaphone. Expressão duas ou mais palavras em uma sequência específica. As palavras geralmente são digitadas entre aspas duplas Proximidade Os termos de pesquisa podem ser encontrados próximos uns dos outros no conjunto de dados. Geralmente, a distância pode ser definida como um número específico de caracteres ou palavras.
por sequência qualquer número de caracteres consecutivos Cabeçalhos de assunto Nos catálogos de biblioteca, palavras especificamente selecionadas são usadas para categorizar vários tópicos relacionados. Por exemplo, o termo Impostos pode ser usado para taxas, impostos territoriais, tributos, tributáveis, etc. Texto Um conjunto de dados que é composto basicamente de texto eletrônico. As informações não estão separadas em campos específicos. Também chamado de texto livre. Truncamento que utiliza apenas as primeiras letras (geralmente três a cinco, ou mais) de uma palavra para obter uma lista de todas as palavras que começam com essas letras. Caracteres Curinga Uso de um símbolo para representar uma ou mais letras em uma pesquisa. Símbolos típicos incluem? que substitui qualquer letra e * que representa duas ou mais letras.