Guia de Bolso HTML e XHTML Este guia de bolso oferece uma listagem concisa, porém abrangente, dos elementos e atributos especificados nas Recomendações HTML 4.01 e XHTML 1.0. O texto utiliza a abreviação (X)HTML para conceitos que se aplicam a ambas linguagens de marcação. Este livro se organiza nas quatro seguintes seções: HTML e XHTML Básico; Lista Alfabética de Elementos; Entidades de Caractere; Especificando Cores. HTML e XHTML Básico HTML (HyperText Markup Language) é uma linguagem de marcação usada para transformar documentos de texto em páginas web. O objetivo fundamental do HTML como uma linguagem de marcação é proporcionar uma descrição semântica (o significado) do conteúdo e estabelecer uma estrutura (uma hierarquia de elementos) ao documento. Esta linguagem não se ocupa da apresentação, tal como o documento será exibido pelo navegador. A apresentação é tarefa das Cascading Style Sheets (CSS), que está fora da abrangência deste livro. A versão atual do HTML é definida pela Recomendação HTML 4.01. XHTML (extensible HyperText Markup Language) é uma reformulação do HTML 4.01 conforme regras mais rigorosa de sintaxe de XML (extensible Markup Language). Os elementos são os mesmos, mas há mais restrições para a marcação de documentos, que serão listadas na próxima seção. O XHTML inclui uma família de recomendações, incluindo XHTML 1.0, XHTML 1.1, Modularização de 1
XHTML, ZHTML Básico e outras versões ainda em desenvolvimento. Este guia se concentra na Recomendação XHTML 1.0. Para detalhes sobre todas as versões de HTML e XHTML, consulte a home page do World Wide Web Consortium em www.w3.org/markup. Como o XHTML Difere do HTML Já que XHTML é uma linguagem XML, sua sintaxe é mais estrita e difere do HTML principalmente nos seguintes aspectos: Todos os elementos e atributos devem ser digitados em minúsculas. Por exemplo: <a href="exemplo.com. br">...</a>. Todos os elementos devem ser fechados ou seja, devem incluir uma tag final. Por exemplo: <p>...</p>. Elementos vazios também devem ser fechados. Isso é feito ao se incluir uma barra ao final da tag. Geralmente se adiciona um espaço depois da barra para ficar compatível com versões mais antigas de navegadores. Por exemplo: <hr />, <img />, <meta />. Todos os atributos de valor devem estar dentro de aspas (ou aspa). Por exemplo: <td colspan="2">. Todos os atributos de valor devem ser explícitos e não podem ser reduzidos a uma palavra, como é permitido no HTML. Por exemplo: checked="checked" selected="selected" multiple="multiple" Restrições de encadeamento são reforçadas mais estritamente. Tais restrições são explicitamente declaradas: Um elemento não pode conter outro elemento; O elemento pre não pode conter img, object, applet, big, small, sub, sup, font ou basefont. O elemento form não pode conter outros elementos form. 2 Guia de Bolso HTML e XHTML
Um elemento button não pode conter a, form, input, select, textarea, label, button, iframe ou isindex. Os caracteres especiais <, >, &, ' e ", sempre devem ser representados pelas suas entidades de caractere, inclusive quando aparecem dentro de atributos de valor. Por exemplo, <, >, &, &apos e " (respectivamente). Em HTML, o atributo name pode ser utilizado para os elementos a, applet, form, frame, iframe, img e map. Os atributos name e id podem ser usados em HTML para identificar fragmentos de documentos. Documentos em XHTML devem utilizar id ao invés de name para identificar fragmentos de documento nos elementos acima mencionados. Na verdade, o atributo name para estes elementos foi desaprovado na especificação XHTML 1.0. Três Versões de (X)HTML As Recomendações HTML 4.01 e XHTML 1.0 abrangem três levemente diferentes documentos de especificação, chamados Document Type Definitions (ou DTDs). Estes documentos definem todos os elementos, atributos e entidades juntamente com as regras para o seu uso. As três versões são: DTD Estrito Esta versão elimina todos os elementos e atributos que foram desaprovados (tais como font e align) para reforçar a separação entre estrutura e apresentação de um documento. DTD Transitório O DTD Transitório inclui todos os elementos e atributos desaprovados para ser compatível com o comportamento legado de versões anteriores de navegadores. Os elementos e atributos desaprovados são permitidos, mas seu uso não é incentivado. DTD Frameset O DTD Frameset inclui os mesmos elementos que o DTD Transitório, mas adiciona elementos para a criação de páginas web HTML e XHTML Básico 3
com frames (frameset, frame, noframe). O DTD Frameset é mantido separado porque a estrutura de um documento com frames (onde frameset substitui body) é fundamentalmente diferente de documentos normais em HTML. OBSERVAÇÃO A Recomendação XHTML apresenta apenas um DTD que é similar ao DTD Estrito, já que não inclui elementos e atributos desaprovados. A próxima seção mostra como os DTDs são identificados dentro de documentos (X)HTML. Estrutura Mínima de Documento Esta amostra de marcação expõe a estrutura mínima de um documento HTML 4.01. Este exemplo usa o DTD Estrito do HTML: <!DOCTYPE HTML PUBLIC "-//W3//DTD HTML 4.01//EN" "http://www.w3.org/tr/html4/strict.dtd"> <html> <head> <title>título do Documento</title> </head> <body> Conteúdo do Documento... </body> </html> Esta amostra de marcação exibi a estrutura mínima de um documento XHTML 1.0 conforme especificado na Recomendação XHTML 1.0. Este documento é escrito utilizando o DTD Transitório do XHTML: <!DOCTYPE html PUBLIC "-//W3//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/tr/xhtml1/dtd/xhtml1- transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" 4 Guia de Bolso HTML e XHTML
xml:lang="en" lang="en"> <head> <title>título do Documento</title> </head> <body> Conteúdo do Documento... </body> </html> Nos dois exemplos, a primeira linha é a Declaração de Tipo de Documento (ou declaração DOCTYPE), que mostra a versão DTD empregada no documento é utilizada para verificar a validade do mesmo. Alguns navegadores também utilizam a inclusão para alternar ao modo de renderização conforme padrão. Observe que o documento XHTML usa uma declaração DOCTYPE diferente da usada pelo documento HTML e inclui nome de espaço XML e identificação de linguagem no elemento raiz html. Documentos XHTML podem, opcionalmente, incluir uma declaração XML diante da declaração DOCTYPE, como mostrado neste exemplo: <?xml version="1.0" encoding="utf-8"?> <!DOCTYPE html PUBLIC "-//W3//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/tr/xhtml1/dtd/xhtml1-strict. dtd"> Uma declaração XML não é necessária quando o padrão de codificação de caractere for UTF-8. Dado que as declarações XML causam problemas mesmo para navegadores compatíveis com os padrões, quando este texto foi escrito, eles foram omitidos. DOCTYPEs para DTDs Disponíveis A declaração <!DOCTYPE> (tipo de documento) contém dois métodos para apontar à informação do DTD: o primeiro é um identificador de documento publicamente reconhecido e o segundo é uma URL específica para o caso do navegador não reconhecer o identificador público. As declarações DOCTYPE exatas para cada versão de HTML e de XHTML são listadas abaixo: HTML e XHTML Básico 5