Introdução ao XML Extensible Markup Language
Tutorial - XML XML: Extensible Markup Language Uma linguagem de marcas na estruturação, no armazenamento e no transporte de dados na Web Gere os dados numa estrutura tipo árvore. Só uma raiz Descrição dos dados em formato texto. Simples, permite que seja utilizado a través de diferentes plataformas de software e hardware Simples de perceber e de ler. Para o computador e as pessoas Excelente para armazenamento de dados no longo prazo Utiliza um conjunto de módulos capazes de responder as diferentes tipos de demandas dos utilizadores Um simples exemplo: catalogo de plantas (Não há display!) 2
Tutorial - XML Apoiado em diferentes módulos: XSLT: Linguagem extensível de Folhas de Estilo. Mostra como deve ser estruturado o conteúdo, como desenhar o conteúdo de origem, como deveria ser paginado para apresentações (Extensible Stylesheet Language Transformation). exemplo Xlink: Linguagem de ligação XML. Permite inserir elementos em documentos XML para criar ligações entre recursos XML Xpath: Linguagem de rotas XML. Permite o acesso a partes dum documento XML. Xpointer: Linguagem de redireccionamento Permite o acesso a estrutura interna dum documento XML: elementos, atributos, conteúdos XQL: Linguagem de pesquisa XML. Facilita a extracção de dados desde documentos XML. 3
Tutorial XML DTD Linguagem para definição do esquema. Especificação do XML 1.0 Estrutura Esquema XML Definição da linguagem do esquema do documento Selecção XPath Linguagem para indicar caminho dum documento XML na sua estrutura de árvore para seleccionar elementos e atributos Transformação XSLT Especifica o mecanismo para transformar um doc. XML num documento XML de estrutura diferente Mostrar (display) CSS XSL-FO Uma especificação do formato do desenho de dados no XML e HTML Linguagem para descrição do desenho dum doc XML Protocolo SOAP Protocolo de mensagem baseado no XML 4
Tutorial - XML Não confundir XML com HTML = Hyper Text Markup Language Ambas duas, XML e HTML utilizam tags, (marcas), mais tem diferenças: HTML desenhada para mostrar dados. XML, desenhada para armazenar e transferir dados As marcas do HTML são predefinidas (<p> <tr> <href > As marcas em XML as define você. A única restrição é respeitar o aninhamento das marcas <nome> <primeiro>ana Sofia</primeiro> <apelido>guimarães</apelido> </nome> Cada peça individual de dados colocada entre as marcas Antes de aprender XML era conveniente primeiro dar uma vista de olhos ao HTML e ao javascript 5
Tutorial - XML <?xml version="1.0" encoding="utf-8"?> <!DOCTYPE tuplo-produto SYSTEM "file:///c:/xml/edit_produto.dtd"> <tuplo-pruduto> <produto id= HP-G6-4000 > <nome> Laptop HP Pavillion g6</nome> <categoria> computador portatil</categoria> marca> Hewlett-Packard <preço> 538,50</preço> <link> http://www.hewlett-packard.com</link> </marca> <caracteristicas> processador Intel core i5 dual, 2.6Ghz, 4 Gb RAM, placa gráfica super boa, etc </caracteristicas> </produto> </tuplo-pruduto> 6
Documentos bem formados Bem formados (well formed): documentos que cumprem todas as definições básicas de formato. Assim podem ser analisados por qualquer analisado sintáctico (parser) que cumpra com a norma Documentos devem seguir: Estrutura estritamente hierárquica das etiquetas (tags) delimitadoras. Etiquetas devem estar correctamente aninhadas Os elementos com conteúdos devem estar correctamente fechados Só um elemento raiz a partir do qual todos os outros são parte. ( tuplo_produto no exemplo) 7
Documentos bem formados Os valores de atributos devem estar entre aspas simples o duplas. <nome id= 207875342 >Maria José</nome> XML é sensível a maiúsculas e minúsculas. Existem caracteres "espaços em branco" (espaços, tabulações, saltos de linha, "returns") que os processadores XML tratam conforme o parser XML. É preciso atribuir nomes as estruturas, tipos de elementos, entidades, elementos particulares, etc. As construções etiquetas, referencias de entidade e declarações se chamam marcas; são parte do documento. O resto do documento entre marcas corresponde aos dados 8
Partes dum documento XML Duas partes: prólogo e corpo do documento Prólogo: (opcional) Uma declaração indicando que se trata de um docto. XML A versão do XML Uma declaração do tipo de documento. Relaciona o documento com a sua DTD (document type definition) Um ou mais comentários e Instruções de processamento Ex.: <?xml version="1.0" encoding="iso-8859-1"?> A DTD especifica o tipo de documento, as restrições da estrutura e a sintaxe do documento 9
Partes dum documento XML Corpo: <obrigatótio. Não é opcional. Deve pelo menos conter um elemento raiz <?xml version="1.0" encoding="iso-8859-1"?> <livro> <titulo>o livro das Mentiras</titulo> <capitulo> <ctitulo>capitulo III: a mentira sempre se descobre </ctitulo> <seção> <stitulo>mentiras e boatos</stitulo> </seção> </capitulo> </livro> 10
Partes dum documento XML Marcas (tags) <produto>...</produto> Identificadas por qualquer nome que o programador quiser lhe dar Elementos produto Os elementos XML podm ter conteúdo (outros elementos, caracteres ou ambois dois).ou bem estar vazios Atributos (um par nome/valor) Os elementos podem ter atributos, ou seja, as características dos elementos dum documento. Devem ser inseridos entre aspas. Estaõ entre as tags do elemento Ex.: o elemento «barco» tem um atributo «nome» e um atributo «matricula», con valores "furação" e «C-049» <barco nome= "furação" matricula="c-049"> Que lindo barco de Faro </barco> Ex.: O elemento imagem tem dois atributos, fonte e autor: <imagem fonte="madonna.jpg" autor="foligno Madonna, Rafael"</imagem> 11
Partes dum documento XML Entidades predefinidas Entidades para representar caracteres especiais, de maneira não serem interpretados sintacticamente pelo parser XML. As entidades podem ser: Internas o externas Analizadas o no analizadas Generais ou parametrizadas < < Menor que > > Maior que & & comercial &apos ' plica " aspas 12
Partes de um documento XML Secção CDATA Uma construção para especificar dados que não serão interpretados Como alias são todos os dados no interior de marcas Não confundir com (#PCDATA) que serve para os elementos. Permite que caracteres especiais não rompam a estrutura. CDATA (unparsed character data) A secção CDATA começa com: "<![CDATA[" e termina com: "]]>": <![CDATA[conteúdo especial: \n áéíóúñ&]]> Comentários Serão ignorados pelo processador. <!--- Un comentario ---> <!-- Otro comentario --> 13
<comparação> <![CDATA[ function compara(a,b,c) { if (a > b && b > c) then { return 1; } else { return 0; } } ]]> </comparação> Partes de um documento XML O parser do XML não vai interpretar o código em CDATA 14
Partes de um documento XML Tipos de atributos Atributos CDATA e NMTOKEN Atributos enumerados y notações Atributos ID e IDREF: para restrições referenciais 15
Partes de um documento XML PCDATA (parsed character data) Em geral XML faz a interpretação de todos os caracteres do texto No "parser", o texto entre as marcas (tags) é também processado: <mensagem>este texto será processado pelo parser</mensagem> Isto é feito porque uns elementos podem conter outros elementos Repare: elemento <pessoa> contem dois outros elementos (nome e apelido): <pessoa> <nome>josé</nome> <apelido>saramago</apelido> </pessoa> Outros exemplos em: http://www.w3schools.com/xml/xml_examples.asp 16
Exemplos XML Em XML você define as marcas <?xml version="1.0" encoding="iso-8859-1"?> <nota> <para>angelina Jolie</para> <de>patricio</de> <cabecalho>lamento imenso!</cabecalho> <corpo>não consigo estar contigo hoje</corpo> </nota> Validade: acima se indica o standard seguido para ser considerado um documento bem formado. Só que isso não chega!! 17
Tutorial - XML Tal como no caso das BD, um documento XML tem uma espécie de descritor dos seus dados. Isto pode ser feito com uma DTD ou com um XML schema DTD: DATA TRANSFER DEFINITION Uma estrutura que define os dados a serem manipulados. Uma metadata: Definição dos dados sobre os dados Na DTD se definem os tipos de elementos, atributos e entidades permitidas. Pode ser interna (no documento) ou externa (ficheiro) Os documentos XML que se ajustam a sua DTD são denominados válidos A DTD faz parte do standard do XML 18
Tutorial - XML Eis a A DTD do documento tuplo-produto anterior: <!ELEMENT tuplo-produto (produto, nome, categoria, marca, caracteristicas)* > <!ELEMENT produto(nome,categoria,marca,caracteristicas) <!ELEMENT nome (#PCDATA)> <!ELEMENT categoria (#PCDATA)> <!ELEMENT marca (preco, link)> <!--elemento complexo --> <!ELEMENT preco (#PCDATA)> <!ELEMENT link (#PCDATA)> <!ELEMENT caracteristicas (#PCDATA)> Na DTD se definem os tipos de elementos, atributos e entidades permitidas. Pode ser interna (no documento) ou externa (ficheiro) Os documentos XML que se ajustam a sua DTD são denominados válidos 19
XML - DTD Cada documento que esta conforme o seu DTD tem só 1 elemento raiz: tuplo-produto A raiz contem zero ou mais elementos produto DOCTYPE: indica uma DTD externa. Onde fica o ficheiro que contem as suas definições Qualquer documento que pretenda lidar com tuplo-produto vai indicar isto no inicio do documento como vimos No caso DTD interna, a DTD precede o elemento raiz Cada elemento que contem #PCDATA vai conter texto Cada tuplo-produto contem exactamente 1 atributo produto, nome, categoria, marca e caracteristicas Cada elemento marca tem 1 elemento preco e 1 elem. link 20
O DTD tem limitações: XML Todos os dados definidos são de tipo texto As restrições existem ao nivel dos elementos, mais ao nivel dos atributos para os quais praticamente não se podem definir Não existe maneira de definir algo semelhante a chaves primárias, assim como chaves compostas Não utilizam sintaxe XML, (eles próprios não são documentos XML). Portanto não podem ser processados pelo parser do XML Existe algum apoio a restrições de unicidade e referenciais (ver mais enfrente tipos de atributos ID e IDREF Os elementos devem aparecer numa dada sequência, mesmo que em termos relacionais isto não tenha significado especial 21
Transformação do XML em XSL Extensible Stylesheet Language (versão 1.1) Uma linguagem avanzada para criar folhas de estilo Recebe o input em XML e uma folha de estilo XSL e produz o output a apresentação do doc XML Transforma, ordena e filtra dados XML, formatando baseado nos seus valores indicando de que modo o documento XML deveria ser apresentado O processo tem duas fases: Tree transformation: Cria uma árvore e logo Transformation interpreta a árvore resultante para efeitos de sua apresentação. 22
Transformação do XML em XSL Extensible Stylesheet Language (versão 1.1) Recebe o input em XML e uma folha de estilo XSL e produz o output a apresentação do doc XML. Exemplo: Tínhamos o seguinte documento XML (http://www.w3.org/tr/xsl/) <?xml version="1.0" encoding="iso-8859-1"?> <livro> <titulo>o livro das Mentiras</titulo> <capitulo> <ctitulo>capitulo III: a mentira sempre se descobre </ctitulo> <seção> <stitulo>mentiras e boatos</stitulo></seção> </capitulo> </livro> 23
XML transformação XSL O cabeçalho do novo documento: <!-- Transforma o documento XML anterior nun documento XHTML --> <xsl:stylesheet version="1.0" xmlns="http://www.w3.org/1999/xhtml" xmlns:xsl="http://www.w3.org/1999/xsl/transform"> <xsl:strip-space elements="livro capitulo titulo"/> <xsl:output method="xml" indent="yes" encoding="iso-8859-1" doctype-public="-//w3c//dtd XHTML 1.1//EN" doctype-system="http://www.w3.org/tr/xhtml11/dtd/xhtml11.dtd"/> 24
XML transformação XSL <!-- Utiliza o título do livro como título do documento XHTML --> <xsl:template match="livro"> <html> <head> <title> <xsl:value-of select="titulo"/> </title> </head> <body> <xsl:apply-templates/> </body> </html> </xsl:template> <!-- Utiliza o titulo do livro também com nível H1 --> <xsl:template match="livro/titulo"> <h1> <xsl:apply-templates/> </h1> </xsl:template> 25
XML transformação XSL <!-- Os títulos dos capítulos aparecem como H2 > <xsl:template match="capitulo/titulo"> <h2> <xsl:apply-templates/> </h2> </xsl:template> <!-- Os títulos das secções aparecerão como H3 --> <xsl:template match="seccion/titulo"> <h3> <xsl:apply-templates/> </h3> </xsl:template> </xsl:stylesheet> Ver um excelente exemplo: http://www.w3schools.com/xml/tryxslt.asp? xmlfile=simple&xsltfile=simple 26
XML Xpath, XLink Exemplo de código Xpath: <!-- Toma todos os elementos titulo no interior do elemento capítulo e os elementos autor ao interior do elemento capitulo /doc/capitulo/titulo /doc/capitulo/autor Exemplo de código Xlink: <my:crossreference xlink:href="libro.xml" xlink:role="http://www.example.com/linkprops/listalibros" xlink:title="lista de libros"> Lista actual de libros </my:crossreference> 27
XML Xpointer, Xquery Exemplo de código Xpointer: (http://www.w3.org/tr/xptr/) documento.xml#xpointer( /libro/capitulo[@public])xpointer(/livro/capitulo[@num="1"]) Exemplo de código de Xquery: (http://www.w3.org/xml/query/) <!-- Livros escritos por Mia Counto após ano 2000 --> <biblioteca> { for $b in doc("http://livro.example.com/bib.xml")/bib/livro where $b/autor = "Mia Counto" and $b/@anio > 2000 return <livro ano="{ $b/@ano }"> { $b/titulo } </livro> } </biblioteca> 28
XML Schema: XSD Descreve a estrutura dum documento XML. Também conhecida como XML Schema Definition: XSD Recomendação w3c desde 2001 Define os elementos que podem aparecer num documento Define os atributos que podem aparecer no documento Define quais elementos são elementos filhos de outros Define a ordem dos elementos filhos Define se um elemento está vazio ou pode incluir texto Define tipos de dados para elementos e atributos Define valores fixos ou por defeito para elementos e atributos XSD é o sucessor do DTD Manual de referencia: http://www.w3schools.com/schema/schema_elements_ref.asp 29
XML Schema: XSD.<?xml version="1.0"?> <xs:schema xmlns:xs="http://www.w3.org/2001/xmlschema"> <xs:element name="memorando"> <xs:complextype> <xs:sequence> <xs:element name="para" type="xs:string"/> <xs:element name="de" type="xs:string"/> <xs:element name="titulo" type="xs:string"/> <xs: element name= data type= xs:date/ > <xs: element name= numero type= int/> <xs:element name="texto" type="xs:string"/> </xs:sequence> </xs:complextype> </xs:element> </xs:schema> 30
XML e HTML: páginas <html> <body> <script> if (window.xmlhttprequest) {// codigo para IE7+, Firefox, Chrome, Opera, Safari xmlhttp=new XMLHttpRequest(); } else {// código para IE6, IE5 xmlhttp=new ActiveXObject("Microsoft.XMLHTTP"); } xmlhttp.open("get","cd_catalog.xml",false); xmlhttp.send(); xmldoc=xmlhttp.responsexml; document.write("<table border='1'>"); var x=xmldoc.getelementsbytagname("cd"); for (i=0;i<x.length;i++) { document.write("<tr><td>"); Criarmos variavel para um objecto XMLHttpRequest(), conforme browser. Ler ficheiro cd_catalog.xml carregando na variável XMLHttpRequest utilizando o GET e carregamos num array x todo o ficheiro onde o tuplo é a marca <CD> Criamos uma tabela <table border..> E fazemos um ciclo para mostrar ( document.write ) um a um os tuplos utilizando as filas da tabela <tr> e células <td> Estão no formato XML document.write(x[i].getelementsbytagname("artist")[0].childnodes[0].nodevalue); document.write("</td><td>"); document.write(x[i].getelementsbytagname("title")[0].childnodes[0].nodevalue); document.write("</td></tr>"); } document.write("</table>"); </script> </body> </html> 31
XML e HTML: mostrar páginas O resultado da leitura do ficheiro dos CD e a sua formatação numa tabela HTML, da o resultado que pode ser visto aqui: http://www.w3schools.com/xml/tryit.asp?filename=tryxml_di splay_table 32
XML Fim do modulo Fim da cadeira HASTA LA VISTA BABY! 33