XML,(eXtensible Markup Language), es un metalenguaje extensible de etiquetas desarrollado por el World Wide Web Consortium (W3C). Permite definir la gramática de lenguajes específicos, por lo que XML no es realmente un lenguaje en particular, sino una manera de definir lenguajes aplicable a diversas utilidades y contextos. Algunos ejemplos de lenguajes definidos mediante el uso de XML son XHTML, SVG, MathML.
XML no solamente sería utilizable en Internet, sino que es perfwectamente válido para intercambiar información estructuradamente entre diferente aplicaciones y/o sistemas. Se puede usar en bases de datos, editores de texto, hojas de cálculo y casi cualquier cosa imaginable.
XML es una tecnología sencilla, pero existen muchas otras a su alrededor que la complementan y la hacen mucho más grande y con unas posibilidades mucho mayores. Tiene un papel muy importante en la actualidad ya que permite la compatibilidad entre sistemas para compartir la información de una manera segura, fiable y fácil.
La tecnología XML busca dar solución al problema de expresar información estructurada de la manera más abstracta y reutilizable posible. Que la información sea estructurada quiere decir que se compone de partes bien definidas, y que esas partes se componen a su vez de otras partes. Entonces se tiene un árbol de pedazos de información. Ejemplos son un tema musical, que se compone de compases, que están formados a su vez con notas. Estas partes se llaman elementos, y se las señala mediante etiquetas.
Una etiqueta consiste en una marca hecha en el documento, que señala una porción de este como un elemento, un pedazo de información con un sentido claro y definido. Las etiquetas tienen la forma <nombre>, donde nombre es el nombre del elemento que se está señalando.
A continuación se muestra un ejemplo para entender la estructura de un documento XML:
<?xml version=”1.0”?>
<!DOCTYPE MENSAJE SYSTEM “mensaje.dtd”>
<mensaje>
<remitente>
<nombre>Alfredo Reino</nombre>
<mail>alf@ibium.com</mail>
</remitente>
<destinatario>
<nombre>Bill Clinton</nombre>
<mail>president@WhiteHouse.gov</mail>
</destinatario>
<asunto>Hola Bill</asunto>
<texto>
<parrafo>¿Hola que tal? Hace <enfasis>mucho</enfasis> que
no escribes. A ver si llamas y quedamos para tomar algo. </parrafo>
</texto>
</mensaje>
Se llama documentos "bien formados" (del inglés well formed) a los documentos que cumplen con todas las definiciones básicas de formato y pueden, por lo tanto, ser analizados correctamente por cualquier "parser" (Analizador Sintáctico) que cumpla con la norma. Se separa esto del concepto de validez que se explica más adelante.