Aunque a primera vista, un documento XML puede parecer similar a HTML, hay una diferencia principal. Un documento XML contiene datos que se autodefinen, exclusivamente.

Los documentos XML deben seguir una estructura estrictamente jerárquica con lo que respecta a las etiquetas que delimitan sus elementos. Una etiqueta debe estar correctamente "incluida" en otra. Además, los elementos con contenido, deben estar correctamente "cerrados". La siguiente imagen muestra la estructura de un documento en XML

Todo documento en XML posee una estructura lógica y una física. Físicamente el documento está compuesto de unidades llamadas entidades. Una entidad puede hacer referencia a otras entidades para que estas sean incluidas en un documento, un documento en XML empieza en la raíz. Como se mira en el siguiente ejemplo:

Como se ha mencionado anteriormente un documento XML posee una estructura jerárquica, del ejemplo anterior este sería el diagrama Jerárquico:

Si bien el XML es una meta-lenguaje parecido al HTML son lo mismo, ya que el XML permite definir estructuras más simples y legibles, es por esta razón que se ha convertido en uno de los favorito entre los programadores que lo usan para sus conexiones a bases de datos, sitios web entre otros.
http://www.tesis.ufm.edu.gt/pdf/2995.pdf