XML

XML

Extensible Markup Language

 

eXtensible Markup Language (XML) es un lenguaje de etiquetas desarrollado por World Wide Web Consortium (W3C) normalizado por la ISO para la representación de datos jerárquicamente estructurados en forma de datos de texto. XML se emplea, entre otras cosas, para el intercambio de datos entre sistemas informáticos multiaplicación, especialmente a través de Internet.

W3C define XML como un metalenguaje sobre cuya base se definen lenguajes específicos de las aplicaciones por medio de restricciones estructurales y de contenido. Entre ellos se encuentran, entre otros, XSL-FO (sobre todo para impresión/archivado), XHTML (aplicaciones basadas en web) y SVG.

En XML todos los elementos se estructuran de forma estricta, de forma comparable a la estructura de árbol de menú, ya conocida del mundo Windows. Los diferentes niveles de la estructura (paréntesis) se definen siempre con una marca de inicio (Start-tag) y una marca de final (End-tag). XML es muy adecuado para la representación estructurada de datos, aunque carece de los datos necesarios para el formato de los documentos. Estos pueden crearse con información de formato adicional. Ya sea con CSS (Cascading Style Sheets), un lenguaje de estilo con el que se define el aspecto de los documentos HTML; o con XSL-FO (eXtensible Stylesheet Language Formatted Objects), que describe cómo se disponen el texto, las imágenes, las líneas y otros elementos gráficos en una página, sobre todo de documentos que se van a imprimir o archivar.

Exteriormente, XML es similar al protocolo HTML (Hypertext Markup Language), de uso común en Internet. La diferencia más importante reside en que los símbolos ("Tags") usados en XML se pueden elegir libremente con menos restricciones, mientras que en HTML estos están definidos de forma fija. Por esta razón, se pueden crear formas especiales de XML casi para cualquier aplicación. Y por ello, XML resulta muy versátil.

Otra ventaja: XML es fácil de generar y procesar, y ampliable a voluntad.

 

Distribución XML

A la vista de todas estas ventajas, XML sustituye cada vez más al lenguaje SGML (Standard Generalized Markup Language) como estándar ISO para la representación de documentos. XML se encuentra en muchos ámbitos de la vida, entre otros,

  • en los feed de RSS
  • al entrar en una cuenta de correo electrónico (vía SAML)
  • en las páginas web basadas en XHTML
  • en las presentaciones de PowerPoint
  • en la facturación de los servicios
  • en los archivos de configuración

Sectores en los que XML está más extendido

  • servicios sanitarios y sociales
  • administraciones públicas
  • proveedores de servicios financieros
  • ICT
  • suministro de energía

 

Ejemplos de aplicación

Ejemplo 1: documentación técnica

  • Los contenidos se crean, por ejemplo, en DocBook (XML).
  • Publicación multicanal por medio de un flujo de trabajo XML con XSLT

Ejemplo 2: facturación electrónica de servicios sanitarios (Suiza)

  • XML para la comunicación electrónica entre el proveedor del servicio y la entidad que se hace cargo del pago
    evita la interrupción de medio y acelera los procesos
  • el paciente recibe un PDF o un documento en papel que produce un proveedor de servicios externo.

 

Tecnología

Con la gama de productos DocBridge, incluido el Mixed Format Filter (MFF), Compart ofrece la posibilidad de convertir XSL-FO, XHTML, OOXML y SVG a todos los formatos convencionales como AFP, PostScript, PDF, IPDS etc.. Los documentos XSL-FO se procesan con SAX (API simple para XML). El archivo se lee línea por línea. En cuanto está lista, la página se transfiere al filtro de salida correspondiente.

 

Antecedentes

Los filtros MFF (Mixed Format Filter) de Compart constituyen la base de la arquitectura MFF de los productos DocBridge. Hay filtros MFF que leen archivos en diferentes formatos (filtros de entrada), y hay otros que a su vez sirven para escribir archivos en el formato de salida correspondiente (filtros de salida). En muchos casos, un formato es compatible tanto para entrada como para salida.

La virtud principal de la arquitectura MFF de Compart reside en que puede convertir a otro formato archivos que se encuentran en formatos diferentes de forma rápida, robusta y efectiva, o también en poder fusionarlos en un solo documento de un formato determinado. De este modo se puede, por ejemplo, convertir documentos AFP, SAPGOF o PCL a documentos PDF, y también fusionarlos en un único documento PDF.

Para la conversión de un formato en otro, Compart utiliza un formato intermedio, que denominamos Presentation Area (PA), y que puede presentar los archivos visualmente así como sus metadatos. Un filtro de entrada MFF convierte el archivo de entrada al formato PA en la memoria principal, y un filtro de salida MFF convierte a su vez el formato PA guardado en la memoria principal en un archivo de salida.

 

XML conversiones posibles

Ejemplos:
XML en AFP
XML en IPDS
XML en PCL
XML en PDF
XML en PostScript

Todas las direcciones de conversión XML - ver la Compart Matriz (PDF)

Compart Matriz

Se admiten todos los Formatos de entrada y salida soportados. Encontrará una lista detallada en la Compart Matriz (PDF).

Compart Matriz (PDF)