XML - Codificacin



Codificacin es el proceso de convertir caracteres unicode en su equivalente representacin binaria. Cuando el procesador XML lee un documento XML, codifica el documento segn el tipo de codificacin.Por lo tanto, tenemos que especificar el tipo de codificacin en la declaracin XML.

Tipos de codificacin

Hay principalmente dos tipos de codificacin:

  • UTF-8
  • UTF-16

UTF significa Formato de transformacin UCS y UCS significa Conjunto de caracteres universal. El nmero 8 o 16 se refiere al nmero de bits utilizados para representar un carcter. Se trata de los de 8 (un byte) o 16 (dos bytes).Para los documentos sin informacin de codificacin UTF-8, se establece de forma predeterminada.

Sintaxis

Tipo de codificacin se incluye en el prlogo del documento XML. La sintaxis de codificacin UTF-8 es la siguiente:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?>

Sintaxis de codificacin UTF-16

<?xml version="1.0" encoding="UTF-16" standalone="no" ?>

Ejemplo

Ejemplo siguiente muestra declaracin de codificacin:

<?xml version="1.0" encoding="UTF-8" standalone="no" ?> <contact-info> <name>Tanmay Patil</name> <company>TutorialsPoint</company> <phone>(011) 123-4567</phone> </contact-info>

En el ejemplo anterior encoding="UTF-8", especifica que 8 bits se utilizan para representar los caracteres. Para representar caracteres de 16 bits, UTF-16 codificacin se puede utilizar.

Los archivos XML codificados con UTF-8 tienden a ser de menor tamao que los codificados con formato UTF-16.

Advertisements